【開源中文分詞工具探析】系列:

  1. 中文分詞工具探析(一):ICTCLAS (NLPIR)

  2. 中文分詞工具探析(二):Jieba

  3. 中文分詞工具探析(三):Ansj

  4. 開源中文分詞工具探析(四):THULAC

  5. 開源中文分詞工具探析(五):FNLP


1. 前言

Jieba是由fxsjy大神開源的一款中文分詞工具,一款屬于工業(yè)界的分詞工具——模型易用簡單、代碼清晰可讀,推薦有志學(xué)習(xí)NLP或Python的讀一下源碼。與采用分詞模型Bigram + HMM 的ICTCLAS 相類似,Jieba采用的是Unigram + HMM。

延伸閱讀

學(xué)習(xí)是年輕人改變自己的最好方式-Java培訓(xùn),做最負(fù)責(zé)任的教育,學(xué)習(xí)改變命運(yùn),軟件學(xué)習(xí),再就業(yè),大學(xué)生如何就業(yè),幫大學(xué)生找到好工作,lphotoshop培訓(xùn),電腦培訓(xùn),電腦維修培訓(xùn),移動軟件開發(fā)培訓(xùn),網(wǎng)站設(shè)計培訓(xùn),網(wǎng)站建設(shè)培訓(xùn)學(xué)習(xí)是年輕人改變自己的最好方式