【開源中文分詞工具探析】系列:
1. 前言
Jieba是由fxsjy大神開源的一款中文分詞工具,一款屬于工業(yè)界的分詞工具——模型易用簡單、代碼清晰可讀,推薦有志學習NLP或Python的讀一下源碼。與采用分詞模型Bigram + HMM 的ICTCLAS 相類似,Jieba采用的是Unigram + HMM。
延伸閱讀
學習是年輕人改變自己的最好方式