條件分布頻率

《自然語言學(xué)習(xí)》很多地方都用到了條件分布頻率,nltk提供了兩種常用的接口:FreqDist 和 ConditionalFreqDist 。后面很多都會(huì)用到這兩種方法,特別是第二個(gè)。因?yàn)榈诙€(gè)更符合定義,會(huì)智能的找到條件。
然后根據(jù)繪圖的庫,可以做出來很漂亮的圖形。

簡(jiǎn)單的FreqDist

函數(shù)接收list類型的參數(shù)后,會(huì)自動(dòng)創(chuàng)建字典,生成對(duì)應(yīng)的值為鍵值,而value就是元素的次數(shù)。

from nltk import *tem = ['hello','world','hello','dear']print(FreqDist(tem))
out:
FreqDist({'dear': 1, 'hello': 2, 'world': 1})

通過 

延伸閱讀

學(xué)習(xí)是年輕人改變自己的最好方式-Java培訓(xùn),做最負(fù)責(zé)任的教育,學(xué)習(xí)改變命運(yùn),軟件學(xué)習(xí),再就業(yè),大學(xué)生如何就業(yè),幫大學(xué)生找到好工作,lphotoshop培訓(xùn),電腦培訓(xùn),電腦維修培訓(xùn),移動(dòng)軟件開發(fā)培訓(xùn),網(wǎng)站設(shè)計(jì)培訓(xùn),網(wǎng)站建設(shè)培訓(xùn)學(xué)習(xí)是年輕人改變自己的最好方式