條件分布頻率
《自然語言學習》很多地方都用到了條件分布頻率,nltk提供了兩種常用的接口:
FreqDist
和ConditionalFreqDist
。后面很多都會用到這兩種方法,特別是第二個。因為第二個更符合定義,會智能的找到條件。
然后根據(jù)繪圖的庫,可以做出來很漂亮的圖形。
簡單的FreqDist
函數(shù)接收list類型的參數(shù)后,會自動創(chuàng)建字典,生成對應的值為鍵值,而value就是元素的次數(shù)。
from nltk import *tem = ['hello','world','hello','dear']print(FreqDist(tem))
out: FreqDist({'dear': 1, 'hello': 2, 'world': 1})
通過
網(wǎng)友評論