前言

最近在看Peter Harrington寫的“機(jī)器學(xué)習(xí)實戰(zhàn)”,這是我的學(xué)習(xí)心得,這次是第12章 - 使用FP-growth算法來高效發(fā)現(xiàn)頻繁項集。

基本概念

  • FP-growth算法
    FP-growth算法的性能很好,只需要掃描兩次數(shù)據(jù)集,就能生成頻繁項集。但不能用于發(fā)現(xiàn)關(guān)聯(lián)規(guī)則。
    我想應(yīng)該可以使用Apriori算法發(fā)現(xiàn)關(guān)聯(lián)規(guī)則。
    FP代表頻繁模式(Frequent Pattern)。

  • 條件模式基(conditional pattern base)。
    條件模式基是以所查找元素項為結(jié)尾的路徑集合。每一條路徑其實都是一條前綴路徑(prefix path)。
    一條前綴路徑是介于所查找元素項與樹根節(jié)點之間的所有內(nèi)容。

FP-growth算法 - 用途

  • 快速生成頻繁項集

  • 在一批有共性的文章中找到經(jīng)常出現(xiàn)的匹配詞匯(共現(xiàn)詞),并進(jìn)一步發(fā)現(xiàn)關(guān)聯(lián)規(guī)則??梢杂糜谳斎胱詣友a(bǔ)全功能。

  • 發(fā)現(xiàn)數(shù)據(jù)中的共性。比如,可以找到,哪類用戶喜歡哪些文章。

核心算法解釋

FP-growth算法:生成頻繁項集

延伸閱讀

學(xué)習(xí)是年輕人改變自己的最好方式-Java培訓(xùn),做最負(fù)責(zé)任的教育,學(xué)習(xí)改變命運,軟件學(xué)習(xí),再就業(yè),大學(xué)生如何就業(yè),幫大學(xué)生找到好工作,lphotoshop培訓(xùn),電腦培訓(xùn),電腦維修培訓(xùn),移動軟件開發(fā)培訓(xùn),網(wǎng)站設(shè)計培訓(xùn),網(wǎng)站建設(shè)培訓(xùn)學(xué)習(xí)是年輕人改變自己的最好方式