<option id="nrnby"></option>

IT網(wǎng)絡(luò)文摘的軟件學(xué)習(xí)筆記

學(xué)習(xí)就是力量

分類(lèi)導(dǎo)航

機(jī)器學(xué)習(xí)實(shí)戰(zhàn) - 讀書(shū)筆記(12) - 使用FP-growth算法來(lái)高效發(fā)現(xiàn)頻繁項(xiàng)集

發(fā)布時(shí)間：2016年12月15日作者：文章轉(zhuǎn)自網(wǎng)絡(luò)，版權(quán)歸原作者所有，反饋可立刻刪除

前言

最近在看Peter Harrington寫(xiě)的“機(jī)器學(xué)習(xí)實(shí)戰(zhàn)”，這是我的學(xué)習(xí)心得，這次是第12章 - 使用FP-growth算法來(lái)高效發(fā)現(xiàn)頻繁項(xiàng)集。

基本概念

FP-growth算法
FP-growth算法的性能很好，只需要掃描兩次數(shù)據(jù)集，就能生成頻繁項(xiàng)集。但不能用于發(fā)現(xiàn)關(guān)聯(lián)規(guī)則。
我想應(yīng)該可以使用Apriori算法發(fā)現(xiàn)關(guān)聯(lián)規(guī)則。
FP代表頻繁模式（Frequent Pattern）。
條件模式基（conditional pattern base）。
條件模式基是以所查找元素項(xiàng)為結(jié)尾的路徑集合。每一條路徑其實(shí)都是一條前綴路徑（prefix path）。
一條前綴路徑是介于所查找元素項(xiàng)與樹(shù)根節(jié)點(diǎn)之間的所有內(nèi)容。

FP-growth算法 - 用途

快速生成頻繁項(xiàng)集
在一批有共性的文章中找到經(jīng)常出現(xiàn)的匹配詞匯（共現(xiàn)詞），并進(jìn)一步發(fā)現(xiàn)關(guān)聯(lián)規(guī)則?？梢杂糜谳斎胱詣?dòng)補(bǔ)全功能。
發(fā)現(xiàn)數(shù)據(jù)中的共性。比如，可以找到，哪類(lèi)用戶(hù)喜歡哪些文章。

核心算法解釋

FP-growth算法：生成頻繁項(xiàng)集

網(wǎng)友評(píng)論

更多精彩分享

學(xué)習(xí)是年輕人改變自己的最好方式-Java培訓(xùn)機(jī)構(gòu),青島Java培訓(xùn),青島計(jì)算機(jī)培訓(xùn),軟件編程培訓(xùn),seo優(yōu)化培訓(xùn),網(wǎng)絡(luò)推廣培訓(xùn),網(wǎng)絡(luò)營(yíng)銷(xiāo)培訓(xùn),SEM培訓(xùn),網(wǎng)絡(luò)優(yōu)化,在線營(yíng)銷(xiāo)培訓(xùn),Java培訓(xùn)

學(xué)習(xí)是年輕人改變自己的最好方式