一、前言

  針對(duì)大叔據(jù)實(shí)時(shí)處理的入門,除了使用WordCount示例之外,還需要相對(duì)更深入點(diǎn)的示例來(lái)理解Storm,因此,本篇博文利用Storm實(shí)現(xiàn)了頻繁項(xiàng)集挖掘的案例,以方便更好的入門Storm。

二、基礎(chǔ)知識(shí)

  2.1 頻繁二項(xiàng)集挖掘

  如顧客去超市購(gòu)物時(shí),牙膏和牙刷基本上都是擺放在一起,因?yàn)橘?gòu)買牙膏時(shí),很有可能會(huì)購(gòu)買牙刷。另外,“啤酒與尿布”的案例則是對(duì)訂單進(jìn)行分析挖掘后發(fā)現(xiàn)的規(guī)律,將啤酒和尿布一起擺放會(huì)促進(jìn)啤酒的銷量。

  2.2 算法設(shè)計(jì)

  本示例中不考慮太復(fù)雜的挖掘算法,只考慮將兩個(gè)商品組合后的挖掘,設(shè)計(jì)如下

    · 將每筆訂單的商品按照兩兩分組。

    · 將每個(gè)分組的頻度進(jìn)行統(tǒng)計(jì)(不考慮商品的次序)。

    · 根據(jù)頻度計(jì)算支持度(每個(gè)組合出現(xiàn)的頻率越高,更有可能是頻繁組合)和置信度(商品組合出現(xiàn)的置信程度)。

    · 設(shè)置支持度和置信度閾值,過(guò)濾不達(dá)標(biāo)的數(shù)據(jù)。

  2.3 Storm設(shè)計(jì)思路

    · 使用Redis作為存儲(chǔ)訂單數(shù)據(jù)的數(shù)據(jù)庫(kù)。

    · 使用Spout從Redis中讀取訂單數(shù)據(jù)。

    · 使用Bolt計(jì)算分組頻度。

    · 使用Bolt計(jì)算支持度和置信度。

    · 使用Bolt篩選結(jié)果并存儲(chǔ)到Redis中。

  2.4 拓?fù)浣Y(jié)構(gòu)圖

  根據(jù)程序思路設(shè)計(jì)如下所示的拓?fù)浣Y(jié)構(gòu),其組件在之后進(jìn)行介紹。

  大數(shù)據(jù)培訓(xùn),云培訓(xùn),數(shù)據(jù)挖掘培訓(xùn),云計(jì)算培訓(xùn),高端軟件開發(fā)培訓(xùn),項(xiàng)目經(jīng)理培訓(xùn)

三、設(shè)計(jì)實(shí)現(xiàn)

延伸閱讀

學(xué)習(xí)是年輕人改變自己的最好方式-Java培訓(xùn),做最負(fù)責(zé)任的教育,學(xué)習(xí)改變命運(yùn),軟件學(xué)習(xí),再就業(yè),大學(xué)生如何就業(yè),幫大學(xué)生找到好工作,lphotoshop培訓(xùn),電腦培訓(xùn),電腦維修培訓(xùn),移動(dòng)軟件開發(fā)培訓(xùn),網(wǎng)站設(shè)計(jì)培訓(xùn),網(wǎng)站建設(shè)培訓(xùn)學(xué)習(xí)是年輕人改變自己的最好方式