五年之癢
2016年,能記入個(gè)人年終總結(jié)的事情沒(méi)幾件,其中一個(gè)便是開(kāi)源了Hawk。我花不少時(shí)間優(yōu)化和推廣它,得到的評(píng)價(jià)還算比較正面,因?yàn)樨?fù)面評(píng)價(jià)也沒(méi)什么渠道進(jìn)我耳朵。
不過(guò)你知道我寫(xiě)這個(gè)東西花了多久嗎? 掐頭去尾,這是第五個(gè)年頭了。
讀研究生伊始,實(shí)驗(yàn)室開(kāi)始做數(shù)據(jù)挖掘,但我發(fā)現(xiàn)大家做研究,都是一段段的代碼,遇到新問(wèn)題,就不得不再拷貝一份修改,很少想過(guò)復(fù)用。于是我便花了一年的時(shí)間,開(kāi)發(fā)了一款現(xiàn)在看起來(lái)配色喪心病狂的“數(shù)據(jù)挖掘軟件”:
它居然能在上面刷微博,能把任何一個(gè)學(xué)姐學(xué)妹在微博的蛛絲馬跡全扒出來(lái),渲染出配色更喪病的絢麗圖表(這里有更詳細(xì)的細(xì)節(jié))。實(shí)驗(yàn)室老師最喜歡拿這套軟件給參觀的領(lǐng)導(dǎo)演示了。
我多少有點(diǎn)偏執(zhí),想用純圖形化的方式構(gòu)建數(shù)據(jù)挖掘的全部流程:從獲取清洗數(shù)據(jù),建模,訓(xùn)練到最后可視化。但以我當(dāng)時(shí)的算法和軟件水平,這樣的東西根本就不可能做完善,我還意淫著能把它商業(yè)化。最終結(jié)果,是它跟著我一起畢業(yè),除了我和幾個(gè)學(xué)弟之外,沒(méi)人用過(guò)。