五年之癢
2016年,能記入個(gè)人年終總結(jié)的事情沒幾件,其中一個(gè)便是開源了Hawk。我花不少時(shí)間優(yōu)化和推廣它,得到的評(píng)價(jià)還算比較正面,因?yàn)樨?fù)面評(píng)價(jià)也沒什么渠道進(jìn)我耳朵。
不過你知道我寫這個(gè)東西花了多久嗎? 掐頭去尾,這是第五個(gè)年頭了。
讀研究生伊始,實(shí)驗(yàn)室開始做數(shù)據(jù)挖掘,但我發(fā)現(xiàn)大家做研究,都是一段段的代碼,遇到新問題,就不得不再拷貝一份修改,很少想過復(fù)用。于是我便花了一年的時(shí)間,開發(fā)了一款現(xiàn)在看起來配色喪心病狂的“數(shù)據(jù)挖掘軟件”:
它居然能在上面刷微博,能把任何一個(gè)學(xué)姐學(xué)妹在微博的蛛絲馬跡全扒出來,渲染出配色更喪病的絢麗圖表(這里有更詳細(xì)的細(xì)節(jié))。實(shí)驗(yàn)室老師最喜歡拿這套軟件給參觀的領(lǐng)導(dǎo)演示了。
我多少有點(diǎn)偏執(zhí),想用純圖形化的方式構(gòu)建數(shù)據(jù)挖掘的全部流程:從獲取清洗數(shù)據(jù),建模,訓(xùn)練到最后可視化。但以我當(dāng)時(shí)的算法和軟件水平,這樣的東西根本就不可能做完善,我還意淫著能把它商業(yè)化。最終結(jié)果,是它跟著我一起畢業(yè),除了我和幾個(gè)學(xué)弟之外,沒人用過。