1.開篇

1.1 為什么我開始寫這個系列博客

說五年前我還在某A云公司的時候,身在一個機器學(xué)習(xí)算法組,對機器學(xué)習(xí)懷有濃厚的興趣?;撕枚嗟臅r間來試圖搞清楚各種流行的機器學(xué)習(xí)算法,經(jīng)常周末也跟同事探討公式的推倒和背后的意義。寫博客的主要動力是讓自己能夠更好的理解機器學(xué)習(xí)。

后來堅持了沒有太久的時間就換到大數(shù)據(jù)方向了,最主要的原因是覺得自己數(shù)學(xué)天賦太差,尤其是數(shù)學(xué)。當初學(xué)習(xí)的時候主要參考的PRML,Andrew Moore的PPT,Andrew Ng的公開課,plukids博客,另外加上淘寶斌強哥的各種悉心指導(dǎo)。但是學(xué)了好久,公式能大概看懂是怎么回事,不過自己徒手推出來實在是太艱難了。PRML的習(xí)題,甚至是具體數(shù)學(xué)的習(xí)題,都很難做得出來。

后面的發(fā)生的事情就理所當然了,既然很難在這個領(lǐng)域做到核心(我的理解是具有及其好的數(shù)學(xué)天賦作為后盾才能做到機器學(xué)習(xí)的核心),那么為什么不換一個更適合自己的方向呢?恩好吧,基礎(chǔ)數(shù)據(jù)架構(gòu)(Infra)看起來是個不錯的方向,不需要理解太多的數(shù)學(xué)(除了真的需要去實現(xiàn)Paxos)。做Infra如果有架構(gòu)設(shè)計的基礎(chǔ),另外加上勤奮,多多少少還是能做出一些東西的。

為什么我又要重新開始寫機器學(xué)習(xí)相關(guān)的文章了?最主要的原因是現(xiàn)在的機器學(xué)習(xí)和五年前、十年前區(qū)別很大。最大的不同是,自從深度學(xué)習(xí)成為了機器學(xué)習(xí)舞臺上最重要的一個角色起,機器學(xué)習(xí)變得更加真實了,利用深度學(xué)習(xí)可以做出很多很有意思的真實世界的應(yīng)用,而這些東西在幾年前的門檻要高得多。我在本文之后會更詳細的展開此點。

此外這幾年的工具發(fā)展神速,利用TensorFlow、MXNet或者其他類似的工具可以很容易的開始自己的pet project,也不用理解太多背后的細節(jié)。而在幾年前能用的現(xiàn)成工具寥寥無幾,而且十分的碎片化,比如說如果想要做分類器吧,需要用libsvm,需要搞跨語言調(diào)用。如果要換個算法的話,那可是要命的事情了。當然這些東西對于大公司來說都不是事兒,但是對于個人學(xué)習(xí)者來說需要投入的經(jīng)歷太多了,遠不是業(yè)余時間可以承擔(dān)的。

延伸閱讀

學(xué)習(xí)是年輕人改變自己的最好方式-Java培訓(xùn),做最負責(zé)任的教育,學(xué)習(xí)改變命運,軟件學(xué)習(xí),再就業(yè),大學(xué)生如何就業(yè),幫大學(xué)生找到好工作,lphotoshop培訓(xùn),電腦培訓(xùn),電腦維修培訓(xùn),移動軟件開發(fā)培訓(xùn),網(wǎng)站設(shè)計培訓(xùn),網(wǎng)站建設(shè)培訓(xùn)學(xué)習(xí)是年輕人改變自己的最好方式