從CFA到如今的Data Science/Deep Learning的學(xué)習(xí)已經(jīng)有一年的時間了。期間經(jīng)歷了自我的興趣、擅長事務(wù)的探索和試驗(yàn),有放棄了的項(xiàng)目,有新開辟的路線,有有始無終的遺憾,也有還在繼續(xù)的堅(jiān)持。期間有數(shù)不清的彎路、失落,有無法一一道明的挫敗和孤獨(dú),也有每日重復(fù)單調(diào)訓(xùn)練而積累起來的自信與欣喜。和朋友聊天讓我意識到,將我目前所摸索到的一些材料和路徑分享出來,使其他想要進(jìn)入這個領(lǐng)域的人或者僅僅是興趣愛好者能夠少走一些彎路,大概是有些意義的。

 

因?yàn)镚oogle Alpha Go的原因,Deep Learning成了一個火熱的話題。然而,Deep Learning也僅僅是Machine Learning的一個細(xì)小分支;而Machine Learning中的很多發(fā)展、結(jié)論以及背后的本質(zhì)思想,又是和statistics密不可分。過度關(guān)注Deep Learning而全然不顧Machine Learning的一些基本事實(shí)和其背后的一些statistics的動機(jī),會讓你僅僅是知其然,而無法達(dá)到知其所以然。更無法使你根據(jù)你所要解決的現(xiàn)實(shí)問題去調(diào)整、優(yōu)化你的模型。僅僅是知道Deep Learning的過程,那是非常容易的,不過是在一堆線性的傳播路徑中加入一些非線性項(xiàng),然后根據(jù)數(shù)據(jù)用gradient descent去更新參數(shù)罷了。然而,它們?yōu)槭裁纯梢云鹱饔??哪些?gòu)架更有效?對于不同的問題,哪些非線性函數(shù)又更加有效?這就不是僅僅知道個過程就可以回答的了。你必須深入背后所隱藏的理論,通過不斷地編寫程序去實(shí)驗(yàn)、檢驗(yàn),才能夠慢慢積累起一些直觀,進(jìn)而去探索、了解這些問題的答案。我不會允諾你任何的速成和捷徑,因?yàn)槟遣环先俗罨镜目陀^認(rèn)識規(guī)律。但是,如果你真的很愿意進(jìn)入這個領(lǐng)域,有著真正的熱情,那么持續(xù)不斷地每天至少3小時(考慮到8小時的工作時間無法撼動)的學(xué)習(xí),3個月的時間應(yīng)該能夠讓你建立起最起碼的自信。

 

對于任何一個課題、一個領(lǐng)域、一個國家,想要真正了解它,你就必須了解它的運(yùn)作方式和行事風(fēng)格。而要了解這些看不見的運(yùn)作方式和行事風(fēng)格,你就必須了解它的文化。而要了解它的文化,你就必須了解它的歷史。對于科學(xué)來說,其歷史不僅僅是指一段歷史的綜述性介紹。更重要的是,你要親自閱讀那些重要?dú)v史節(jié)點(diǎn)的paper,去尋找最原始的idea是如何產(chǎn)生的。直接學(xué)習(xí)最前沿的材料,也許可以讓你最快速地獲取知識,讓你能夠立刻動手做事。因?yàn)檫@些材料已經(jīng)經(jīng)過了無數(shù)人的簡化、優(yōu)化和重組,讓你可以用最快的速度進(jìn)行吸收。然而,這些材料的一個缺陷在于,這些重組織會將最原始的想法抹去,只留下最后的完美建筑。所有的材料都是精巧的,然而你卻找不到半點(diǎn)關(guān)于這個領(lǐng)域如何創(chuàng)建出來的線索(很多大師,諸如Gauss有著最強(qiáng)烈的這種癖好。更惡劣的代表是Laplace,不僅隱去行跡,還會加上一個注腳“容易得到”)。你完全不了解是什么啟發(fā)了當(dāng)初的創(chuàng)建者提出了這些思想,又是什么影響了期間的發(fā)展,使它變成現(xiàn)在這樣。你又應(yīng)該借鑒這背后的哪些想法和思想,去啟發(fā)你對別的領(lǐng)域做出一些突破。所有這些線索都埋藏在歷史的長河中。如果你無法耐住寂寞,腳踏實(shí)地去閱讀歷史節(jié)點(diǎn)的文獻(xiàn),去尋找背后的脈絡(luò),你對這個領(lǐng)域的認(rèn)識和思考,就必然無法深入。這些基本的功夫,是之后一切發(fā)展的前提。

 

網(wǎng)友評論