如何開始接觸機(jī)器學(xué)習(xí)?方法統(tǒng)統(tǒng)分享給你
一說到機(jī)器學(xué)習(xí),我被問得最多的問題是:給那些開始學(xué)習(xí)機(jī)器學(xué)習(xí)的人的最好的建議是什么?
本文引用地址:http://butianyuan.cn/article/201805/379929.htm其實說句實話,我并不知道怎么回答這個問題。每一個學(xué)習(xí)者都是獨一無二的個體,有自己的學(xué)習(xí)需求和目的。我所能做的,就是分享一下當(dāng)初我開始學(xué)習(xí)機(jī)器學(xué)習(xí)的時候,對我很有用的方法。
我是如何開始接觸機(jī)器學(xué)習(xí)的
讓時間回到2017年,我看到了SethBling實現(xiàn)機(jī)器學(xué)習(xí)來玩游戲的一個小演示。
Sethbling-Marl/O-Machine Learing for Video Games
這個小機(jī)器人有了自主學(xué)習(xí)的能力,甚至可以一次又一次地玩馬里奧游戲,當(dāng)時我就震驚了。在那之后,我看到了別的使用神經(jīng)網(wǎng)絡(luò)的機(jī)器人,被用于各種不同的游戲——
Ding Nicolas-A genetic algorithm learns how to fight!
從 Caryhk 傳統(tǒng)的機(jī)器學(xué)習(xí)項目
carykh-Neural Networks and Unwanted Pregnancies in Evolv.io!
到星際機(jī)器學(xué)習(xí)項目——
Youtube Uploaded-AI SC2 FirstSteps
有些人還做了關(guān)于侃爺 Rap 的 LSTM 項目
Rabboie Barrat-Neural Network Generated Rap, V2
還有Dota2的Open AI
Dota 2 Dendi vs OpenAI(Bot)-1v1-T17
sentdex 制作的 GTA
sentdex-Stream, FPV, and more dada-Python plays GTA P.15
我知道我必須要去學(xué)機(jī)器學(xué)習(xí),這玩意兒簡直太酷了。
我安裝了TensorFlow,從syntax上下載了些代碼,但是完全不知道代碼里是怎么一回事,神經(jīng)網(wǎng)絡(luò)的確成功地使用大量的數(shù)據(jù)集,訓(xùn)練了模型,但我對代碼所做的每一次修改都會報錯,部分是因為 Python的語法我之前完全沒接觸過,更為重要的是,我完全不知道該怎么寫神經(jīng)網(wǎng)絡(luò)。
我先是快速Google了一下“怎樣寫一個神經(jīng)網(wǎng)絡(luò)?”,我發(fā)現(xiàn)了一個由完全聽不同的數(shù)學(xué)和符號組成的龐然大物,對我而言看上去就像是外星語,那時我感覺到了強(qiáng)烈的挫敗感,但我不達(dá)目的誓不罷休。就在那時我接觸到了Coursera上吳恩達(dá)的機(jī)器學(xué)習(xí)課程,我的天,那個課程同樣也是外星語,我能夠完成前幾章課程完全沒有問題,但那之后,吳恩達(dá)又開始講外星語了。
我是如何堅持下去的
同志們,如果像我這樣開始機(jī)器學(xué)習(xí)旅程,毫無疑問你會碰到一次巨大的詞匯沖擊。相信我,你大多數(shù)的困惑是因為無法理解提及的單詞所引起的。當(dāng)我意識到這個之后,我改變了我學(xué)習(xí)方法,轉(zhuǎn)而去學(xué)習(xí)這個龐大的外星語。在我學(xué)習(xí)的過程中,有很多術(shù)語和符號會反復(fù)出現(xiàn):向量,矩陣,激活函數(shù)傳播,機(jī)器學(xué)習(xí)等等。我在“向量”這個概念上花了一段時間,感謝 unity3D,每當(dāng)我覺得理解了機(jī)器學(xué)習(xí)中的一些概念,比如矩陣乘法,我都會回到我最喜歡的機(jī)器學(xué)習(xí)資源,去看看它們對于我來說,是不是變得容易理解了。我很驚訝突然之間,我能夠稍微更好地理解這門外星語了。
每當(dāng)有概念毫無頭緒讓我止步不前,我都會把他們單獨拿出來,舉個例子,當(dāng)我遇到sigmoid或者其他的激活函數(shù),我就會列出一堆困擾我的問題,然后一個個單獨查找。
說到這,我非常推薦可汗學(xué)院.com。這里有所有在你寫自己的機(jī)器學(xué)習(xí)算法所要用到的。我在這里列出了一些你需要去學(xué)習(xí)的很重要的數(shù)學(xué)課供你參考,對我個人而言,幫助很大。
我個人很喜歡的學(xué)習(xí)資源:
Activation Functions - https://en.wikipedia.org/wiki/Activation_function
Luis Serrano's Neural Network Series (REALLY GOOD) - https://www.youtube.com/watch?v=UNmqTiOnRfg
Giant_Neural_Network's Neural Network Series (REALLY GOOD) - https://www.youtube.com/watch?v=ZzWaow1Rvho
Macheads101's Neural Network series - https://www.youtube.com/watch?v=OypPjvm4kiA
3Blue1Brown's Neural Network Series - https://www.youtube.com/watch?v=aircAruvnKk
Hugo's Neural Network Series - http://www.mooc.ai/course/300
James Mccaffrey Talk (A BIT OUTDATED INFORMATION BUT STILL A FUN ONE)- https://www.youtube.com/watch?v=-zT1Zi_ukSk
一些很重要的數(shù)學(xué)課
Vectors (explained with Linear Algebra): https://www.khanacademy.org/math/linear-algebra/vectors-and-spaces
Vectors (explained with PreCal): https://www.khanacademy.org/math/precalculus/vectors-precalc
Matrices: https://www.khanacademy.org/math/precalculus/precalc-matrices
Sequences: https://www.khanacademy.org/math/precalculus/seq-induction
Derivative Rules: h https://www.khanacademy.org/math/ap-calculus-bc/bc-derivative-rules
一些可能會幫助到你的數(shù)學(xué)課
Algebra Functions: https://www.khanacademy.org/math/algebra/algebra-functions
Quadratics: https://www.khanacademy.org/math/algebra/quadratics
Irrational: https://www.khanacademy.org/math/algebra/rational-and-irrational-numbers
Analyzing Categorical Data: https://www.khanacademy.org/math/statistics-probability/analyzing-categorical-data
我的建議
(1)更好地理解偽代碼
我覺得學(xué)習(xí)如何寫機(jī)器學(xué)習(xí)算法最好的方法,就是去更好地理解偽代碼。我們要理解如何去計算它們,還有各種不同的能夠相互轉(zhuǎn)換的指數(shù)。在我的經(jīng)驗里,大多數(shù)情況下,偽代碼是十分清晰的。但如果不是的話,可能是因為在外星語中出現(xiàn)的太頻繁了。
學(xué)習(xí)怎樣將偽代碼轉(zhuǎn)換成你最喜歡的編程語言,其實是最重要的事。其實沒有一個一碼通吃的神經(jīng)網(wǎng)絡(luò),實際上當(dāng)你從不同的老師那里學(xué)習(xí)怎樣寫神經(jīng)網(wǎng)絡(luò)的時候,請一定要注意,他們不會總是使用同樣數(shù)量的輸入,隱藏層節(jié)點,激活函數(shù),可能連術(shù)語都不一樣,有些老師可能會把偏置說成另一個詞,這就是偽代碼如此重要的原因。
(2)前饋神經(jīng)網(wǎng)絡(luò)例子
除了之前所說的我能給你最好的建議,就是用一個簡單的前饋神經(jīng)網(wǎng)絡(luò)例子來開始你的學(xué)習(xí),這有一個很好的例子——做一個文字顏色預(yù)測器,當(dāng)你提供給它,紅,綠,藍(lán)值作為輸入的時候,嘗試去訓(xùn)練它作出,在此之上應(yīng)該使用深色字還是淺色字,讓它能夠可以被認(rèn)出來的預(yù)測。我覺得這是個很好的有很簡單的項目,值得認(rèn)真研究以此來學(xué)習(xí)機(jī)器學(xué)習(xí)的基礎(chǔ)。
(3)立刻開始著手
建議你從最開始就著手寫你的神經(jīng)網(wǎng)絡(luò),我指的是你學(xué)習(xí)的第一天,就在這個視頻結(jié)束的時候,立刻打開你的IDE。紙上得來終覺淺,絕知此事要躬行。盡管理論上知道,如何寫神經(jīng)網(wǎng)絡(luò)很酷,但實際去寫一個神經(jīng)網(wǎng)絡(luò)是完全不同的。
當(dāng)你開始去寫一個神經(jīng)網(wǎng)絡(luò)的時候,你會卡住,然后你就有了第一個需要去找的問題,嘗試去解決它,如此往復(fù),直到你成功。我特別希望,從最一開始我就知道這個建議,這可能會減少我大部分學(xué)習(xí)的時間。
(4)站在巨人的肩膀上
如果你真的想要能夠很好地寫出機(jī)器學(xué)習(xí)算法,你需要依靠他人的研究和代碼,因為事實上這其實還是一個剛起步的領(lǐng)域,每周都會有新的東西誕生。
最后一個我想給你們的重要建議是,其實你也可以不像我之前說的那樣做,形象點來說,機(jī)器學(xué)習(xí)就好像電腦一樣。如果你真的想要一臺電腦,你可以從頭組裝一臺,或者你也可以直接買一臺整機(jī),這兩件事最后的結(jié)果是一樣的。我個人想要去學(xué)習(xí)如何從頭構(gòu)建神經(jīng)網(wǎng)絡(luò)因為,我是個控制欲很強(qiáng)的瘋子。
有很多諸如,TensorFlow,PyTorch,Theano,Keras,和其他的機(jī)器學(xué)習(xí)框架,他們就好像是一臺裝好的電腦,你可以直接開始看教程,開始學(xué)習(xí)怎樣去使用它們,你不需要關(guān)心很多,諸如導(dǎo)數(shù),矩陣乘法,激活函數(shù)這些概念,這些機(jī)器學(xué)習(xí)框架已經(jīng)把大多數(shù)復(fù)雜的事情做好了,不過顯而易見的,以此為代價的就是,當(dāng)網(wǎng)絡(luò)內(nèi)部出現(xiàn)問題,或者運行不正確時,找出哪里出現(xiàn)問題,會是件很困難的事,這都取決于你想要什么。
不管怎么樣,請一定要記得滿足你的好奇心,在機(jī)器學(xué)習(xí)的道路上走得越來越遠(yuǎn)。
評論