一文帶你讀懂深度學習:AI 認識世界的方式如同小孩
如果你經?;〞r間和小孩子待在一起的話,你會不由得思考小孩子怎么能夠學習得如此之快。哲學家們,比如柏拉圖也曾經考慮過這個問題,但是從來沒有找到一個滿意的答案。我五歲的兒子,奧吉最近認識了植物,動物和鐘,當然也少不了恐龍和飛船。他還弄懂了如何理解他人的需要和感受。他可以用知識來定義他看到和聽到的東西,并且做出新的預測。比如他最近就說前不久在紐約市美國自然歷史博物館展示的新雷龍是食草動物,所以說并沒有那么可怕。
但其實奧吉體驗到的不過是一串光子到達了他的視網膜,他的耳膜接收到了空氣的振動而已。他藍眼睛背后的“神經電腦”從某種角度上來說通過他感知到的有限的信息做出了食草雷龍不是很可怕的預測。那么問題來了,是不是說電腦也可以做到這樣呢?
過去15年的時間里,計算機科學家和心理學家一直在嘗試找到一個答案。兒童從老師和家長那有限的輸入當中獲取了大量的知識。盡管如今機器智能風頭正盛,但是最厲害的電腦也不能像一個5歲兒童那樣進行學習。
搞清楚兒童的大腦究竟是如何運轉的,然后設計出一個電子版本能夠同樣有效地運轉,可能需要計算機科學家們幾十年的努力。但同時,他們已經在開發(fā)融合了人類學習模型的人工智能了。
追根溯源
在上世紀五六十年代的第一次熱潮爆發(fā)以后,接下來對AI的探索就沉寂了幾十年。不過在過去的幾年里,學界突然取得了重大進展,尤其是在機器學習領域。AI一時間變成了最熱門的技術。這些進展究竟是拯救人類還是毀滅人類,一時間也眾說紛紜。AI在也確實曾被用來預示永生或者世界末日,這兩種可能性文學作品里都已經寫過很多。
我覺得在AI領域取得了這些發(fā)展引起人們強烈感受的主要原因在于我們內心深處其實非常害怕類人類的出現的。不管是《科學怪人》里的魔偶還是2015年《機械姬》電影里的性感機器人,未來會出現一種“生物”會成為連接人類與人工之間鴻溝的橋梁,這種想法本身就讓人覺得恐慌。
但是計算機真的能像人類那樣學習嗎?那些席卷媒體的熱點新聞,有多少是真正具有革命意義的產品,而又有多少只是噱頭而已呢?電腦學習分辨貓,或者一個平片假名的過程很難被人理解。但是仔細觀察之后我們會發(fā)現,機器學習背后的基礎理論并沒有一開始看上去的那么難以捉摸。
但是計算機真的能像人類那樣學習嗎?那些席卷媒體的熱點新聞,有多少是真正具有革命意義的產品,而又有多少只是噱頭而已呢?電腦學習分辨貓,或者一個平片假名的過程很難被人理解。但是仔細觀察之后我們會發(fā)現,機器學習背后的基礎理論并沒有一開始看上去的那么難以捉摸。
一種解決辦法是我們接收到的光子和空氣振動,到了電腦上就會以數字圖像的像素和錄音的聲音片段呈現出來。然后試著從數據中提取一串圖案用來探測并識別周圍世界的物體。這種自底向上的研究方法在一些哲學家和心理學家的理論中也可以找到,比如約翰·密爾。
上世紀八十年代,科學家找到了一種令人信服的方式應用這種自底向上的方式讓計算機在數據中尋找有價值的圖案?!鄙窠浘W絡“系統(tǒng)通過神經元將視網膜上的光圖案再現了你周圍的環(huán)境。神經網絡也是一樣的圖案。通過互相連接的類似生物細胞的處理單元將某一層網絡上的像素轉換成抽象的表達——比如一個鼻子或一整張臉。
神經網絡的概念由于最近深度學習新技術的出現又重新振興了。深度學習這種技術是由谷歌,Facebook和其他互聯網巨頭進行商業(yè)落地的。計算機不斷增長的能力——比如由摩爾定律體現的計算能力的指數增長,也是這些系統(tǒng)獲得成功的一部分原因,大數據集地快速發(fā)展也是其中一部分原因。有了更高的處理速度和更多的數據之后,連接系統(tǒng)能夠更加高效地學習。
就像科學家一樣,自頂向上的系統(tǒng)形成了抽象廣泛的對于世界的假設。這個系統(tǒng)會預測在假設是正確的情況下,數據會呈現出什么樣子。同時這個系統(tǒng)也會不斷根據這些預測的結果來修改自身的假設。
尼日利亞、萬艾可和垃圾郵件
自底向上的方式可能是最容易被理解的,我們首先來解釋這個。想像一下你試圖讓計算機從你的收件箱中分辨出重要郵件。你可能注意到垃圾郵件都有某種讓人討厭的特征:收件人列表特別長,源地址來自尼日利亞或巴伐利亞,總是提到一百萬美元的獎金或提到偉哥。但是很可能非常有用的郵件看起來也是這樣。你不想錯過表示你升職或者得了學術獎項的郵件。
如果你對比大量垃圾郵件和正常郵件之后,你會發(fā)現只有垃圾郵件一般會具備以上的講故事方式——比如,來自尼日利亞的郵件,并承諾有一百萬美元的獎金出現了問題。事實上,也許存在更加明顯的區(qū)分垃圾郵件和正常郵件的方式——比如不太明顯的錯誤拼寫和IP地址。如果你能發(fā)現這些信息,你就可以準確地過濾掉垃圾郵件了,而且也不用擔心你的正常郵件被攔截。
自底向上的機器學習可以探索出解決這種問題的相關線索。為了達到這一目的,神經網絡必須回顧之前的學習過程。神經網絡從巨大的數據庫中對成百萬的樣例進行評估,每一個樣例標記為垃圾郵件或者正常郵件。然后計算機從一組識別特征中提取出能區(qū)分垃圾郵件的特征。
評論