目前的人工智能缺失了一個關(guān)鍵環(huán)節(jié)
2012年,谷歌神秘機構(gòu)X實驗室里的一項令人驚奇的項目被世界所知曉。這些擁有三百萬個神經(jīng)元的模擬神經(jīng)網(wǎng)絡(luò)在沒有人工幫助的情況下,只依靠從YouTube里獲得的圖片就識別出了圖片中的貓和人物。
本文引用地址:http://butianyuan.cn/article/201602/287266.htm項目的成員組建了一個新的研究小組,這就是公司搜索部門下面的“谷歌大腦”( Google Brain)。他們和其他的研究者一起很快向世界證明了一個擁有幾十年歷史的發(fā)明——人工神經(jīng)網(wǎng)絡(luò)將圖像識別和語音識別的精確度提升到了一個前所未有的新高度。深度學(xué)習(xí)的成功促使谷歌和其他公司開始大舉投資人工智能,甚至使一些專家開始宣稱“我們應(yīng)該為出現(xiàn)比人類更加聰明的軟件做好準(zhǔn)備。”
然而,谷歌這個“貓檢測器”在某種程度上是一條死胡同。近期深度學(xué)習(xí)的成功是建立在那些需要人工幫助其學(xué)習(xí)的軟件之上的,這極大限制了人工智能的上升空間。
谷歌的實驗使用了一種非監(jiān)督式學(xué)習(xí)的方法,軟件被輸入未經(jīng)加工的原始數(shù)據(jù),然后必須在沒有人工幫助的情況下計算出結(jié)果。盡管它可以學(xué)會識別貓、人臉和其他物體,但它的精確度還沒有達到可以使用的水平。深度學(xué)習(xí)研究和基于此的產(chǎn)品開發(fā)的爆發(fā)都是基于監(jiān)督式學(xué)習(xí),數(shù)據(jù)需要人工打好標(biāo)簽之后再提供給軟件——例如,我們要給圖片中的各個物體都標(biāo)上名稱。
事實證明,這對于解決一些問題非常有效,比如說識別圖片中的物體、過濾垃圾郵件,甚至是為用戶回復(fù)短信提供建議(這是谷歌去年上線的一項功能)。但如果需要軟件更好地去理解世界,那可能就需要非監(jiān)督式學(xué)習(xí)了,Jeff Dean如是說,他現(xiàn)在領(lǐng)導(dǎo)著谷歌大腦項目,也曾經(jīng)在Google X 的“貓檢測器”項目中工作過。
“我非常確信我們需要它,”Dean 說,“當(dāng)你有正確的數(shù)據(jù)集時,監(jiān)督式學(xué)習(xí)會表現(xiàn)得很好,但終極的非監(jiān)督式學(xué)習(xí)會成為構(gòu)建真正的智能系統(tǒng)中重要的一環(huán)——如果你觀察人類的學(xué)習(xí)方式,你就會發(fā)現(xiàn)全部都是非監(jiān)督式的。”
一個絕好的例子就是,嬰兒的學(xué)習(xí)方式為成年時期的智能打下了基礎(chǔ)。比如說我們知道,當(dāng)一個物體移到視線之外時依然存在,或者沒有支撐就會掉到地上,這些事情是我們通過觀察世界而學(xué)習(xí)到的,并不需要明確的指引。和動物一樣,如果機器人想要探索真實世界,那它們就需要這種常識。這也能鞏固更加抽象的任務(wù),例如對語言的理解。
Facebook人工智能研究組主管Yann LeCun說,如果人工智能要滿足人們更大的野心,就必須弄清楚軟件如何才能完成那些對人類嬰兒來說十分容易的事情。他說:“我們都知道,最終的答案就是非監(jiān)督式學(xué)習(xí)。解決了非監(jiān)督式學(xué)習(xí)的問題,將把我們帶向更高的級別。”
盡管他們還沒有得到最終的答案,但Facebook、Google等公司以及學(xué)術(shù)界的研究者正在對某些有限的非監(jiān)督式學(xué)習(xí)進行實驗。
其中一個研究分支的目的是創(chuàng)造出一個人工神經(jīng)網(wǎng)絡(luò),讓它消化吸收視頻和圖像,并用它們獲得的關(guān)于世界的知識產(chǎn)生出新的圖像——這意味著它們已經(jīng)形成了關(guān)于世界是如何運行的內(nèi)部表征。對世界作出精準(zhǔn)的預(yù)測是人類智能中一個非常重要的基本特征。
Facebook的研究者建造了一個稱為 EyeScream的軟件。這個軟件可以根據(jù)提示(例如“教堂”或“飛機”)生成可識別的圖像。他們也在研究對視頻做出預(yù)測的軟件。Google旗下DeepMind的研究者已經(jīng)開發(fā)了一種軟件,給它一些部分遮掩的圖片,它能用十分真實的圖像來進行填補。
DeepMind還在研究一種完全的非監(jiān)督式學(xué)習(xí),叫做強化學(xué)習(xí)(reinforcement learning)。在強化學(xué)習(xí)中,軟件被訓(xùn)練來接收關(guān)于自我表現(xiàn)的自動反饋——比如說,這些反饋會來自電腦游戲的得分系統(tǒng)。還有一些不使用深度學(xué)習(xí)的研究者則證明,軟件可以從單個例子中學(xué)會識別手寫字體(見《人工智能終于能像人類一樣學(xué)習(xí)》)。
但是迄今為止,這些嘗試都尚未揭示出一條能讓非監(jiān)督式學(xué)習(xí)達到人類水平的路徑,或者說,軟件尚不能僅通過經(jīng)歷或?qū)嶒灳蛯W(xué)會與真實世界有關(guān)的復(fù)雜東西。百度硅谷AI實驗室主任Adam Coates說:“目前,我們似乎缺失了某個關(guān)鍵的思想。”
Coates說,隨著搜尋的繼續(xù),監(jiān)督式學(xué)習(xí)依然還能帶給我們很多東西:互聯(lián)網(wǎng)公司可以獲得大量數(shù)據(jù),包括人們做了什么事和關(guān)心什么事,可以用這些原料來建造比今天的產(chǎn)品更加有用的語音交互和個人助理等產(chǎn)品。他說:“在不遠的未來,你還可以用標(biāo)記數(shù)據(jù)來做很多事。”大公司在這方面花了許多金錢,讓合約商為他們的機器學(xué)習(xí)系統(tǒng)標(biāo)記數(shù)據(jù)。
Facebook的LeCun相信,研究者不會永遠依靠標(biāo)記數(shù)據(jù)。但是,他拒絕評價軟件還需要多久才能到達人類智能的水平。他說:“我們知道原材料,但卻不知道菜譜。這可能還需要花費一些時間。”
評論