谷歌與DeepMind:史上最強(qiáng)AI拉鋸戰(zhàn)
先搞定智能,其它問(wèn)題就能迎刃而解
本文引用地址:http://www.butianyuan.cn/article/201903/398607.htm1997年5月,IBM超級(jí)計(jì)算機(jī)Deep Blue擊敗了國(guó)際象棋世界冠軍Garry Kasparov。這是計(jì)算機(jī)首次擊敗一位大師級(jí)棋手。這場(chǎng)比賽受到廣泛關(guān)注,也引起了人們對(duì)計(jì)算機(jī)不斷增長(zhǎng)的力量和潛在威脅的擔(dān)憂。當(dāng)時(shí)Hassabis產(chǎn)生了一個(gè)想法,他要把戰(zhàn)略游戲和AI結(jié)合起來(lái),有一天,他會(huì)建立一個(gè)計(jì)算機(jī)程序,打敗最高段位的人類圍棋手。
Hassabis有條不紊地規(guī)劃職業(yè)生涯。1998年,他創(chuàng)辦了自己的游戲工作室Elixir,專注開發(fā)一款復(fù)雜的模擬政治游戲Republic: The Revolution。還在學(xué)校時(shí),Hassabis就有這樣的想法:通過(guò)超級(jí)計(jì)算機(jī)來(lái)模擬復(fù)雜的世界動(dòng)態(tài),以解決最棘手的社會(huì)問(wèn)題。當(dāng)時(shí),他試著在游戲中實(shí)踐自己的想法。不過(guò)現(xiàn)實(shí)很骨感,Elixir最終發(fā)布了精簡(jiǎn)版的游戲但是反響平平。其它游戲也沒(méi)有成功。2005年4月,Hassabis關(guān)閉了Elixir。有人認(rèn)為Hassabis創(chuàng)立Elixir只是為了獲得管理經(jīng)驗(yàn)。現(xiàn)在,在正式踏上AGI之路以前,他只缺少一個(gè)關(guān)鍵的知識(shí)領(lǐng)域——了解人類的大腦。
2005年,Hassabis在倫敦大學(xué)學(xué)院開始攻讀神經(jīng)科學(xué)博士學(xué)位。他發(fā)表的關(guān)于記憶和想象力的研究很有影響力。一篇被引用上千次的論文顯示,患有健忘癥的人也很難想象新的體驗(yàn),這表明記憶和創(chuàng)造大腦圖像之間存在聯(lián)系。Hassabis所作的研究都是朝著AGI邁進(jìn)。他大部分研究都回歸一個(gè)問(wèn)題:人腦是如何獲得并保留概念和知識(shí)的?
2010年11月15日,Hassabis正式成立DeepMind。從那時(shí)起,公司的宗旨就一直沒(méi)有變過(guò):先搞定智能,其它問(wèn)題就能迎刃而解。也就是說(shuō),把大腦如何完成任務(wù)的理解轉(zhuǎn)化為計(jì)算機(jī)軟件,軟件可以使用相同的方法進(jìn)行自我學(xué)習(xí)。
Hassabis并沒(méi)有假裝科學(xué)已經(jīng)完全理解了人類的思想。AGI的藍(lán)圖不能簡(jiǎn)單地從數(shù)百項(xiàng)神經(jīng)科學(xué)研究中得出。我們對(duì)大腦的功能仍然知之甚少。2018年,Hassabis自己的博士研究結(jié)果甚至受到了澳大利亞研究團(tuán)隊(duì)的質(zhì)疑。所以DeepMind的起步工作還是很艱難。
Suleyman和Shane Legg加入了公司聯(lián)合創(chuàng)始人的行列。公司位于倫敦,許多新員工來(lái)自歐洲,有效避開了和谷歌、Facebook等硅谷巨頭爭(zhēng)奪人才。也許DeepMind成功秘訣之一就在于留住了最優(yōu)秀的員工。
公司花大力氣發(fā)展的一種機(jī)器學(xué)習(xí)技術(shù)——強(qiáng)化學(xué)習(xí),源于Hassabis所擅長(zhǎng)了兩個(gè)領(lǐng)域:游戲和神經(jīng)科學(xué)。建立這樣一個(gè)程序是為了收集有關(guān)其環(huán)境的信息,然后通過(guò)重復(fù)經(jīng)驗(yàn)來(lái)從中學(xué)習(xí),就像Hassabis所說(shuō)的“睡眠期間大腦活動(dòng)”一樣。
在此之前,強(qiáng)化學(xué)習(xí)在計(jì)算機(jī)領(lǐng)域還是一片空白。程序顯示了一個(gè)虛擬環(huán)境,除了游戲規(guī)則,它什么也不知道。程序包含至少一個(gè)稱為神經(jīng)網(wǎng)絡(luò)的組件。由計(jì)算結(jié)構(gòu)層組成,可篩選信息,目的是識(shí)別特定特征或策略。每一層都在不同的抽象層次上檢查環(huán)境。起初,這些網(wǎng)絡(luò)的成功率很低。當(dāng)他們嘗試不同的策略時(shí),變得越來(lái)越老練,當(dāng)成功時(shí),也會(huì)得到獎(jiǎng)勵(lì)。程序不會(huì)再次范同樣的錯(cuò)誤。AI神奇的地方就在于它重復(fù)任務(wù)的速度。
DeepMind的AI項(xiàng)目在2016年獲得重大勝利,當(dāng)年,AlphaGo在首爾舉行的五局三勝比賽中擊敗圍棋世界冠軍,震驚世人。2.8億人見證了AlphaGo的勝利,有專家曾預(yù)測(cè)人機(jī)對(duì)戰(zhàn)機(jī)器取勝還需要十年時(shí)間。次年,升級(jí)版AlphaGo擊敗了中國(guó)圍棋冠軍。
人類智慧將被人工智能超越嗎?
就像1997年的Deep Blue一樣,AlphaGo改變了人們對(duì)人類成就的看法。人類冠軍無(wú)疑擁有地球上最聰明的頭腦,可是他們已經(jīng)被AI超越。近20年后,Hassabis實(shí)現(xiàn)了自己當(dāng)年的野心,他說(shuō)這場(chǎng)比賽讓他熱淚盈眶。
當(dāng)年Deep Blue殺伐決斷,通過(guò)快速計(jì)算贏得了勝利,但是AlphaGo的風(fēng)格看起來(lái)卻很有藝術(shù)氣質(zhì),幾乎是人類的風(fēng)格。它的優(yōu)雅、復(fù)雜以及卓越的計(jì)算能力,似乎表明,在治療疾病和管理城市等領(lǐng)域,DeepMind將比競(jìng)爭(zhēng)對(duì)手走得更遠(yuǎn)。
評(píng)論