圍棋人機(jī)大戰(zhàn)一周年：被AlphaGo改變的世界

作者：時(shí)間：2017-03-14 來(lái)源：創(chuàng)事記

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢(xún)

編者按：四月，新的人機(jī)大戰(zhàn)又要啟幕了。好戲又要上演，而未來(lái)的人機(jī)大戰(zhàn)，勢(shì)必不止于圍棋。

　　去年今日，三連敗的李世乭扳回一局。

本文引用地址：http://www.butianyuan.cn/article/201703/345183.htm

　　然而這一針興奮劑很快失效，隨后李世乭再折一陣，最終以1:4輸給AlphaGo。在圍棋的人機(jī)大戰(zhàn)中，頂級(jí)人類(lèi)選手完敗給人工智能。

　　人工智能一戰(zhàn)成名，李世乭留下落寞側(cè)影。為AlphaGo落子的黃士杰一年后回憶說(shuō)：“當(dāng)時(shí)我代表AlphaGo下棋，必須保持冷靜”。

　　從那時(shí)起到現(xiàn)在，人類(lèi)始終生活在一個(gè)被AlphaGo改變的世界。

　　一年回望

　　站在圍棋人機(jī)大戰(zhàn)一周年的節(jié)點(diǎn)上，該如何回顧過(guò)去、展望未來(lái)呢?量子位先把幾個(gè)問(wèn)題拋給創(chuàng)新工場(chǎng)AI工程院副院長(zhǎng)王詠剛。

　　量子位：一年后再看AlphaGo有何改變?有什么記憶猶新的片段?

　　王詠剛：AlphaGo出世一年，其實(shí)進(jìn)入大家視野的是三個(gè)版本：5:0擊敗樊麾的內(nèi)測(cè)版本，4:1擊敗李世石的版本，以Master網(wǎng)名60:0快棋挑落中日韓高手的版本。三個(gè)版本演進(jìn)脈絡(luò)明顯，每次迭代都有重大升級(jí)。

　　最震撼的是計(jì)算機(jī)在人類(lèi)傳統(tǒng)認(rèn)為極其玄妙的、電腦無(wú)法掌握的“大局觀”上突飛猛進(jìn)，遠(yuǎn)遠(yuǎn)將人類(lèi)選手甩在身后。電腦計(jì)算“大局觀”的方式，和人類(lèi)培養(yǎng)“大局觀”的思路，有根本的差別。人類(lèi)沒(méi)可能在這方面趕上電腦。

　　和樊麾對(duì)局的棋譜基本上還看不出AlphaGo的大局觀有多強(qiáng)，和李世石對(duì)局就下出了聶衛(wèi)平贊不絕口的五路肩沖，到了Master的60局，大局觀體現(xiàn)在兩個(gè)地方：

　　1)從始至終對(duì)局勢(shì)的把握，比如第60局古力用AlphaGo的思路對(duì)付AlphaGo，把中央撐得很滿(mǎn)，但AlphaGo不緊不慢，總是恰到好處地保持勝勢(shì)。

　　2)已經(jīng)深刻影響人類(lèi)對(duì)布局的思考，大飛守角之類(lèi)的變化迅速被人類(lèi)棋手模仿，這和當(dāng)年深藍(lán)問(wèn)世后，國(guó)際象棋的布局革命是一樣的。

　　量子位：過(guò)去一年，有什么具體產(chǎn)品或研究，是基于AlphaGo的么?

　　王詠剛：AlphaGo用的是AI領(lǐng)域應(yīng)用非常普遍的算法：深度學(xué)習(xí)、蒙特卡洛算法、增強(qiáng)學(xué)習(xí)等。

　　從概念上可以說(shuō)，機(jī)器視覺(jué)相關(guān)的深度學(xué)習(xí)技術(shù)，包含環(huán)境-決策-反饋的智能系統(tǒng)，里面都有AlphaGo的影子。當(dāng)然，直接的代碼實(shí)現(xiàn)層面，肯定沒(méi)有復(fù)制、粘貼這樣直接借用的關(guān)系，因?yàn)锳lphaGo的深度學(xué)習(xí)模型畢竟是圍繞圍棋的特征建立的。

　　DeepMind去年發(fā)布的讀唇術(shù)LipNet，與英國(guó)國(guó)家醫(yī)療服務(wù)體系NHS合作推出的醫(yī)療輔助應(yīng)用Streams，與眼科醫(yī)院合作幫助眼部疾病診斷等等，可以說(shuō)都是與AlphaGo同源的技術(shù)。

　　量子位：AlphaGo是否已經(jīng)攻克圍棋?未來(lái)可提升的空間還有哪些?

　　王詠剛：“攻克圍棋”，如果說(shuō)戰(zhàn)勝人類(lèi)選手的話(huà)，AlphaGo已經(jīng)實(shí)現(xiàn)了，而且現(xiàn)在“絕藝”，DeepZen之類(lèi)的程序?qū)θ祟?lèi)勝率也很高了。

　　未來(lái)最多三年必將發(fā)生的是，手機(jī)上的本地APP就可以戰(zhàn)勝人類(lèi)職業(yè)高手，現(xiàn)在熱鬧的網(wǎng)上圍棋對(duì)弈平臺(tái)都會(huì)死掉(因?yàn)閷?duì)手可以輕易用手機(jī)作弊)，人類(lèi)圍棋將回歸現(xiàn)場(chǎng)競(jìng)賽，圍棋培訓(xùn)講師將更重視普及教育，因?yàn)橹懈呒?jí)的提高訓(xùn)練完全可以用機(jī)器代練。

　　不過(guò)，如果說(shuō)“攻克圍棋”是像計(jì)算機(jī)可以窮舉西洋跳棋的所有變化那樣，讓電腦成為圍棋“上帝”，這個(gè)應(yīng)該還不大可能?，F(xiàn)在AI大部分的招數(shù)，還在人類(lèi)高手可以理解的范疇內(nèi)。AI也有一些可疑的“弱點(diǎn)”，比如官子水平到底如何等等。

　　以后AI和AI之間的競(jìng)賽，應(yīng)該會(huì)不斷促進(jìn)AI提高(但這種沒(méi)有太多商業(yè)利益的事情，有沒(méi)有持續(xù)投入是個(gè)問(wèn)題)。人類(lèi)應(yīng)該望塵莫及，但可以不斷從AI中學(xué)習(xí)新的思想。

　　不止下棋

　　“AlphaGo給大家最大啟發(fā)，不是贏棋，而是如何構(gòu)建一個(gè)智商超過(guò)300的機(jī)器”，HTC負(fù)責(zé)研發(fā)及醫(yī)療的總裁、原Google中國(guó)工程院副院長(zhǎng)張智威說(shuō)。

　　構(gòu)建的方法有兩個(gè)：一是訓(xùn)練、二是數(shù)據(jù)。張智威最近在清華的一次分享(傳送門(mén))中說(shuō)，“如果能做好這件事，各位都是億萬(wàn)富翁。最近兩年，我們每天都在想，哪些領(lǐng)域可以拿到無(wú)限的數(shù)據(jù)”。

　　而在AAAI Fellow、IEEE Fellow、香港科技大學(xué)楊強(qiáng)教授看來(lái)，DeepMind在創(chuàng)造AlphaGo的過(guò)程中，引入一個(gè)新的概念：利用深度學(xué)習(xí)+強(qiáng)化學(xué)習(xí)，來(lái)判斷現(xiàn)狀和預(yù)測(cè)未來(lái)。這與未來(lái)的商業(yè)模式有著明確的關(guān)聯(lián)：

　　通過(guò)對(duì)大數(shù)據(jù)的分析，對(duì)現(xiàn)實(shí)的判斷和對(duì)商業(yè)未來(lái)走向進(jìn)行預(yù)估。

　　楊強(qiáng)還試圖基于AlphaGo歸納出一套人工智能的應(yīng)用流程：算法的目標(biāo)是什么?有沒(méi)有數(shù)據(jù)?數(shù)據(jù)在哪里?問(wèn)題的邊界是否清晰?什么叫合理的走法、什么叫犯規(guī)的走法?你的特征在哪里?又如何得到這些特征?是否可以得到一個(gè)持續(xù)的反饋?

　　但也有人沿著另一條路前進(jìn)。

　　圍棋也好、國(guó)際象棋也好、國(guó)際跳棋也好，所有這些都是完美信息博弈?，F(xiàn)實(shí)世界中，不完美信息才是常態(tài)，各種看不見(jiàn)的隱藏信息產(chǎn)生了大量的不確定性，而德州撲克代表的就是這種類(lèi)型的博弈。

　　今年初，在德州撲克的人機(jī)大戰(zhàn)中，人工智能Libratus擊敗了四位頂級(jí)人類(lèi)玩家。創(chuàng)造了這個(gè)AI的卡內(nèi)基梅隆大學(xué)Sandholm教授說(shuō)，能夠處理不完美信息的AI，未來(lái)可以用于商業(yè)談判、網(wǎng)絡(luò)安全、醫(yī)療方案制定等領(lǐng)域。

　　人工智能發(fā)展的終極目標(biāo)，是通用人工智能(AGI)。通用人工智能可以解決任何一個(gè)問(wèn)題。想要實(shí)現(xiàn)AGI就得讓人工智能學(xué)會(huì)解決不確定性問(wèn)題，這也是德州撲克人機(jī)大戰(zhàn)的重大意義之一。

　　對(duì)于已屆不惑的Demis Hassabis來(lái)說(shuō)，創(chuàng)立DeepMind的目標(biāo)絕不僅限于創(chuàng)造AlphaGo。過(guò)去的一年里，DeepMind還搞出了很多有意思的創(chuàng)新。

　　比方說(shuō)可以模擬任意一種人類(lèi)聲音的WaveNet;以及與英國(guó)國(guó)家醫(yī)療服務(wù)體系合作，使用人工智能來(lái)改善醫(yī)療行業(yè)等。

　　繼續(xù)戰(zhàn)斗

　　過(guò)去的一年里，僅僅在圍棋界，出彩的人工智能就不止AlphaGo一家。比方說(shuō)量子位此前報(bào)道過(guò)的首個(gè)圍棋十段：騰訊絕藝(傳送門(mén))，就是一個(gè)AI。

　　而對(duì)于AlphaGo來(lái)說(shuō)，挑戰(zhàn)也還沒(méi)結(jié)束。

　　現(xiàn)在的圍棋江湖里，中日韓三強(qiáng)中，無(wú)疑中國(guó)軍團(tuán)占據(jù)了絕對(duì)的優(yōu)勢(shì)。剛剛結(jié)束的第18屆農(nóng)心杯三國(guó)圍棋擂臺(tái)賽上，中國(guó)隊(duì)僅上場(chǎng)兩位選手，就將日韓兩隊(duì)悉數(shù)全滅。連笑、柁嘉熹、柯潔等重量級(jí)棋手尚未登場(chǎng)，就已經(jīng)拿下冠軍。

　　不在正式場(chǎng)合對(duì)陣世界排名第一的柯潔，對(duì)于AlphaGo來(lái)說(shuō)始終不夠完美。去年AlphaGo挑戰(zhàn)李世乭前，各方還就誰(shuí)贏誰(shuí)輸打賭。

　　當(dāng)時(shí)《連線(xiàn)》記者在報(bào)道中描述道：

　　一位名叫周峰的中國(guó)記者在觀戰(zhàn)室攔下了我，開(kāi)心地和我這種將AlphaGo視為科技奇跡而非圍棋殺手的人進(jìn)行對(duì)話(huà)。

　　但是當(dāng)我詢(xún)問(wèn)看見(jiàn)李世石輸了比賽他作何感想時(shí)，他指著心口說(shuō)：“我很難過(guò)?！?/p>

　　量子位很想問(wèn)問(wèn)，如果柯潔這次也輸給AlphaGo，周峰還會(huì)特別難過(guò)么?

　　這一次，在人工智能和人類(lèi)頂級(jí)高手之間，你覺(jué)得誰(shuí)會(huì)贏呢?

　　“我們不關(guān)心輸贏。輸贏其實(shí)不用看的，AI想贏它就肯定能贏”，云從CEO周曦說(shuō)，“關(guān)鍵問(wèn)題是AlphaGo會(huì)不會(huì)有些新的想法”。

新聞中心

圍棋人機(jī)大戰(zhàn)一周年：被AlphaGo改變的世界

評(píng)論

相關(guān)推薦

技術(shù)專(zhuān)區(qū)