新聞中心

EEPW首頁(yè) > 機(jī)器人 > 業(yè)界動(dòng)態(tài) > 柯潔與AlphaGo2.0五月對(duì)決 機(jī)器人究竟有多強(qiáng)大?

柯潔與AlphaGo2.0五月對(duì)決 機(jī)器人究竟有多強(qiáng)大?

作者: 時(shí)間:2017-04-11 來(lái)源:21世紀(jì)經(jīng)濟(jì)報(bào)道 收藏
編者按:盡管還未開(kāi)戰(zhàn),但外界對(duì)本次賽事的結(jié)果,已經(jīng)開(kāi)始有了預(yù)期,無(wú)論輸贏(yíng),這也恰好證明了圍棋奇妙無(wú)窮,提升的空間很大,無(wú)論棋手還是深度學(xué)習(xí)團(tuán)隊(duì),都將從中獲益匪淺。

  “采用的是蒙特卡羅樹(shù)搜索框架,加上深度學(xué)習(xí)和深度強(qiáng)化學(xué)習(xí)。在這樣一個(gè)框架下,深度學(xué)習(xí)尤其是深度強(qiáng)化學(xué)習(xí)在計(jì)算機(jī)圍棋上的天花板究竟有多高,還是個(gè)未知數(shù)。”中國(guó)人工智能學(xué)會(huì)副理事長(zhǎng)、清華大學(xué)計(jì)算機(jī)系教授馬少平指出。

本文引用地址:http://www.butianyuan.cn/article/201704/346464.htm

  就仿佛科幻小說(shuō)《三體》中,人類(lèi)艦隊(duì)首次迎戰(zhàn)三體艦隊(duì)“水滴”——去年3月,與李世石的圍棋對(duì)決,讓原本自信的人類(lèi),被不可預(yù)料的強(qiáng)大戰(zhàn)斗力打了個(gè)措手不及。而與《三體》中人類(lèi)艦隊(duì)幾乎全軍覆沒(méi)、殘存艦隊(duì)倉(cāng)皇逃走所不同的是,李世石版人機(jī)大戰(zhàn)還留下了一個(gè)懸念:人類(lèi)圍棋第一人柯潔,與戰(zhàn)果如何?

  如今,這個(gè)懸念將在今年5月于烏鎮(zhèn)揭曉。

  4月10日,中國(guó)圍棋協(xié)會(huì)、浙江省體育局及谷歌共同宣布,三方將于5月23日至27日聯(lián)合主辦“中國(guó)烏鎮(zhèn)·圍棋峰會(huì)”(以下簡(jiǎn)稱(chēng)“圍棋峰會(huì)”)。圍棋峰會(huì)首日,柯潔與AlphaGo升級(jí)版的比賽將正式開(kāi)打。該次比賽將采用中國(guó)規(guī)則的三番棋賽制,無(wú)論輸贏(yíng)均下滿(mǎn)3盤(pán),比賽每方3小時(shí),5次1分鐘讀秒。

  除此之外,主辦方表示,圍棋峰會(huì)期間還將舉辦配對(duì)賽和團(tuán)隊(duì)賽。在配對(duì)賽中,兩位棋手將分別與AlphaGo組隊(duì),以此挑戰(zhàn)棋手如何理解AlphaGo的獨(dú)特風(fēng)格并與之合作;在團(tuán)隊(duì)賽中,將由五位中國(guó)頂尖棋手合作,建立棋手“神經(jīng)網(wǎng)絡(luò)”與AlphaGo對(duì)決。

  “我在半年前得知了與AlphaGo對(duì)決的消息,這次能夠與AlphaGo對(duì)決,是我的榮幸?!痹?0日發(fā)布會(huì)現(xiàn)場(chǎng),柯潔如是坦言。而對(duì)于一個(gè)“只有勝利才是唯一真諦”的棋手而言,柯潔表示“這一次不會(huì)輕易妥協(xié)”,并稱(chēng)“抱有必勝的心態(tài)和必死的信念”。

  來(lái)自未來(lái)的對(duì)手

  本次發(fā)布會(huì)就如AlphaGo一般神秘。在發(fā)布會(huì)前夕,谷歌僅對(duì)外通知10日下午將有“重磅消息”,直到10日上午9點(diǎn)之前,發(fā)布會(huì)地點(diǎn)仍是一個(gè)謎團(tuán)。

  即便如此神秘,也難掩內(nèi)容本身的耀眼。早在數(shù)日之前,發(fā)布會(huì)的內(nèi)容便不脛而走:業(yè)內(nèi)傳聞AlphaGo將與柯潔有一戰(zhàn),戰(zhàn)期定檔在5月下旬的烏鎮(zhèn)。在10日發(fā)布會(huì)現(xiàn)場(chǎng),主辦方宣布這個(gè)巔峰對(duì)決的時(shí)間為5月23日。

  賽事如此吸引眼球,原因在于這次的交戰(zhàn)雙方。

  作為當(dāng)今棋壇第一人,柯潔更像是人類(lèi)獲勝的最后一絲希望。他曾在一年前李世石0:2落后于A(yíng)lphaGo之際放出豪言:AlphaGo要證明自己天下無(wú)敵,必須先過(guò)自己這一關(guān),并稱(chēng)自己有信心戰(zhàn)勝對(duì)手,“勝算大概在六七成”。

  如今,在圍棋峰會(huì)發(fā)布會(huì)現(xiàn)場(chǎng),柯潔則顯得更為謙虛,將AlphaGo描述為來(lái)自未來(lái)的對(duì)手?!艾F(xiàn)在的AlphaGo已經(jīng)超過(guò)我們最強(qiáng)棋手的想象,帶給我們最大的震撼與享受,”柯潔感慨道,“我是站在了歷史變革的節(jié)點(diǎn)之上,很幸運(yùn)能夠見(jiàn)證AlphaGo這樣強(qiáng)大的棋手?!?/p>

  作為人工智能代表,全新版本AlphaGo相較一年之前更加強(qiáng)大,這也成為本次賽事的另一大看點(diǎn)。據(jù)介紹,新版AlphaGo采用了新的機(jī)器學(xué)習(xí)技術(shù),能夠通過(guò)訓(xùn)練形成策略網(wǎng)絡(luò),將棋盤(pán)上的局勢(shì)作為輸入信息,并對(duì)所有可行的落子位置生成概率分布,然后訓(xùn)練出價(jià)值網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),以對(duì)手的絕對(duì)勝利到AlphaGo的絕對(duì)勝利為標(biāo)準(zhǔn),預(yù)測(cè)所有可行落子位置的結(jié)果。

  而AlphaGo的真正優(yōu)勢(shì)體現(xiàn)在,將策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)整合進(jìn)基于概率的蒙特卡羅樹(shù)搜索(MCTS)中,將監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)結(jié)合起來(lái)。此外,新版AlphaGo還將產(chǎn)生大量自我對(duì)弈棋局,通過(guò)自身為下一版本提供訓(xùn)練數(shù)據(jù)。

  “蒙特卡羅樹(shù)搜索的算法是讓AlphaGo不停地自我對(duì)弈,”一位業(yè)內(nèi)觀(guān)察人士表示,“通過(guò)自我對(duì)弈,進(jìn)而訓(xùn)練價(jià)值網(wǎng)絡(luò)和策略網(wǎng)絡(luò),從而優(yōu)化蒙特卡羅樹(shù)搜索。”

  換言之,擊敗李世石的AlphaGo 1.0,是通過(guò)學(xué)習(xí)大量人類(lèi)對(duì)戰(zhàn)棋譜及與多位人類(lèi)頂級(jí)高手交鋒,不斷積累形成棋力的。本次迎戰(zhàn)的AlphaGo 2.0版本,則將完全摒棄人類(lèi)棋譜,憑借自我對(duì)弈成長(zhǎng)為頂級(jí)高手。

  不過(guò),盡管柯潔自己坦言AlphaGo為強(qiáng)勁對(duì)手,卻仍表示不會(huì)輕易妥協(xié)?!盁o(wú)論它多么強(qiáng)大,我都要一決勝負(fù),并盡力擊敗AlphaGo,”柯潔稱(chēng),“現(xiàn)在我的心情很激動(dòng),期待五月的大戰(zhàn)。”

  勝負(fù)之外

  盡管還未開(kāi)戰(zhàn),但外界對(duì)本次賽事的結(jié)果,已經(jīng)開(kāi)始有了預(yù)期。

  “AlphaGo采用的是蒙特卡羅樹(shù)搜索框架,加上深度學(xué)習(xí)和深度強(qiáng)化學(xué)習(xí)。在這樣一個(gè)框架下,深度學(xué)習(xí)尤其是深度強(qiáng)化學(xué)習(xí)在計(jì)算機(jī)圍棋上的天花板究竟有多高,還是個(gè)未知數(shù)?!敝袊?guó)人工智能學(xué)會(huì)副理事長(zhǎng)、清華大學(xué)計(jì)算機(jī)系教授馬少平指出。

  而就是這樣尚看不清天花板的人工智能應(yīng)用,已經(jīng)足以橫掃人類(lèi)頂級(jí)高手。一年以來(lái),由AlphaGo引爆的各色棋牌類(lèi)人機(jī)大戰(zhàn)的結(jié)果已基本沒(méi)有任何懸念:無(wú)論是AlphaGo化身Master,在網(wǎng)上實(shí)現(xiàn)對(duì)陣各國(guó)高手,實(shí)現(xiàn)60連勝(其中亦包括柯潔),還是騰訊絕藝在騰訊野狐平臺(tái)率先晉升網(wǎng)絡(luò)十段,此后在第10屆UEC杯中稱(chēng)王,或是新近落幕的德州撲克人機(jī)對(duì)決中,卡內(nèi)基梅隆大學(xué)開(kāi)發(fā)的“冷撲大師AI”毫無(wú)懸念地戰(zhàn)勝中國(guó)龍之隊(duì)……在棋牌類(lèi)人機(jī)大戰(zhàn)中,人類(lèi)已越來(lái)越心平氣和地接受了自己的落敗。

  “AlphaGo與人類(lèi)的對(duì)決已持續(xù)了很長(zhǎng)時(shí)間,確實(shí)很強(qiáng)大。比賽的勝負(fù)很重要,柯潔也表示將竭盡全力比賽并爭(zhēng)取勝利,”圍繞此次對(duì)決,國(guó)家體育總局棋牌運(yùn)動(dòng)管理中心主任羅超毅指出,“柯潔沒(méi)有與AlphaGo進(jìn)行慢棋比賽,現(xiàn)在誰(shuí)輸誰(shuí)贏(yíng)還沒(méi)有落定?!?/p>

  事實(shí)上,在年初Master的網(wǎng)絡(luò)對(duì)局中,它采用的都是“20秒3次”的超快棋方式,幾乎都是在中盤(pán)輕易取勝,然而在去年李世石對(duì)陣AlphaGo時(shí)采用的是慢棋,最終有一盤(pán)取勝。而在本次圍棋峰會(huì)中,無(wú)論是柯潔與AlphaGo的“單挑”,還是頂級(jí)棋手組成“神經(jīng)網(wǎng)絡(luò)”與AlphaGo“車(chē)輪戰(zhàn)”,都延長(zhǎng)了行棋的時(shí)間,無(wú)形中對(duì)人類(lèi)或?qū)⒏佑欣?/p>

  此外,羅超毅強(qiáng)調(diào),勝負(fù)固然重要,卻并非本次圍棋峰會(huì)的全部,也不是峰會(huì)的主題?!翱聺嵟cAlphaGo的對(duì)決,不僅僅是人機(jī)對(duì)戰(zhàn),而是科學(xué)家與棋手的智慧交流?!绷_超毅指出,“柯潔曾提到,AlphaGo的許多招法是過(guò)去所沒(méi)有想過(guò)的,這也恰好證明了圍棋奇妙無(wú)窮,提升的空間很大,無(wú)論棋手還是深度學(xué)習(xí)團(tuán)隊(duì),都將從中獲益匪淺?!?/p>



關(guān)鍵詞: AlphaGo 機(jī)器人

評(píng)論


相關(guān)推薦

技術(shù)專(zhuān)區(qū)

關(guān)閉