新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 柯潔首戰(zhàn)惜敗,但AlphaGo和AI未來(lái)何去何從?

柯潔首戰(zhàn)惜敗,但AlphaGo和AI未來(lái)何去何從?

作者: 時(shí)間:2017-05-24 來(lái)源:網(wǎng)易智能 收藏
編者按:拼盡全力的柯潔,也只能望洋興嘆,AlphaGo對(duì)棋的理解和判斷已經(jīng)高于我們(人類)了。

  職業(yè)女子棋手和評(píng)論員徐瑩在今天比賽的評(píng)述中說(shuō)到:“自從 出現(xiàn)之后,突然圍棋變得五彩斑瀾了,我們感覺(jué)思路一下子打開(kāi)了, 這種自由自在的行棋風(fēng)格,恰恰是我們一直所追求的圍棋本質(zhì)。”

本文引用地址:http://www.butianyuan.cn/article/201705/359624.htm

  Michael Redmond九段點(diǎn)評(píng)說(shuō),的棋風(fēng)如何激發(fā)人類棋手挑戰(zhàn)創(chuàng)新的邊界,并賦予一些傳統(tǒng)套路新的生命?!翱聺嵲陂_(kāi)局階段就使用了他從早前Master連勝系列中學(xué)習(xí)到的下法,并和自己的風(fēng)格融合到了一起?!?/p>

  正如哈薩比斯所說(shuō),“再過(guò)一萬(wàn)年,我們也不能窮盡所有的打法。”但是,圍棋的探索從未停止。

AlphaGo有哪些蛻變,2.0之后何去何從?

哈薩比斯今日透露,目前的AlphaGo是在云端由單TPU運(yùn)行,這與Goolge上周在I/O大會(huì)上剛公布的芯片版本一致。TPU是專門(mén)為機(jī)器學(xué)習(xí)而設(shè)計(jì)的處理器。與去年3月與李世石的比賽時(shí)相比,當(dāng)前的版本在處理計(jì)算時(shí)所消耗的能量?jī)H為過(guò)去的十分之一。


柯潔首戰(zhàn)惜敗,但AlphaGo和AI未來(lái)何去何從?


  360研究院院長(zhǎng)顏水成點(diǎn)評(píng)說(shuō),過(guò)去一年多,AlphaGo在學(xué)習(xí)方式和模型上有很大的變化和提升,實(shí)時(shí)比賽計(jì)算已經(jīng)用一個(gè)TPU就足夠。對(duì)于算法上的貢獻(xiàn),三角獸科技首席科學(xué)家王寶勛說(shuō),毫無(wú)疑問(wèn)的AlphaGo基于深度學(xué)習(xí)的搜索算法得到了進(jìn)一步的優(yōu)化,走棋的效率更高,強(qiáng)化學(xué)習(xí)勢(shì)必比之前發(fā)揮的作用更大。但是Deepmind對(duì)于硬件和模型細(xì)節(jié)的把握同樣是不可忽視的因素。

  對(duì)于AlphaGo 2.0的技術(shù)進(jìn)步,地平線機(jī)器人技術(shù)CEO余凱稱,這次AlphaGo 2.0的重要進(jìn)展是,系統(tǒng)完全從零狀態(tài)開(kāi)始通過(guò)自我博弈來(lái)學(xué)習(xí)和提升棋力的。而以前的1.0版本是有學(xué)習(xí)人類棋手歷史數(shù)據(jù)的。這種完全不需要外界數(shù)據(jù)的自我學(xué)習(xí),是人工智能很激動(dòng)人心的一個(gè)進(jìn)展。

  搜狗CEO王小川進(jìn)一步解釋說(shuō),AlphaGo 1.0是巧妙地混合了蒙特卡洛樹(shù)搜索+監(jiān)督學(xué)習(xí)+增強(qiáng)學(xué)習(xí)三種算法。而此次AlphaGo2.0的技術(shù)原理與之前有著巨大不同,它放棄了放棄了監(jiān)督學(xué)習(xí);放棄了蒙特卡洛樹(shù)搜索,不再進(jìn)行暴力計(jì)算;極大地強(qiáng)化了增強(qiáng)學(xué)習(xí)的作用,之前敲邊鼓的算法,正式成為扛把子主力。

  第四范式資深機(jī)器學(xué)習(xí)架構(gòu)師涂威威點(diǎn)評(píng)到,在底層架構(gòu)上,AlphaGo這一版性能相比去年有了一個(gè)量級(jí)的提升,不僅是訓(xùn)練速度提升,而且實(shí)際對(duì)弈的機(jī)器也從去年的多臺(tái)機(jī)器的集群變成了現(xiàn)在的單機(jī),這點(diǎn)對(duì)實(shí)際應(yīng)用意義巨大,降低了使用門(mén)檻,同樣也使得在相同計(jì)算資源的情況下,可以支持更多的訓(xùn)練數(shù)據(jù)和維度更高的模型;Google在此之前也宣布了新版的TPU,打破了深度學(xué)習(xí)訓(xùn)練硬件上GPU的壟斷(更早公開(kāi)的TPU只是被應(yīng)用在深度學(xué)習(xí)預(yù)估系統(tǒng)中),新版的AlphaGo可能也會(huì)受益于TPU技術(shù)的進(jìn)步。算法細(xì)節(jié)上尚未公布,這一版可能對(duì)搜索策略和強(qiáng)化學(xué)習(xí)一些細(xì)節(jié)上進(jìn)行調(diào)整,比如蒙特卡洛樹(shù)搜索和策略網(wǎng)絡(luò)結(jié)合來(lái)提升性能,以及上一版的AlphaGo自我博弈的啟發(fā)式策略(與前幾輪的自己進(jìn)行對(duì)弈)并不收斂,我們猜測(cè)新版可能在這些方面會(huì)有所改進(jìn)。

  涂威威重點(diǎn)提到,DeepMind已經(jīng)在嘗試讓AlphaGo有“舉一反三”的能力,這種觸類旁通的能力才是人類更為擅長(zhǎng)的,這里就要用到遷移學(xué)習(xí)領(lǐng)域的技術(shù)。

  對(duì)于AlphaGo在比賽之后的發(fā)展,創(chuàng)始人哈薩比斯表示,我們?cè)诒局軆?nèi)會(huì)告訴大家,并披露更多的技術(shù)細(xì)節(jié)。


柯潔首戰(zhàn)惜敗,但AlphaGo和AI未來(lái)何去何從?


 人工智能能給人類帶來(lái)什么?

  雖然哈薩比斯沒(méi)有透露AlphaGo的去向,但是他在現(xiàn)場(chǎng)曾表示,我們利用人工智能可以解決目前的很多難題,比如醫(yī)療。我們希望AlphaGo與人類的合作可以找到更多的方式,我們希望AlphaGo在其他領(lǐng)域也能取得矚目的成就。

  達(dá)闥科技CEO黃曉慶說(shuō),AlphaGo贏柯潔是完全在意料之中,贏很小的優(yōu)勢(shì)也是意料之中,因?yàn)槟鞘茿lphaGo的設(shè)計(jì)方法,只需要保證贏就行?!斑@是對(duì)強(qiáng)人工智能技術(shù)的可能性的最強(qiáng)大的證明!”黃曉慶強(qiáng)調(diào)說(shuō)。

  也許就是因?yàn)檫@種進(jìn)步,DeepMind將開(kāi)始探索人工智能在醫(yī)療等各個(gè)行業(yè)領(lǐng)域的應(yīng)用。

  海知智能(ruyi.ai)創(chuàng)始人兼CEO謝殿俠評(píng)點(diǎn)說(shuō),以AlphaGo為代表的人工智能應(yīng)用,在這場(chǎng)認(rèn)知革命里只是一個(gè)小小里程碑。工業(yè)革命實(shí)現(xiàn)了體力工作自動(dòng)化解放了體力勞動(dòng)者,認(rèn)知革命將知識(shí)工作自動(dòng)化解放腦力勞動(dòng)者。


柯潔首戰(zhàn)惜敗,但AlphaGo和AI未來(lái)何去何從?


  最后,智能菌相對(duì)大家說(shuō),比賽尚未結(jié)束,精彩還在繼續(xù),雖然變化打法仍沒(méi)有找到AlphaGo的弱點(diǎn),但柯潔仍表示會(huì)盡全力去拼每一盤(pán)棋,作為觀眾我們何嘗不需要這種認(rèn)真的精神呢?


上一頁(yè) 1 2 下一頁(yè)

關(guān)鍵詞: AlphaGo AI

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉