柯潔首戰(zhàn)惜敗，但AlphaGo和AI未來何去何從？

作者：時間：2017-05-24 來源：網(wǎng)易智能

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

編者按：拼盡全力的柯潔，也只能望洋興嘆，AlphaGo對棋的理解和判斷已經(jīng)高于我們(人類)了。

　　職業(yè)女子棋手和評論員徐瑩在今天比賽的評述中說到：“自從 AlphaGo 出現(xiàn)之后，突然圍棋變得五彩斑瀾了，我們感覺思路一下子打開了，AlphaGo 這種自由自在的行棋風格，恰恰是我們一直所追求的圍棋本質(zhì)?！?/p>本文引用地址：http://www.butianyuan.cn/article/201705/359624.htm

　　Michael Redmond九段點評說，AlphaGo的棋風如何激發(fā)人類棋手挑戰(zhàn)創(chuàng)新的邊界，并賦予一些傳統(tǒng)套路新的生命。“柯潔在開局階段就使用了他從早前Master連勝系列中學習到的下法，并和自己的風格融合到了一起?！?/p>

　　正如哈薩比斯所說，“再過一萬年，我們也不能窮盡所有的打法?！钡?，圍棋的探索從未停止。

AlphaGo有哪些蛻變，2.0之后何去何從?

哈薩比斯今日透露，目前的AlphaGo是在云端由單TPU運行，這與Goolge上周在I/O大會上剛公布的芯片版本一致。TPU是專門為機器學習而設(shè)計的處理器。與去年3月與李世石的比賽時相比，當前的版本在處理計算時所消耗的能量僅為過去的十分之一。

　　360研究院院長顏水成點評說，過去一年多，AlphaGo在學習方式和模型上有很大的變化和提升，實時比賽計算已經(jīng)用一個TPU就足夠。對于算法上的貢獻，三角獸科技首席科學家王寶勛說，毫無疑問的AlphaGo基于深度學習的搜索算法得到了進一步的優(yōu)化，走棋的效率更高，強化學習勢必比之前發(fā)揮的作用更大。但是Deepmind對于硬件和模型細節(jié)的把握同樣是不可忽視的因素。

　　對于AlphaGo 2.0的技術(shù)進步，地平線機器人技術(shù)CEO余凱稱，這次AlphaGo 2.0的重要進展是，系統(tǒng)完全從零狀態(tài)開始通過自我博弈來學習和提升棋力的。而以前的1.0版本是有學習人類棋手歷史數(shù)據(jù)的。這種完全不需要外界數(shù)據(jù)的自我學習，是人工智能很激動人心的一個進展。

　　搜狗CEO王小川進一步解釋說，AlphaGo 1.0是巧妙地混合了蒙特卡洛樹搜索+監(jiān)督學習+增強學習三種算法。而此次AlphaGo2.0的技術(shù)原理與之前有著巨大不同，它放棄了放棄了監(jiān)督學習;放棄了蒙特卡洛樹搜索，不再進行暴力計算;極大地強化了增強學習的作用，之前敲邊鼓的算法，正式成為扛把子主力。

　　第四范式資深機器學習架構(gòu)師涂威威點評到，在底層架構(gòu)上，AlphaGo這一版性能相比去年有了一個量級的提升，不僅是訓練速度提升，而且實際對弈的機器也從去年的多臺機器的集群變成了現(xiàn)在的單機，這點對實際應用意義巨大，降低了使用門檻，同樣也使得在相同計算資源的情況下，可以支持更多的訓練數(shù)據(jù)和維度更高的模型;Google在此之前也宣布了新版的TPU，打破了深度學習訓練硬件上GPU的壟斷(更早公開的TPU只是被應用在深度學習預估系統(tǒng)中)，新版的AlphaGo可能也會受益于TPU技術(shù)的進步。算法細節(jié)上尚未公布，這一版可能對搜索策略和強化學習一些細節(jié)上進行調(diào)整，比如蒙特卡洛樹搜索和策略網(wǎng)絡(luò)結(jié)合來提升性能，以及上一版的AlphaGo自我博弈的啟發(fā)式策略(與前幾輪的自己進行對弈)并不收斂，我們猜測新版可能在這些方面會有所改進。

　　涂威威重點提到，DeepMind已經(jīng)在嘗試讓AlphaGo有“舉一反三”的能力，這種觸類旁通的能力才是人類更為擅長的，這里就要用到遷移學習領(lǐng)域的技術(shù)。

　　對于AlphaGo在比賽之后的發(fā)展，創(chuàng)始人哈薩比斯表示，我們在本周內(nèi)會告訴大家，并披露更多的技術(shù)細節(jié)。

　人工智能能給人類帶來什么?

　　雖然哈薩比斯沒有透露AlphaGo的去向，但是他在現(xiàn)場曾表示，我們利用人工智能可以解決目前的很多難題，比如醫(yī)療。我們希望AlphaGo與人類的合作可以找到更多的方式，我們希望AlphaGo在其他領(lǐng)域也能取得矚目的成就。

　　達闥科技CEO黃曉慶說，AlphaGo贏柯潔是完全在意料之中，贏很小的優(yōu)勢也是意料之中，因為那是AlphaGo的設(shè)計方法，只需要保證贏就行。“這是對強人工智能技術(shù)的可能性的最強大的證明!”黃曉慶強調(diào)說。

　　也許就是因為這種進步，DeepMind將開始探索人工智能在醫(yī)療等各個行業(yè)領(lǐng)域的應用。

　　海知智能(ruyi.ai)創(chuàng)始人兼CEO謝殿俠評點說，以AlphaGo為代表的人工智能應用，在這場認知革命里只是一個小小里程碑。工業(yè)革命實現(xiàn)了體力工作自動化解放了體力勞動者，認知革命將知識工作自動化解放腦力勞動者。

　　最后，智能菌相對大家說，比賽尚未結(jié)束，精彩還在繼續(xù)，雖然變化打法仍沒有找到AlphaGo的弱點，但柯潔仍表示會盡全力去拼每一盤棋，作為觀眾我們何嘗不需要這種認真的精神呢?

新聞中心

柯潔首戰(zhàn)惜敗，但AlphaGo和AI未來何去何從？

評論

相關(guān)推薦

技術(shù)專區(qū)

新聞中心

柯潔首戰(zhàn)惜敗，但AlphaGo和AI未來何去何從？

評論

相關(guān)推薦

技術(shù)專區(qū)

柯潔首戰(zhàn)惜敗，但AlphaGo和AI未來何去何從？