玩橋牌，8位人類世界冠軍，都輸給了AI

發(fā)布人：CV研究院時(shí)間：2022-04-14 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

作者 | 學(xué)術(shù)頭條

來(lái)源丨學(xué)術(shù)頭條日前，人工智能（AI）再次戰(zhàn)勝了人類。

這一次，人工智能沒有玩跳棋、國(guó)際象棋或者圍棋，也沒有玩《星際爭(zhēng)霸》《GT 賽車》或者奧數(shù)題，而是玩了一種更具娛樂性的紙牌游戲——橋牌。

圖｜1942 年，美國(guó)夏默學(xué)院的一個(gè)橋牌俱樂部（來(lái)源：維基百科）
據(jù)英國(guó)《衛(wèi)報(bào)》（The Guardian）報(bào)道，在法國(guó)巴黎，一個(gè)名為 Nook 的人工智能在上周舉辦的橋牌比賽中擊敗了 8 位橋牌世界冠軍。

這一勝利對(duì)人工智能行業(yè)來(lái)說(shuō)是一個(gè)新的里程碑，因?yàn)?Nook 在使用不完全信息的情況下，必須對(duì)其他幾個(gè)人類玩家的行為做出反應(yīng)，這種情況更接近于“做出人類一般的決策”。

盡管此前人工智能已經(jīng)在國(guó)際象棋和圍棋等方面擊敗了人類，但當(dāng)時(shí)的人工智能玩家每次只有一個(gè)對(duì)手，而且人機(jī)雙方都擁有所有的信息。
可解釋的人工智能

橋牌是一種以技巧贏取牌墩的紙牌游戲，屬于吃墩游戲，是惠斯特（另一種紙牌游戲）的延伸，是世界上最流行的紙牌游戲之一，在老年人群中尤為流行。

橋牌是由四個(gè)人組成兩對(duì)搭檔在方桌上進(jìn)行，搭檔互相面對(duì)面坐在桌子的兩端。

一節(jié)橋牌包含許多副牌，而一副牌的進(jìn)行順序是先發(fā)牌，接著進(jìn)行叫牌決定定約，然后打牌，最后登記該牌的結(jié)果。一副牌的目標(biāo)是以手上發(fā)到的牌盡可能取得好成績(jī)。

這一次，在一個(gè)名為“The NukkAI challenge”的橋牌比賽中，與人類冠軍擁有同樣的****牌和同樣的對(duì)手的 Nook，在 80 次比賽中有 67 次的表現(xiàn)要好于人類冠軍。

圖｜比賽畫面（來(lái)源：YouTube）
對(duì)此，人工智能研究員、NukkAI 聯(lián)合創(chuàng)始人之一 Véronique Ventos 表示，NooK 是“新一代人工智能”，因?yàn)樗茉谶M(jìn)行決策時(shí)做出解釋。“在橋牌中，如果你不做出解釋，就無(wú)法繼續(xù)玩下去?！?br />
倫敦帝國(guó)學(xué)院（Imperial College London）教授斯 Stephen Muggleton 認(rèn)為，這一勝利“代表了人工智能領(lǐng)域取得了根本性的重要進(jìn)展”。

（來(lái)源：《衛(wèi)報(bào)》）
近年來(lái)，可解釋性是人工智能領(lǐng)域的一個(gè)熱門話題。

當(dāng)前我們聽到的大多數(shù)關(guān)于機(jī)器學(xué)習(xí)的進(jìn)展都是基于像 AlphaGo 這樣的黑盒子系統(tǒng)，這樣的人工智能是無(wú)法向人類解釋決策是如何做出的。

而 NooK 則代表了一種“白盒子”或“神經(jīng)符號(hào)”方法，它不是通過(guò)玩數(shù)十億輪游戲來(lái)學(xué)習(xí)，而是首先學(xué)習(xí)游戲規(guī)則，然后通過(guò)練習(xí)來(lái)改進(jìn)游戲，是基于規(guī)則和深度學(xué)習(xí)系統(tǒng)的結(jié)合體，學(xué)習(xí)方式更接近人類。

布朗大學(xué)計(jì)算機(jī)科學(xué)教授 Michael Littman 表示，即使一個(gè)人或人工智能無(wú)法用語(yǔ)言解釋他們?cè)谧鍪裁?，他們的行為也需要“清晰易懂”，這對(duì)健康和工程等領(lǐng)域至關(guān)重要，比如即將通過(guò)路口的自動(dòng)駕駛汽車，就需要能夠讀取其他車輛的行為。

但 Littman 也表示，這次人家大戰(zhàn)過(guò)程也有不足之處，因?yàn)檎麄€(gè)比賽過(guò)程沒有競(jìng)價(jià)（也可稱為叫牌）過(guò)程，而競(jìng)價(jià)是橋牌中最有趣的交流和欺騙發(fā)生的環(huán)節(jié)。

但在橋牌世界冠軍、NooK 此次的對(duì)手之一 Nevena Senior 看來(lái)，NooK 比人類更能解讀對(duì)手，更能利用對(duì)手的錯(cuò)誤，NooK 的創(chuàng)造者們做了一件“了不起的”工作。

“這是人類在積累了足夠的經(jīng)驗(yàn)后才會(huì)做的事情。機(jī)器人能模仿人類的技能，讓我十分驚喜。”
“人機(jī)博弈”大盤點(diǎn)

自人工智能誕生以來(lái)，其與人類之間的 PK 就從未間斷。

30 年前，也就是 1992 年，國(guó)際跳棋人工智能程序奇努克首次挑戰(zhàn)了被譽(yù)為“世界上最好的”跳棋世界冠軍廷斯利。然而令人遺憾的是，奇努克落敗了。

但兩年之后，奇努克重振旗鼓，再次向廷斯利發(fā)起挑戰(zhàn)，在雙方打了 6 局平手之后，廷斯利因病退賽，奇努克獲得冠軍。

這是人工智能歷史上第一次在競(jìng)技游戲中獲得官方世界冠軍。

但奇努克前進(jìn)的腳步并未停下，2007 年 4 月，奇努克終極程序問(wèn)世，成為了國(guó)際跳棋領(lǐng)域不可能被擊敗的存在。

1996 年的冬天，首次國(guó)際象棋人機(jī)大戰(zhàn)在美國(guó)費(fèi)城上演。IBM 公司的超級(jí)計(jì)算機(jī)“深藍(lán)”與棋王卡斯帕羅夫進(jìn)行了 6 局人機(jī)對(duì)弈。最終，卡斯帕羅夫以 4:2 的總比分戰(zhàn)勝了“深藍(lán)”。

這一次，人類捍衛(wèi)了自己的尊嚴(yán)。

然而，僅僅過(guò)了一年，1997 年 5 月，經(jīng)過(guò)改進(jìn)后的超級(jí)計(jì)算機(jī)“深藍(lán)”就再次向卡斯帕羅夫發(fā)起了挑戰(zhàn)。6 局戰(zhàn)罷，卷土重來(lái)的“深藍(lán)”以兩勝一負(fù)三平的戰(zhàn)績(jī)戰(zhàn)勝了棋王。

這是人工智能首次在標(biāo)準(zhǔn)比賽時(shí)限內(nèi)擊敗國(guó)際象棋世界冠軍。

但在今天看來(lái)，“深藍(lán)”還算不上足夠智能，其缺陷是沒有直覺，不具備真正的“智能靈魂”，只能靠超強(qiáng)的計(jì)算能力來(lái)彌補(bǔ)分析思考方面的缺陷。

直到 2016 年 3 月，另一場(chǎng)“人機(jī)大戰(zhàn)”震驚了世界。

由谷歌旗下人工智能公司 DeepMind 研發(fā)的 AlphaGo 以 4:1 的大比分，擊敗了當(dāng)時(shí)的圍棋世界冠軍李世石，成為了第一個(gè)戰(zhàn)勝圍棋世界冠軍的人工智能。

這一事件被認(rèn)為是人工智能行業(yè)真正意義上的里程碑。

從技術(shù)上講，通過(guò)使用蒙特卡洛樹搜索與兩個(gè)深度神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法，AlphaGo 可以像人類大腦一樣自發(fā)學(xué)習(xí)，進(jìn)行分析訓(xùn)練，不斷學(xué)習(xí)提高棋力。

一年后，在中國(guó)烏鎮(zhèn)圍棋峰會(huì)上，AlphaGo 以 3:0 的總比分，又戰(zhàn)勝了當(dāng)時(shí)排名世界第一的世界圍棋冠軍柯潔。

自此之后，在電子競(jìng)技、編程和生命科學(xué)等領(lǐng)域，各類人工智能也如雨后春筍般涌現(xiàn)。

比如，2018 年 12 月 10 日，DeepMind 針對(duì)即時(shí)戰(zhàn)略游戲《星際爭(zhēng)霸》開發(fā)的 AlphaStar 完虐了世界上 99.8% 的人類職業(yè)選手。

今年 2 月，DeepMind 又創(chuàng)建了一個(gè)名為 AlphaCode 的 AI 系統(tǒng)，并宣稱該系統(tǒng)的“編程能力能與一般人類程序員相競(jìng)爭(zhēng)”。

同月，由索尼人工智能團(tuán)隊(duì)研發(fā)的人工智能程序，在賽車游戲《GT賽車》中，也戰(zhàn)勝了世界冠軍級(jí)人類玩家。

如今的人工智能，已經(jīng)深入到了我們?nèi)粘Ｉ睢W(xué)習(xí)和工作的方方面面，在某些特定任務(wù)中有著比肩甚至超越人類的能力。

因此，有些人會(huì)擔(dān)憂，能力越來(lái)越強(qiáng)的人工智能系統(tǒng)，會(huì)不會(huì)在未來(lái)的某一天進(jìn)化出自己的意識(shí)，進(jìn)而超越人類，甚至做出更可怕的事情。

事實(shí)上，人工智能的優(yōu)勢(shì)在于超強(qiáng)的記憶力、計(jì)算能力等方面，并且能夠在極端條件下無(wú)休止工作。在這一點(diǎn)上，目前的人工智能確實(shí)在很多領(lǐng)域超越了人類。

但從技術(shù)層面來(lái)說(shuō)，目前的人工智能系統(tǒng)是在給定的數(shù)據(jù)和指定的規(guī)則下進(jìn)行自主學(xué)習(xí)或者人工矯正，可以在特定參數(shù)下解決特定問(wèn)題。一旦引入一個(gè)變量，系統(tǒng)可能就會(huì)崩潰，或者需要?jiǎng)?chuàng)建一個(gè)新的模型，離科幻電影中描述的場(chǎng)景，還相去甚遠(yuǎn)。

人類和人工智能都擁有不同的能力和優(yōu)勢(shì)。人工智能無(wú)法擁有許多人類獨(dú)有的能力和特性，比如情感意識(shí)和創(chuàng)造力等，人類也不能像人工智能那樣，具備超強(qiáng)的記憶力和計(jì)算力，以及無(wú)休止工作的能力。

因此，我們真正需要關(guān)心的問(wèn)題是，如何讓人工智能與人類更好地協(xié)作。

無(wú)論如何，不可否認(rèn)的是，人工智能確實(shí)改變了一些東西。

參考鏈接：
https://www.theguardian.com/technology/2022/mar/29/artificial-intelligence-beats-eight-world-champions-at-bridge
https://en.wikipedia.org/wiki/Contract_bridge
https://challenge.nukk.ai/