玩橋牌,8位人類世界冠軍,都輸給了AI
來(lái)源丨學(xué)術(shù)頭條日前,人工智能(AI)再次戰(zhàn)勝了人類。
這一次,人工智能沒有玩跳棋、國(guó)際象棋或者圍棋,也沒有玩《星際爭(zhēng)霸》《GT 賽車》或者奧數(shù)題,而是玩了一種更具娛樂性的紙牌游戲——橋牌。
圖|1942 年,美國(guó)夏默學(xué)院的一個(gè)橋牌俱樂部(來(lái)源:維基百科)
據(jù)英國(guó)《衛(wèi)報(bào)》(The Guardian)報(bào)道,在法國(guó)巴黎,一個(gè)名為 Nook 的人工智能在上周舉辦的橋牌比賽中擊敗了 8 位橋牌世界冠軍。
這一勝利對(duì)人工智能行業(yè)來(lái)說(shuō)是一個(gè)新的里程碑,因?yàn)?Nook 在使用不完全信息的情況下,必須對(duì)其他幾個(gè)人類玩家的行為做出反應(yīng),這種情況更接近于“做出人類一般的決策”。
盡管此前人工智能已經(jīng)在國(guó)際象棋和圍棋等方面擊敗了人類,但當(dāng)時(shí)的人工智能玩家每次只有一個(gè)對(duì)手,而且人機(jī)雙方都擁有所有的信息。
可解釋的人工智能
橋牌是一種以技巧贏取牌墩的紙牌游戲,屬于吃墩游戲,是惠斯特(另一種紙牌游戲)的延伸,是世界上最流行的紙牌游戲之一,在老年人群中尤為流行。
橋牌是由四個(gè)人組成兩對(duì)搭檔在方桌上進(jìn)行,搭檔互相面對(duì)面坐在桌子的兩端。
一節(jié)橋牌包含許多副牌,而一副牌的進(jìn)行順序是先發(fā)牌,接著進(jìn)行叫牌決定定約,然后打牌,最后登記該牌的結(jié)果。一副牌的目標(biāo)是以手上發(fā)到的牌盡可能取得好成績(jī)。
這一次,在一個(gè)名為“The NukkAI challenge”的橋牌比賽中,與人類冠軍擁有同樣的****牌和同樣的對(duì)手的 Nook,在 80 次比賽中有 67 次的表現(xiàn)要好于人類冠軍。
圖|比賽畫面(來(lái)源:YouTube)
對(duì)此,人工智能研究員、NukkAI 聯(lián)合創(chuàng)始人之一 Véronique Ventos 表示,NooK 是“新一代人工智能”,因?yàn)樗茉谶M(jìn)行決策時(shí)做出解釋。“在橋牌中,如果你不做出解釋,就無(wú)法繼續(xù)玩下去?!?br />
倫敦帝國(guó)學(xué)院(Imperial College London)教授斯 Stephen Muggleton 認(rèn)為,這一勝利“代表了人工智能領(lǐng)域取得了根本性的重要進(jìn)展”。
(來(lái)源:《衛(wèi)報(bào)》)
近年來(lái),可解釋性是人工智能領(lǐng)域的一個(gè)熱門話題。
當(dāng)前我們聽到的大多數(shù)關(guān)于機(jī)器學(xué)習(xí)的進(jìn)展都是基于像 AlphaGo 這樣的黑盒子系統(tǒng),這樣的人工智能是無(wú)法向人類解釋決策是如何做出的。
而 NooK 則代表了一種“白盒子”或“神經(jīng)符號(hào)”方法,它不是通過(guò)玩數(shù)十億輪游戲來(lái)學(xué)習(xí),而是首先學(xué)習(xí)游戲規(guī)則,然后通過(guò)練習(xí)來(lái)改進(jìn)游戲,是基于規(guī)則和深度學(xué)習(xí)系統(tǒng)的結(jié)合體,學(xué)習(xí)方式更接近人類。
布朗大學(xué)計(jì)算機(jī)科學(xué)教授 Michael Littman 表示,即使一個(gè)人或人工智能無(wú)法用語(yǔ)言解釋他們?cè)谧鍪裁?,他們的行為也需要“清晰易懂”,這對(duì)健康和工程等領(lǐng)域至關(guān)重要,比如即將通過(guò)路口的自動(dòng)駕駛汽車,就需要能夠讀取其他車輛的行為。
但 Littman 也表示,這次人家大戰(zhàn)過(guò)程也有不足之處,因?yàn)檎麄€(gè)比賽過(guò)程沒有競(jìng)價(jià)(也可稱為叫牌)過(guò)程,而競(jìng)價(jià)是橋牌中最有趣的交流和欺騙發(fā)生的環(huán)節(jié)。
但在橋牌世界冠軍、NooK 此次的對(duì)手之一 Nevena Senior 看來(lái),NooK 比人類更能解讀對(duì)手,更能利用對(duì)手的錯(cuò)誤,NooK 的創(chuàng)造者們做了一件“了不起的”工作。
“這是人類在積累了足夠的經(jīng)驗(yàn)后才會(huì)做的事情。機(jī)器人能模仿人類的技能,讓我十分驚喜。”
“人機(jī)博弈”大盤點(diǎn)
自人工智能誕生以來(lái),其與人類之間的 PK 就從未間斷。
30 年前,也就是 1992 年,國(guó)際跳棋人工智能程序奇努克首次挑戰(zhàn)了被譽(yù)為“世界上最好的”跳棋世界冠軍廷斯利。然而令人遺憾的是,奇努克落敗了。
但兩年之后,奇努克重振旗鼓,再次向廷斯利發(fā)起挑戰(zhàn),在雙方打了 6 局平手之后,廷斯利因病退賽,奇努克獲得冠軍。
這是人工智能歷史上第一次在競(jìng)技游戲中獲得官方世界冠軍。
但奇努克前進(jìn)的腳步并未停下,2007 年 4 月,奇努克終極程序問(wèn)世,成為了國(guó)際跳棋領(lǐng)域不可能被擊敗的存在。
1996 年的冬天,首次國(guó)際象棋人機(jī)大戰(zhàn)在美國(guó)費(fèi)城上演。IBM 公司的超級(jí)計(jì)算機(jī)“深藍(lán)”與棋王卡斯帕羅夫進(jìn)行了 6 局人機(jī)對(duì)弈。最終,卡斯帕羅夫以 4:2 的總比分戰(zhàn)勝了“深藍(lán)”。
這一次,人類捍衛(wèi)了自己的尊嚴(yán)。
然而,僅僅過(guò)了一年,1997 年 5 月,經(jīng)過(guò)改進(jìn)后的超級(jí)計(jì)算機(jī)“深藍(lán)”就再次向卡斯帕羅夫發(fā)起了挑戰(zhàn)。6 局戰(zhàn)罷,卷土重來(lái)的“深藍(lán)”以兩勝一負(fù)三平的戰(zhàn)績(jī)戰(zhàn)勝了棋王。
這是人工智能首次在標(biāo)準(zhǔn)比賽時(shí)限內(nèi)擊敗國(guó)際象棋世界冠軍。
但在今天看來(lái),“深藍(lán)”還算不上足夠智能,其缺陷是沒有直覺,不具備真正的“智能靈魂”,只能靠超強(qiáng)的計(jì)算能力來(lái)彌補(bǔ)分析思考方面的缺陷。
直到 2016 年 3 月,另一場(chǎng)“人機(jī)大戰(zhàn)”震驚了世界。
由谷歌旗下人工智能公司 DeepMind 研發(fā)的 AlphaGo 以 4:1 的大比分,擊敗了當(dāng)時(shí)的圍棋世界冠軍李世石,成為了第一個(gè)戰(zhàn)勝圍棋世界冠軍的人工智能。
這一事件被認(rèn)為是人工智能行業(yè)真正意義上的里程碑。
從技術(shù)上講,通過(guò)使用蒙特卡洛樹搜索與兩個(gè)深度神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法,AlphaGo 可以像人類大腦一樣自發(fā)學(xué)習(xí),進(jìn)行分析訓(xùn)練,不斷學(xué)習(xí)提高棋力。
一年后,在中國(guó)烏鎮(zhèn)圍棋峰會(huì)上,AlphaGo 以 3:0 的總比分,又戰(zhàn)勝了當(dāng)時(shí)排名世界第一的世界圍棋冠軍柯潔。
自此之后,在電子競(jìng)技、編程和生命科學(xué)等領(lǐng)域,各類人工智能也如雨后春筍般涌現(xiàn)。
比如,2018 年 12 月 10 日,DeepMind 針對(duì)即時(shí)戰(zhàn)略游戲《星際爭(zhēng)霸》開發(fā)的 AlphaStar 完虐了世界上 99.8% 的人類職業(yè)選手。
今年 2 月,DeepMind 又創(chuàng)建了一個(gè)名為 AlphaCode 的 AI 系統(tǒng),并宣稱該系統(tǒng)的“編程能力能與一般人類程序員相競(jìng)爭(zhēng)”。
同月,由索尼人工智能團(tuán)隊(duì)研發(fā)的人工智能程序,在賽車游戲《GT賽車》中,也戰(zhàn)勝了世界冠軍級(jí)人類玩家。
如今的人工智能,已經(jīng)深入到了我們?nèi)粘I睢W(xué)習(xí)和工作的方方面面,在某些特定任務(wù)中有著比肩甚至超越人類的能力。
因此,有些人會(huì)擔(dān)憂,能力越來(lái)越強(qiáng)的人工智能系統(tǒng),會(huì)不會(huì)在未來(lái)的某一天進(jìn)化出自己的意識(shí),進(jìn)而超越人類,甚至做出更可怕的事情。
事實(shí)上,人工智能的優(yōu)勢(shì)在于超強(qiáng)的記憶力、計(jì)算能力等方面,并且能夠在極端條件下無(wú)休止工作。在這一點(diǎn)上,目前的人工智能確實(shí)在很多領(lǐng)域超越了人類。
但從技術(shù)層面來(lái)說(shuō),目前的人工智能系統(tǒng)是在給定的數(shù)據(jù)和指定的規(guī)則下進(jìn)行自主學(xué)習(xí)或者人工矯正,可以在特定參數(shù)下解決特定問(wèn)題。一旦引入一個(gè)變量,系統(tǒng)可能就會(huì)崩潰,或者需要?jiǎng)?chuàng)建一個(gè)新的模型,離科幻電影中描述的場(chǎng)景,還相去甚遠(yuǎn)。
人類和人工智能都擁有不同的能力和優(yōu)勢(shì)。人工智能無(wú)法擁有許多人類獨(dú)有的能力和特性,比如情感意識(shí)和創(chuàng)造力等,人類也不能像人工智能那樣,具備超強(qiáng)的記憶力和計(jì)算力,以及無(wú)休止工作的能力。
因此,我們真正需要關(guān)心的問(wèn)題是,如何讓人工智能與人類更好地協(xié)作。
無(wú)論如何,不可否認(rèn)的是,人工智能確實(shí)改變了一些東西。
參考鏈接:
https://www.theguardian.com/technology/2022/mar/29/artificial-intelligence-beats-eight-world-champions-at-bridge
https://en.wikipedia.org/wiki/Contract_bridge
https://challenge.nukk.ai/
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。