人工智能在游戲領(lǐng)域再進(jìn)一步

作者：時(shí)間：2019-11-25 來(lái)源：新華社

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

美國(guó)麻省理工學(xué)院科研團(tuán)隊(duì)日前宣布，其開(kāi)發(fā)的人工智能程序“深度角色”（DeepRole）在一個(gè)玩家角色和動(dòng)機(jī)不明的在線游戲中勝過(guò)人類，成為首個(gè)在敵友不明的多玩家游戲中戰(zhàn)勝人類玩家的人工智能程序。

本文引用地址：http://butianyuan.cn/article/201911/407438.htm

研究顯示，通過(guò)在算法中使用“演繹推理”，“深度角色”根據(jù)觀察到的部分行為，推斷某一玩家是敵是友，快速學(xué)習(xí)應(yīng)該與誰(shuí)結(jié)盟從而獲得勝利。

今年7月，美國(guó)卡內(nèi)基-梅隆大學(xué)宣布，人工智能Pluribus在六人桌德州撲克比賽中擊敗多名世界頂尖選手，突破了人工智能僅能在國(guó)際象棋和圍棋等二人游戲中戰(zhàn)勝人類的局限。但在這些游戲中，人工智能從一開(kāi)始就知道“誰(shuí)是敵人、誰(shuí)是朋友”。

研究人員讓“深度角色”參與了超過(guò)4000輪在線桌游“抵抗組織：阿瓦隆”?！鞍⑼呗　鳖愃朴凇皻⑷擞螒颉被颉袄侨藲ⅰ?，玩家通過(guò)游戲進(jìn)程推測(cè)出其他玩家的身份，同時(shí)掩藏自己的身份。結(jié)果顯示，不論作為“好人”還是“壞人”，“深度角色”都比人類玩家表現(xiàn)更加出色。

“深度角色”采取了一種被稱為“反事實(shí)遺憾最小化”的博弈算法，利用“博弈樹(shù)”預(yù)測(cè)每個(gè)玩家的行為，并推斷出玩家角色的最大可能性。這種人工智能程序在游戲中進(jìn)行自我對(duì)抗，逐步接近最佳策略，實(shí)現(xiàn)“至少與對(duì)手打平”的納什均衡。

“阿瓦隆”的人類玩家通常要在游戲過(guò)程中通過(guò)對(duì)話為決策提供部分依據(jù)，而“深度角色”只觀察玩家行為，無(wú)需參與交流。研究人員未來(lái)計(jì)劃讓機(jī)器表達(dá)簡(jiǎn)單的信息，如玩家是敵是友等。

語(yǔ)言是人工智能的下一個(gè)前沿，因?yàn)槿祟愅婕視?huì)說(shuō)謊，需要更復(fù)雜的交流技巧。只有掌握表達(dá)技巧后，人工智能才能參與那些需要對(duì)其他玩家進(jìn)行勸說(shuō)的復(fù)雜社交推理游戲。

研究人員說(shuō)，這項(xiàng)工作可以更好模擬人類是如何做出社會(huì)決策的，從而幫助人工智能更好理解人類、向人類學(xué)習(xí)并與人類共事。

新聞中心

人工智能在游戲領(lǐng)域再進(jìn)一步

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)