新聞中心

EEPW首頁(yè) > 業(yè)界動(dòng)態(tài) > DeepMind又搞了個(gè)大事情!讓人工智能像人一樣學(xué)習(xí)

DeepMind又搞了個(gè)大事情!讓人工智能像人一樣學(xué)習(xí)

作者: 時(shí)間:2017-03-17 來(lái)源:騰訊科技 收藏

  通過(guò)開(kāi)發(fā)出一款能夠在任務(wù)中不斷學(xué)習(xí)的程序,研究人員已克服了的主要障礙之一。

本文引用地址:http://butianyuan.cn/article/201703/345366.htm

  由谷歌旗下公司開(kāi)發(fā)的這款程序,已經(jīng)完成了一系列不同的任務(wù),且表現(xiàn)的幾乎像人類(lèi)一樣出色。更為重要和獨(dú)特的是,這個(gè)人工智能程序不會(huì)忘記先前解決問(wèn)題的方法,能夠使用學(xué)習(xí)到的知識(shí)解決新問(wèn)題。

  在遇到新挑戰(zhàn)時(shí),目前的人工智能就無(wú)法發(fā)揮出人類(lèi)的一般智力,且它對(duì)過(guò)去課程的使用更為有限。但如果研究人員想要開(kāi)發(fā)與人類(lèi)智力匹敵的強(qiáng)人工智能(Artificial General Intelligence)機(jī)器,就必須得解決人工智能無(wú)法發(fā)揮出人類(lèi)一般智力的問(wèn)題。

  “如果我們有更聰明、更有用的電腦程序,那么它們就必須得有按順序?qū)W習(xí)的能力,”的研究人員詹姆斯·柯克帕特里克(James Kirkpatrick)表示。

  對(duì)人類(lèi)而言,牢記舊技能并把它應(yīng)用到新任務(wù)是很自然的事情。一個(gè)經(jīng)常滑旱冰的人很快便能掌握溜冰的技巧,因?yàn)橐环N技能能夠幫助其它的技能。但是對(duì)人工智能研究人員來(lái)說(shuō),把這種能力植入到計(jì)算機(jī)當(dāng)中的難度相當(dāng)大。人工智能程序通常只能針對(duì)一個(gè)任務(wù),僅僅是一個(gè)任務(wù)。

  這個(gè)問(wèn)題的出現(xiàn)是因?yàn)槿斯ぶ悄芤兄毓ぷ鞯姆绞?。絕大多數(shù)的人工智能是基于稱(chēng)為神經(jīng)網(wǎng)絡(luò)的程序,經(jīng)過(guò)無(wú)數(shù)次的試驗(yàn)和錯(cuò)誤,學(xué)習(xí)如何執(zhí)行如下棋、打撲克等任務(wù)。一旦訓(xùn)練神經(jīng)網(wǎng)絡(luò)下棋,它只有在覆蓋了學(xué)習(xí)到的博弈技巧之后才能學(xué)習(xí)其它游戲的技巧。這也被人工智能研究人員稱(chēng)為“毀滅性的遺忘。”

  如果不具備在一個(gè)技巧之上掌握另一個(gè)技巧的能力,人工智能就永遠(yuǎn)無(wú)法像人類(lèi)一樣,或是有足夠的靈活性去解決人類(lèi)能夠解決的新問(wèn)題。“人類(lèi)和動(dòng)物會(huì)一個(gè)問(wèn)題接著一個(gè)問(wèn)題的學(xué)習(xí),這是建立在他們以前所學(xué)知識(shí)的基礎(chǔ)之上、讓他們不斷學(xué)習(xí)的關(guān)鍵因素,”柯克帕特里克說(shuō)。

  為了開(kāi)發(fā)新型人工智能,研究人員借鑒了神經(jīng)科學(xué)的研究成果,它表明動(dòng)物在不斷學(xué)習(xí)的同時(shí),會(huì)在大腦中保留過(guò)去所學(xué)的重要技能。對(duì)于動(dòng)物的生存而言,通過(guò)躲避捕食者學(xué)到的經(jīng)驗(yàn)至關(guān)重要。如果老鼠尋找食物的技能被抹去,那么它就不會(huì)長(zhǎng)時(shí)間的生存。

  的人工智能用簡(jiǎn)單的方式借鑒了大腦學(xué)習(xí)的狀態(tài)。當(dāng)它從一個(gè)任務(wù)轉(zhuǎn)向另一個(gè)任務(wù)時(shí),它會(huì)計(jì)算出在神經(jīng)網(wǎng)絡(luò)中的哪個(gè)連接對(duì)已學(xué)到的任務(wù)最為重要。然后在學(xué)習(xí)下一個(gè)技能時(shí),很難對(duì)已學(xué)內(nèi)容進(jìn)行改變。“當(dāng)網(wǎng)絡(luò)能夠再利用已學(xué)到的知識(shí)時(shí),它會(huì)這樣做,”柯克帕特里克說(shuō)。

  研究人員讓人工智能隨機(jī)玩10款經(jīng)典的Atari游戲。他們發(fā)現(xiàn),在每款游戲上花費(fèi)數(shù)天之后,人工智能在7款游戲中的表現(xiàn)已同人類(lèi)玩家相同。如果不采用新記憶鞏固法,人工智能只能玩其中的一款游戲。

DeepMind又搞了個(gè)大事情!讓人工智能像人一樣學(xué)習(xí)

  在觀察人工智能玩游戲的過(guò)程中,科學(xué)家們發(fā)現(xiàn)了一些有趣的策略。舉例來(lái)說(shuō),當(dāng)人工智能玩賽車(chē)游戲Enduro時(shí),它會(huì)把夜間、白天、雪地等環(huán)境當(dāng)作是不同的任務(wù)來(lái)對(duì)待。

  研究人員在在國(guó)際權(quán)威綜合學(xué)術(shù)期刊《美國(guó)科學(xué)院院報(bào)》(Proceedings of the National Academy of Sciences of the United States of America, PNAS)發(fā)表的論文中,詳細(xì)描述了新人工智能如何使用過(guò)去學(xué)到的經(jīng)驗(yàn)來(lái)解決問(wèn)題。不過(guò)目前尚不清楚使用過(guò)去的經(jīng)驗(yàn)?zāi)芊褡屓斯ぶ悄鼙憩F(xiàn)的更加優(yōu)異。雖然DeepMind開(kāi)發(fā)的人工智能程序能夠玩不同的游戲,但技術(shù)卻沒(méi)有像專(zhuān)用的人工智能那樣出色。“我們已經(jīng)證明它可以按順序?qū)W習(xí)任務(wù),但我們沒(méi)有表明因?yàn)榘错樞驅(qū)W習(xí)它就能變得更好,它依然有改進(jìn)的空間,”柯克帕特里克說(shuō)。

DeepMind又搞了個(gè)大事情!讓人工智能像人一樣學(xué)習(xí)

  “我們知道連續(xù)學(xué)習(xí)非常重要,但我們還沒(méi)有進(jìn)入展示人類(lèi)和動(dòng)物利用所學(xué)能夠做些什么的下一個(gè)階段。這仍需要很長(zhǎng)的路要走,但我們知道它是無(wú)法逾越的障礙,”柯克帕特里克說(shuō)。“多用途人工智能的發(fā)展仍需要很長(zhǎng)時(shí)間,該領(lǐng)域仍有許多的挑戰(zhàn)未得到解決。其中的難題之一是建立能夠?qū)W習(xí)處理新任務(wù)和挑戰(zhàn)的系統(tǒng),同時(shí)保留已經(jīng)學(xué)會(huì)的能力。這項(xiàng)研究目前仍處于初期,它能夠及時(shí)幫助我們建立問(wèn)題--解決系統(tǒng),從而更靈活,更有效地學(xué)習(xí)。”

  西英格蘭大學(xué)布里斯托爾機(jī)器人實(shí)驗(yàn)室教授艾倫·溫菲爾德(Alan Winfield)就此表示,DeepMind的工作“令人驚訝”,但補(bǔ)充說(shuō):“我不認(rèn)為它能夠讓我們更接近強(qiáng)人工智能,因?yàn)檫@項(xiàng)研究并未向我們表明人工智能如何把學(xué)習(xí)到的經(jīng)驗(yàn)應(yīng)用到另一項(xiàng)任務(wù)當(dāng)中。”



關(guān)鍵詞: DeepMind 人工智能

評(píng)論


相關(guān)推薦

技術(shù)專(zhuān)區(qū)

關(guān)閉