“新人類”即將誕生,AI邁入造人新時(shí)代
人工智能已經(jīng)可以自動(dòng)生成以假亂真的人像照片“忽悠”人類了。憑借“對(duì)抗神經(jīng)網(wǎng)絡(luò)”,人工智能從“學(xué)習(xí)”和“識(shí)別”進(jìn)化到了“創(chuàng)造”。清華大學(xué)計(jì)算機(jī)系教授、博士生導(dǎo)師鄧志東將此技術(shù)與深度卷積神經(jīng)網(wǎng)絡(luò)、AlphaGo并稱為人工智能的三大發(fā)展。當(dāng)然,基于大數(shù)據(jù)和大計(jì)算的人工智能也存在著“先天不足”,至少在理解和“舉一反三”方面還有很長(zhǎng)的路要走。
本文引用地址:http://butianyuan.cn/article/201902/398019.htm一個(gè)頗為無(wú)聊的國(guó)外網(wǎng)站最近火了。
這一名為“此人不存在”(ThisPersonDoesNotExist)的網(wǎng)站沒(méi)有任何界面設(shè)計(jì),輸入網(wǎng)址后顯示的只有一張人像大頭照。新奇之處就在于,每次打開或刷新頁(yè)面,顯示的照片都不同,并且都不是真實(shí)存在的人物照片。
換言之,所有照片都是隨機(jī)“生成”的,而其背后正是人工智能的支撐??梢钥闯?,人工智能已經(jīng)從“學(xué)習(xí)”和“識(shí)別”,開始進(jìn)化到“想象”和“創(chuàng)造”。從網(wǎng)站上的照片來(lái)看,不僅實(shí)現(xiàn)了無(wú)限“生成”,而且還生成得不錯(cuò)——人物有男有女,有老有少,不同人種、不同角度、不同表情,甚至還有眼鏡和佩飾,可謂以假亂真。
事實(shí)上,賦予人工智能想象力和創(chuàng)造力的,正是被《MIT科技評(píng)論》評(píng)為2018十大科技突破之一的“對(duì)抗神經(jīng)網(wǎng)絡(luò)”。
據(jù)《MIT科技評(píng)論》介紹,“對(duì)抗”是指兩個(gè)神經(jīng)網(wǎng)絡(luò)使用同一個(gè)數(shù)據(jù)集進(jìn)行訓(xùn)練。其中一個(gè)神經(jīng)網(wǎng)絡(luò)叫生成網(wǎng)絡(luò)(the generator),它的任務(wù)就是依照所見過(guò)的圖片來(lái)生成新的圖片,而另外那個(gè)神經(jīng)網(wǎng)絡(luò)叫判別網(wǎng)絡(luò)(the discriminator),它的任務(wù)則是判斷它所見得圖片是否與訓(xùn)練時(shí)的圖片相似。
慢慢地,生成網(wǎng)絡(luò)創(chuàng)造圖片的能力會(huì)強(qiáng)到無(wú)法被判別網(wǎng)絡(luò)識(shí)破的程度。經(jīng)過(guò)訓(xùn)練的生成網(wǎng)絡(luò)學(xué)會(huì)了識(shí)別并創(chuàng)造看起來(lái)十分真實(shí)的圖片。這項(xiàng)技術(shù)已成為過(guò)去10年最具潛力的人工智能突破,幫助機(jī)器產(chǎn)生可以“忽悠”人類的成果。
生成式對(duì)抗網(wǎng)絡(luò)“創(chuàng)造”出的人像(現(xiàn)實(shí)中不存在此人)具有十足“迷惑性”
更令人驚嘆的是,這樣的“生成”還不限于圖像。清華大學(xué)計(jì)算機(jī)系教授、博士生導(dǎo)師鄧志東近日在上海“張江·2019未來(lái)產(chǎn)業(yè)峰會(huì)”上提到:“兩個(gè)卷積神經(jīng)網(wǎng)絡(luò)通過(guò)相互對(duì)抗,生成超分辨率真實(shí)感的原創(chuàng)圖像、聲音、3D物體或自然時(shí)序數(shù)據(jù),這給AI帶來(lái)一種類似于人類的想象力?!?/p>
AI的三大主義與三大發(fā)展
令人嘆為觀止的人像“創(chuàng)造”背后,必然是對(duì)海量原始照片的學(xué)習(xí)。
鄧志東認(rèn)為,生物智能的一個(gè)主要特征就是學(xué)習(xí),而新一輪人工智能的鮮明特點(diǎn)就是學(xué)習(xí)能力。無(wú)論是生物智能還是人工智能,智能的主要特點(diǎn)就是感知能力、認(rèn)知能力和行動(dòng)能力。
追本溯源,智能的這三大特點(diǎn)源自連接主義、行為主義和符號(hào)主義。連接主義是生物智能的解剖學(xué)基礎(chǔ),即生物神經(jīng)系統(tǒng)所包含的神經(jīng)元、神經(jīng)元的活性及其相互作用。在此之上,行為主義通過(guò)獎(jiǎng)勵(lì)/懲罰進(jìn)行自主學(xué)習(xí),強(qiáng)化學(xué)習(xí)也是人類和動(dòng)植物行為學(xué)習(xí)的主要方式。最后,符號(hào)主義極大促進(jìn)了人類的智力發(fā)育,尤其是語(yǔ)言的發(fā)明成為了人類智能遠(yuǎn)超其他生物智能的分水嶺。
以“三大主義”為基礎(chǔ),人工智能在最近五六年取得了飛速發(fā)展。目前來(lái)看,在大數(shù)據(jù)和大計(jì)算的驅(qū)動(dòng)下,深度學(xué)習(xí)已成為計(jì)算機(jī)視覺、語(yǔ)音識(shí)別與合成、自然語(yǔ)言處理和大數(shù)據(jù)分析等的主流方法。以深度卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的新一代人工智能確實(shí)帶來(lái)了更接近于人類視聽覺的感知能力。
因此,數(shù)據(jù)驅(qū)動(dòng)的方法已被視為繼實(shí)驗(yàn)科學(xué)、理論模型、模擬仿真之后的第四科學(xué)研究范式——數(shù)據(jù)驅(qū)動(dòng)的科學(xué)范式,其如同網(wǎng)絡(luò)技術(shù),已逐漸變革為一種通用賦能工具。從“互聯(lián)網(wǎng)+”到“人工智能+”,新一代人工智能已經(jīng)遠(yuǎn)遠(yuǎn)超出了計(jì)算機(jī)科學(xué)技術(shù)的范疇。
大數(shù)據(jù)和大計(jì)算讓人工智能迎來(lái)了大發(fā)展,鄧志東總結(jié)了人工智能的三大進(jìn)展。
首先是深度卷積神經(jīng)網(wǎng)絡(luò)令大數(shù)據(jù)感知智能取得突破性進(jìn)展。人工智能已經(jīng)能獲得更加接近于人類水平的視聽覺感知能力和對(duì)文本自然語(yǔ)言的模式分類能力,從而賦能產(chǎn)品、流程和服務(wù)體驗(yàn),引發(fā)了技術(shù)變革和產(chǎn)業(yè)革命。
這一領(lǐng)域最為人熟知的例子就是自動(dòng)駕駛,以全球首個(gè)自動(dòng)駕駛商用服務(wù)Waymo One為例,其估值已超千億美元。另外,在醫(yī)學(xué)影像領(lǐng)域,谷歌的人工智能深度卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)可以根據(jù)視網(wǎng)膜影像來(lái)準(zhǔn)確判斷一個(gè)人的年齡、性別、血壓、是否吸煙等,甚至可預(yù)測(cè)肺癌、乳腺癌等,達(dá)到了國(guó)際頂級(jí)醫(yī)生的診斷水平。
其次是超人類水平的AlphaGo引發(fā)全社會(huì)強(qiáng)烈關(guān)注,在此基礎(chǔ)上進(jìn)化而來(lái)的AlphaZero更是帶來(lái)了無(wú)需大數(shù)據(jù)就可自主學(xué)習(xí)的棋類通用人工智能。AlphaZero經(jīng)過(guò)8小時(shí)16.5萬(wàn)次訓(xùn)練,就擊敗了AlphaGo戰(zhàn)勝李世石的版本。
第三大進(jìn)展是對(duì)抗性神經(jīng)網(wǎng)絡(luò)帶來(lái)了超真實(shí)感的想象能力,也就是上述人工智能“創(chuàng)造”人像的案例所表現(xiàn)的。鄧志東表示,生成式對(duì)抗網(wǎng)絡(luò)(GAN)是目前最為成功的生成式神經(jīng)網(wǎng)絡(luò)模型,通過(guò)與強(qiáng)化學(xué)習(xí)及蒙特卡洛搜索等的結(jié)合,推動(dòng)了半監(jiān)督與無(wú)監(jiān)督學(xué)習(xí)方法的發(fā)展。
清華大學(xué)計(jì)算機(jī)系教授、博士生導(dǎo)師鄧志東
大數(shù)據(jù)AI的先天不足
鄧志東坦言,以大數(shù)據(jù)為燃料,喂食越多,人工智能越能獲得更好的感知直覺。但問(wèn)題隨之而來(lái),首先是對(duì)大數(shù)據(jù)的清洗和標(biāo)簽需要付出很高代價(jià)。
其次,在落地應(yīng)用中,在開放環(huán)境下,實(shí)際是不存在完備的大數(shù)據(jù)的。對(duì)于各種應(yīng)用場(chǎng)景,大數(shù)據(jù)人工智能均只能獲得較接近于人類水平的視聽覺等感知能力,這與各種基于公開測(cè)評(píng)數(shù)據(jù)集得到的性能指標(biāo)是完全不同的。簡(jiǎn)言之,人工智能或許在測(cè)試狀態(tài)下表現(xiàn)良好,但在實(shí)際落地應(yīng)用中的表現(xiàn)卻可能差強(qiáng)人意。
此外,基于深度學(xué)習(xí)的計(jì)算機(jī)視聽覺感知方法不僅依賴大數(shù)據(jù)的驅(qū)動(dòng),也缺乏人類舉一反三的,基于小樣本的學(xué)習(xí)能力和對(duì)目標(biāo)的認(rèn)知水平的理解能力,并且缺乏記憶、沒(méi)有常識(shí)、不能運(yùn)用經(jīng)驗(yàn),缺乏技巧和知識(shí)學(xué)習(xí)能力。
比如,人們開車轉(zhuǎn)彎或掉頭就是過(guò)程性經(jīng)驗(yàn)。大腦記住后,每當(dāng)轉(zhuǎn)彎就不需要再思考,而是可以條件反射地做出動(dòng)作。
人類的思維方式并不完全依靠特征提取,很多時(shí)候是靠理解和推理,但目前人工智能并不具備這樣的能力,也就不具有規(guī)劃決策和思考能力。
鄧志東把大數(shù)據(jù)人工智能面臨的挑戰(zhàn)歸結(jié)為:人工智能缺乏自己的語(yǔ)言。相比之下,語(yǔ)言卻是人類的“制勝法寶”。他表示,人類高層認(rèn)知能力其實(shí)是通過(guò)記憶語(yǔ)言去思考和推理的。記憶以及知識(shí)的運(yùn)用,都是基于語(yǔ)言的。
另外,大數(shù)據(jù)人工智能的發(fā)展,還會(huì)帶來(lái)法律、倫理、隱私安全和失業(yè)等方面的挑戰(zhàn)。
盡管當(dāng)下的人工智能還非常弱,“落地”也只能在特定應(yīng)用領(lǐng)域發(fā)揮作用,還極度依賴大數(shù)據(jù)。但隨著人工智能的進(jìn)一步發(fā)展,也就是認(rèn)知智能和通用人工智能的發(fā)展,或許會(huì)對(duì)技術(shù)與產(chǎn)業(yè)帶來(lái)變革,甚至威脅到人類的安全。
“但總體來(lái)說(shuō),現(xiàn)在的弱人工智能對(duì)于人類是賦能和有益的”,鄧志東表示。
擁有自己語(yǔ)言的下一代人工智能
對(duì)于人工智能的未來(lái)突破點(diǎn),鄧志東認(rèn)為,關(guān)鍵就在于從感知智能向認(rèn)知智能的進(jìn)化。目前人工智能主要追求看清、聽清,能夠識(shí)別但沒(méi)有理解,屬于感知智能范疇。未來(lái)人工智能的發(fā)展目標(biāo)將是如何看懂、聽懂和讀懂,從而具備基本的認(rèn)知智能,這也是從弱人工智能向通用或強(qiáng)人工智能進(jìn)化的方向。
所謂認(rèn)知智能,就是指對(duì)目標(biāo)或?qū)嶓w具有理解能力,理解事物的內(nèi)涵和外延。其發(fā)展趨勢(shì)就是要探索舉一反三的認(rèn)知智能,即以大數(shù)據(jù)感知智能+圖模型/知識(shí)圖譜為基礎(chǔ),利用圖卷積神經(jīng)網(wǎng)絡(luò)從特征學(xué)習(xí)拓展到知識(shí)學(xué)習(xí)。
而通用人工智能則包含了多任務(wù)的自主學(xué)習(xí)、自適應(yīng)與自組織能力。其發(fā)展趨勢(shì)是基于連接主義的深度神經(jīng)網(wǎng)絡(luò),通過(guò)與行為主義的強(qiáng)化學(xué)習(xí),特別是與具有學(xué)習(xí)能力的符號(hào)主義的有機(jī)結(jié)合,從AlphaZero這樣的新起點(diǎn)出發(fā),發(fā)展出具有更寬垂直領(lǐng)域的通用人工智能。
總之,通過(guò)深度學(xué)習(xí)與無(wú)監(jiān)督學(xué)習(xí)、概率或模糊圖模型知識(shí)圖譜進(jìn)行深度融合,讓下一代人工智能擁有自己的語(yǔ)言,并能根據(jù)數(shù)據(jù)和常識(shí)自主學(xué)習(xí),是探索認(rèn)知能力與通用人工智能的關(guān)鍵路徑之一。
評(píng)論