“新人類”即將誕生 AI邁入造人新時代

作者：時間：2019-03-05 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

　　算力說

本文引用地址：http://www.butianyuan.cn/article/201903/398217.htm

　　人工智能已經(jīng)可以自動生成以假亂真的人像照片“忽悠”人類了。憑借“對抗神經(jīng)網(wǎng)絡(luò)”，人工智能從“學(xué)習(xí)”和“識別”進化到了“創(chuàng)造”。清華大學(xué)計算機系教授、博士生導(dǎo)師鄧志東將此技術(shù)與深度卷積神經(jīng)網(wǎng)絡(luò)、AlphaGo并稱為人工智能的三大發(fā)展。當然，基于大數(shù)據(jù)和大計算的人工智能也存在著“先天不足”，至少在理解和“舉一反三”方面還有很長的路要走。

　　一個頗為無聊的國外網(wǎng)站最近火了。

　　這一名為“此人不存在”(ThisPersonDoesNotExist)的網(wǎng)站沒有任何界面設(shè)計，輸入網(wǎng)址后顯示的只有一張人像大頭照。新奇之處就在于，每次打開或刷新頁面，顯示的照片都不同，并且都不是真實存在的人物照片。

　　換言之，所有照片都是隨機“生成”的，而其背后正是人工智能的支撐?？梢钥闯?，人工智能已經(jīng)從“學(xué)習(xí)”和“識別”，開始進化到“想象”和“創(chuàng)造”。從網(wǎng)站上的照片來看，不僅實現(xiàn)了無限“生成”，而且還生成得不錯——人物有男有女，有老有少，不同人種、不同角度、不同表情，甚至還有眼鏡和佩飾，可謂以假亂真。

　　事實上，賦予人工智能想象力和創(chuàng)造力的，正是被《MIT科技評論》評為2018十大科技突破之一的“對抗神經(jīng)網(wǎng)絡(luò)”。

　　據(jù)《MIT科技評論》介紹，“對抗”是指兩個神經(jīng)網(wǎng)絡(luò)使用同一個數(shù)據(jù)集進行訓(xùn)練。其中一個神經(jīng)網(wǎng)絡(luò)叫生成網(wǎng)絡(luò)(the generator)，它的任務(wù)就是依照所見過的圖片來生成新的圖片，而另外那個神經(jīng)網(wǎng)絡(luò)叫判別網(wǎng)絡(luò)(the discriminator)，它的任務(wù)則是判斷它所見得圖片是否與訓(xùn)練時的圖片相似。

　　慢慢地，生成網(wǎng)絡(luò)創(chuàng)造圖片的能力會強到無法被判別網(wǎng)絡(luò)識破的程度。經(jīng)過訓(xùn)練的生成網(wǎng)絡(luò)學(xué)會了識別并創(chuàng)造看起來十分真實的圖片。這項技術(shù)已成為過去10年最具潛力的人工智能突破，幫助機器產(chǎn)生可以“忽悠”人類的成果。

　　生成式對抗網(wǎng)絡(luò)“創(chuàng)造”出的人像(現(xiàn)實中不存在此人)具有十足“迷惑性”

　　更令人驚嘆的是，這樣的“生成”還不限于圖像。清華大學(xué)計算機系教授、博士生導(dǎo)師鄧志東近日在上?！皬埥?019未來產(chǎn)業(yè)峰會”上提到：“兩個卷積神經(jīng)網(wǎng)絡(luò)通過相互對抗，生成超分辨率真實感的原創(chuàng)圖像、聲音、3D物體或自然時序數(shù)據(jù)，這給AI帶來一種類似于人類的想象力?！?/p>

　　AI的三大主義與三大發(fā)展

　　令人嘆為觀止的人像“創(chuàng)造”背后，必然是對海量原始照片的學(xué)習(xí)。

　　鄧志東認為，生物智能的一個主要特征就是學(xué)習(xí)，而新一輪人工智能的鮮明特點就是學(xué)習(xí)能力。無論是生物智能還是人工智能，智能的主要特點就是感知能力、認知能力和行動能力。

　　追本溯源，智能的這三大特點源自連接主義、行為主義和符號主義。連接主義是生物智能的解剖學(xué)基礎(chǔ)，即生物神經(jīng)系統(tǒng)所包含的神經(jīng)元、神經(jīng)元的活性及其相互作用。在此之上，行為主義通過獎勵/懲罰進行自主學(xué)習(xí)，強化學(xué)習(xí)也是人類和動植物行為學(xué)習(xí)的主要方式。最后，符號主義極大促進了人類的智力發(fā)育，尤其是語言的發(fā)明成為了人類智能遠超其他生物智能的分水嶺。

　　以“三大主義”為基礎(chǔ)，人工智能在最近五六年取得了飛速發(fā)展。目前來看，在大數(shù)據(jù)和大計算的驅(qū)動下，深度學(xué)習(xí)已成為計算機視覺、語音識別與合成、自然語言處理和大數(shù)據(jù)分析等的主流方法。以深度卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的新一代人工智能確實帶來了更接近于人類視聽覺的感知能力。

　　因此，數(shù)據(jù)驅(qū)動的方法已被視為繼實驗科學(xué)、理論模型、模擬仿真之后的第四科學(xué)研究范式——數(shù)據(jù)驅(qū)動的科學(xué)范式，其如同網(wǎng)絡(luò)技術(shù)，已逐漸變革為一種通用賦能工具。從“互聯(lián)網(wǎng)+”到“人工智能+”，新一代人工智能已經(jīng)遠遠超出了計算機科學(xué)技術(shù)的范疇。

　　大數(shù)據(jù)和大計算讓人工智能迎來了大發(fā)展，鄧志東總結(jié)了人工智能的三大進展。

　　首先是深度卷積神經(jīng)網(wǎng)絡(luò)令大數(shù)據(jù)感知智能取得突破性進展。人工智能已經(jīng)能獲得更加接近于人類水平的視聽覺感知能力和對文本自然語言的模式分類能力，從而賦能產(chǎn)品、流程和服務(wù)體驗，引發(fā)了技術(shù)變革和產(chǎn)業(yè)革命。

　　這一領(lǐng)域最為人熟知的例子就是自動駕駛，以全球首個自動駕駛商用服務(wù)Waymo One為例，其估值已超千億美元。另外，在醫(yī)學(xué)影像領(lǐng)域，谷歌的人工智能深度卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)可以根據(jù)視網(wǎng)膜影像來準確判斷一個人的年齡、性別、血壓、是否吸煙等，甚至可預(yù)測肺癌、乳腺癌等，達到了國際頂級醫(yī)生的診斷水平。

　　其次是超人類水平的AlphaGo引發(fā)全社會強烈關(guān)注，在此基礎(chǔ)上進化而來的AlphaZero更是帶來了無需大數(shù)據(jù)就可自主學(xué)習(xí)的棋類通用人工智能。AlphaZero經(jīng)過8小時16.5萬次訓(xùn)練，就擊敗了AlphaGo戰(zhàn)勝李世石的版本。

　　第三大進展是對抗性神經(jīng)網(wǎng)絡(luò)帶來了超真實感的想象能力，也就是上述人工智能“創(chuàng)造”人像的案例所表現(xiàn)的。鄧志東表示，生成式對抗網(wǎng)絡(luò)(GAN)是目前最為成功的生成式神經(jīng)網(wǎng)絡(luò)模型，通過與強化學(xué)習(xí)及蒙特卡洛搜索等的結(jié)合，推動了半監(jiān)督與無監(jiān)督學(xué)習(xí)方法的發(fā)展。

　　清華大學(xué)計算機系教授、博士生導(dǎo)師鄧志東

　　大數(shù)據(jù)AI的先天不足

　　鄧志東坦言，以大數(shù)據(jù)為燃料，喂食越多，人工智能越能獲得更好的感知直覺。但問題隨之而來，首先是對大數(shù)據(jù)的清洗和標簽需要付出很高代價。

　　其次，在落地應(yīng)用中，在開放環(huán)境下，實際是不存在完備的大數(shù)據(jù)的。對于各種應(yīng)用場景，大數(shù)據(jù)人工智能均只能獲得較接近于人類水平的視聽覺等感知能力，這與各種基于公開測評數(shù)據(jù)集得到的性能指標是完全不同的。簡言之，人工智能或許在測試狀態(tài)下表現(xiàn)良好，但在實際落地應(yīng)用中的表現(xiàn)卻可能差強人意。

　　此外，基于深度學(xué)習(xí)的計算機視聽覺感知方法不僅依賴大數(shù)據(jù)的驅(qū)動，也缺乏人類舉一反三的，基于小樣本的學(xué)習(xí)能力和對目標的認知水平的理解能力，并且缺乏記憶、沒有常識、不能運用經(jīng)驗，缺乏技巧和知識學(xué)習(xí)能力。

　　比如，人們開車轉(zhuǎn)彎或掉頭就是過程性經(jīng)驗。大腦記住后，每當轉(zhuǎn)彎就不需要再思考，而是可以條件反射地做出動作。

　　人類的思維方式并不完全依靠特征提取，很多時候是靠理解和推理，但目前人工智能并不具備這樣的能力，也就不具有規(guī)劃決策和思考能力。

　　鄧志東把大數(shù)據(jù)人工智能面臨的挑戰(zhàn)歸結(jié)為：人工智能缺乏自己的語言。相比之下，語言卻是人類的“制勝法寶”。他表示，人類高層認知能力其實是通過記憶語言去思考和推理的。記憶以及知識的運用，都是基于語言的。

　　另外，大數(shù)據(jù)人工智能的發(fā)展，還會帶來法律、倫理、隱私安全和失業(yè)等方面的挑戰(zhàn)。

　　盡管當下的人工智能還非常弱，“落地”也只能在特定應(yīng)用領(lǐng)域發(fā)揮作用，還極度依賴大數(shù)據(jù)。但隨著人工智能的進一步發(fā)展，也就是認知智能和通用人工智能的發(fā)展，或許會對技術(shù)與產(chǎn)業(yè)帶來變革，甚至威脅到人類的安全。

　　“但總體來說，現(xiàn)在的弱人工智能對于人類是賦能和有益的”，鄧志東表示。

　　擁有自己語言的下一代人工智能

　　對于人工智能的未來突破點，鄧志東認為，關(guān)鍵就在于從感知智能向認知智能的進化。目前人工智能主要追求看清、聽清，能夠識別但沒有理解，屬于感知智能范疇。未來人工智能的發(fā)展目標將是如何看懂、聽懂和讀懂，從而具備基本的認知智能，這也是從弱人工智能向通用或強人工智能進化的方向。

　　所謂認知智能，就是指對目標或?qū)嶓w具有理解能力，理解事物的內(nèi)涵和外延。其發(fā)展趨勢就是要探索舉一反三的認知智能，即以大數(shù)據(jù)感知智能+圖模型/知識圖譜為基礎(chǔ)，利用圖卷積神經(jīng)網(wǎng)絡(luò)從特征學(xué)習(xí)拓展到知識學(xué)習(xí)。

　　而通用人工智能則包含了多任務(wù)的自主學(xué)習(xí)、自適應(yīng)與自組織能力。其發(fā)展趨勢是基于連接主義的深度神經(jīng)網(wǎng)絡(luò)，通過與行為主義的強化學(xué)習(xí)，特別是與具有學(xué)習(xí)能力的符號主義的有機結(jié)合，從AlphaZero這樣的新起點出發(fā)，發(fā)展出具有更寬垂直領(lǐng)域的通用人工智能。

　　總之，通過深度學(xué)習(xí)與無監(jiān)督學(xué)習(xí)、概率或模糊圖模型知識圖譜進行深度融合，讓下一代人工智能擁有自己的語言，并能根據(jù)數(shù)據(jù)和常識自主學(xué)習(xí)，是探索認知能力與通用人工智能的關(guān)鍵路徑之一。

新聞中心

“新人類”即將誕生 AI邁入造人新時代

評論

相關(guān)推薦

技術(shù)專區(qū)