“新人類”即將誕生,AI邁入造人新時代
人工智能已經可以自動生成以假亂真的人像照片“忽悠”人類了。憑借“對抗神經網絡”,人工智能從“學習”和“識別”進化到了“創(chuàng)造”。清華大學計算機系教授、博士生導師鄧志東將此技術與深度卷積神經網絡、AlphaGo并稱為人工智能的三大發(fā)展。當然,基于大數據和大計算的人工智能也存在著“先天不足”,至少在理解和“舉一反三”方面還有很長的路要走。
本文引用地址:http://butianyuan.cn/article/201902/398019.htm一個頗為無聊的國外網站最近火了。
這一名為“此人不存在”(ThisPersonDoesNotExist)的網站沒有任何界面設計,輸入網址后顯示的只有一張人像大頭照。新奇之處就在于,每次打開或刷新頁面,顯示的照片都不同,并且都不是真實存在的人物照片。
換言之,所有照片都是隨機“生成”的,而其背后正是人工智能的支撐。可以看出,人工智能已經從“學習”和“識別”,開始進化到“想象”和“創(chuàng)造”。從網站上的照片來看,不僅實現了無限“生成”,而且還生成得不錯——人物有男有女,有老有少,不同人種、不同角度、不同表情,甚至還有眼鏡和佩飾,可謂以假亂真。
事實上,賦予人工智能想象力和創(chuàng)造力的,正是被《MIT科技評論》評為2018十大科技突破之一的“對抗神經網絡”。
據《MIT科技評論》介紹,“對抗”是指兩個神經網絡使用同一個數據集進行訓練。其中一個神經網絡叫生成網絡(the generator),它的任務就是依照所見過的圖片來生成新的圖片,而另外那個神經網絡叫判別網絡(the discriminator),它的任務則是判斷它所見得圖片是否與訓練時的圖片相似。
慢慢地,生成網絡創(chuàng)造圖片的能力會強到無法被判別網絡識破的程度。經過訓練的生成網絡學會了識別并創(chuàng)造看起來十分真實的圖片。這項技術已成為過去10年最具潛力的人工智能突破,幫助機器產生可以“忽悠”人類的成果。
生成式對抗網絡“創(chuàng)造”出的人像(現實中不存在此人)具有十足“迷惑性”
更令人驚嘆的是,這樣的“生成”還不限于圖像。清華大學計算機系教授、博士生導師鄧志東近日在上?!皬埥?019未來產業(yè)峰會”上提到:“兩個卷積神經網絡通過相互對抗,生成超分辨率真實感的原創(chuàng)圖像、聲音、3D物體或自然時序數據,這給AI帶來一種類似于人類的想象力?!?/p>
AI的三大主義與三大發(fā)展
令人嘆為觀止的人像“創(chuàng)造”背后,必然是對海量原始照片的學習。
鄧志東認為,生物智能的一個主要特征就是學習,而新一輪人工智能的鮮明特點就是學習能力。無論是生物智能還是人工智能,智能的主要特點就是感知能力、認知能力和行動能力。
追本溯源,智能的這三大特點源自連接主義、行為主義和符號主義。連接主義是生物智能的解剖學基礎,即生物神經系統(tǒng)所包含的神經元、神經元的活性及其相互作用。在此之上,行為主義通過獎勵/懲罰進行自主學習,強化學習也是人類和動植物行為學習的主要方式。最后,符號主義極大促進了人類的智力發(fā)育,尤其是語言的發(fā)明成為了人類智能遠超其他生物智能的分水嶺。
以“三大主義”為基礎,人工智能在最近五六年取得了飛速發(fā)展。目前來看,在大數據和大計算的驅動下,深度學習已成為計算機視覺、語音識別與合成、自然語言處理和大數據分析等的主流方法。以深度卷積神經網絡為基礎的新一代人工智能確實帶來了更接近于人類視聽覺的感知能力。
因此,數據驅動的方法已被視為繼實驗科學、理論模型、模擬仿真之后的第四科學研究范式——數據驅動的科學范式,其如同網絡技術,已逐漸變革為一種通用賦能工具。從“互聯網+”到“人工智能+”,新一代人工智能已經遠遠超出了計算機科學技術的范疇。
大數據和大計算讓人工智能迎來了大發(fā)展,鄧志東總結了人工智能的三大進展。
首先是深度卷積神經網絡令大數據感知智能取得突破性進展。人工智能已經能獲得更加接近于人類水平的視聽覺感知能力和對文本自然語言的模式分類能力,從而賦能產品、流程和服務體驗,引發(fā)了技術變革和產業(yè)革命。
這一領域最為人熟知的例子就是自動駕駛,以全球首個自動駕駛商用服務Waymo One為例,其估值已超千億美元。另外,在醫(yī)學影像領域,谷歌的人工智能深度卷積神經網絡已經可以根據視網膜影像來準確判斷一個人的年齡、性別、血壓、是否吸煙等,甚至可預測肺癌、乳腺癌等,達到了國際頂級醫(yī)生的診斷水平。
其次是超人類水平的AlphaGo引發(fā)全社會強烈關注,在此基礎上進化而來的AlphaZero更是帶來了無需大數據就可自主學習的棋類通用人工智能。AlphaZero經過8小時16.5萬次訓練,就擊敗了AlphaGo戰(zhàn)勝李世石的版本。
第三大進展是對抗性神經網絡帶來了超真實感的想象能力,也就是上述人工智能“創(chuàng)造”人像的案例所表現的。鄧志東表示,生成式對抗網絡(GAN)是目前最為成功的生成式神經網絡模型,通過與強化學習及蒙特卡洛搜索等的結合,推動了半監(jiān)督與無監(jiān)督學習方法的發(fā)展。
清華大學計算機系教授、博士生導師鄧志東
大數據AI的先天不足
鄧志東坦言,以大數據為燃料,喂食越多,人工智能越能獲得更好的感知直覺。但問題隨之而來,首先是對大數據的清洗和標簽需要付出很高代價。
其次,在落地應用中,在開放環(huán)境下,實際是不存在完備的大數據的。對于各種應用場景,大數據人工智能均只能獲得較接近于人類水平的視聽覺等感知能力,這與各種基于公開測評數據集得到的性能指標是完全不同的。簡言之,人工智能或許在測試狀態(tài)下表現良好,但在實際落地應用中的表現卻可能差強人意。
此外,基于深度學習的計算機視聽覺感知方法不僅依賴大數據的驅動,也缺乏人類舉一反三的,基于小樣本的學習能力和對目標的認知水平的理解能力,并且缺乏記憶、沒有常識、不能運用經驗,缺乏技巧和知識學習能力。
比如,人們開車轉彎或掉頭就是過程性經驗。大腦記住后,每當轉彎就不需要再思考,而是可以條件反射地做出動作。
人類的思維方式并不完全依靠特征提取,很多時候是靠理解和推理,但目前人工智能并不具備這樣的能力,也就不具有規(guī)劃決策和思考能力。
鄧志東把大數據人工智能面臨的挑戰(zhàn)歸結為:人工智能缺乏自己的語言。相比之下,語言卻是人類的“制勝法寶”。他表示,人類高層認知能力其實是通過記憶語言去思考和推理的。記憶以及知識的運用,都是基于語言的。
另外,大數據人工智能的發(fā)展,還會帶來法律、倫理、隱私安全和失業(yè)等方面的挑戰(zhàn)。
盡管當下的人工智能還非常弱,“落地”也只能在特定應用領域發(fā)揮作用,還極度依賴大數據。但隨著人工智能的進一步發(fā)展,也就是認知智能和通用人工智能的發(fā)展,或許會對技術與產業(yè)帶來變革,甚至威脅到人類的安全。
“但總體來說,現在的弱人工智能對于人類是賦能和有益的”,鄧志東表示。
擁有自己語言的下一代人工智能
對于人工智能的未來突破點,鄧志東認為,關鍵就在于從感知智能向認知智能的進化。目前人工智能主要追求看清、聽清,能夠識別但沒有理解,屬于感知智能范疇。未來人工智能的發(fā)展目標將是如何看懂、聽懂和讀懂,從而具備基本的認知智能,這也是從弱人工智能向通用或強人工智能進化的方向。
所謂認知智能,就是指對目標或實體具有理解能力,理解事物的內涵和外延。其發(fā)展趨勢就是要探索舉一反三的認知智能,即以大數據感知智能+圖模型/知識圖譜為基礎,利用圖卷積神經網絡從特征學習拓展到知識學習。
而通用人工智能則包含了多任務的自主學習、自適應與自組織能力。其發(fā)展趨勢是基于連接主義的深度神經網絡,通過與行為主義的強化學習,特別是與具有學習能力的符號主義的有機結合,從AlphaZero這樣的新起點出發(fā),發(fā)展出具有更寬垂直領域的通用人工智能。
總之,通過深度學習與無監(jiān)督學習、概率或模糊圖模型知識圖譜進行深度融合,讓下一代人工智能擁有自己的語言,并能根據數據和常識自主學習,是探索認知能力與通用人工智能的關鍵路徑之一。
評論