對(duì)抗性神經(jīng)網(wǎng)絡(luò)憑啥入選MIT2018十大突破性技術(shù)

作者：時(shí)間：2018-03-27 來源：科技日?qǐng)?bào)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

　　日前，《麻省理工科技評(píng)論》刊文評(píng)出了2018年十大突破性技術(shù)，“對(duì)抗性神經(jīng)網(wǎng)絡(luò)”(GAN)赫然在列。

本文引用地址：http://www.butianyuan.cn/article/201803/377429.htm

　　什么是對(duì)抗性神經(jīng)網(wǎng)絡(luò)?為什么它能入選MIT十大突破性技術(shù)?它的發(fā)展脈絡(luò)如何?與我們此前耳熟能詳?shù)纳窠?jīng)網(wǎng)絡(luò)有什么區(qū)別?能夠應(yīng)用在人工智能的哪些場(chǎng)景?還有哪些關(guān)鍵問題有待攻克?

對(duì)抗性神經(jīng)網(wǎng)絡(luò)憑啥入選MIT2018十大突破性技術(shù)

　　中國(guó)自動(dòng)化學(xué)會(huì)混合智能專委會(huì)副主任、中國(guó)人工智能學(xué)會(huì)機(jī)器學(xué)習(xí)專委會(huì)常委、復(fù)旦大學(xué)博士生導(dǎo)師張軍平教授在接受科技日?qǐng)?bào)記者采訪時(shí)做了深入淺出的解釋。

　　故事中的GAN幻影

　　張軍平告訴記者，雖然GAN是科技領(lǐng)域的“新貴”，但其實(shí)在很久以前的中外小說中就能看到這個(gè)想法的影子。

　　這個(gè)想法最早可以追溯到奧地利小說家斯蒂芬·茨威格寫于1941年的小說《象棋的故事》。

　　在該小說中，主人公B博士被長(zhǎng)期囚禁在納粹集中營(yíng)中。在想盡了各種擺脫空虛和孤獨(dú)的辦法卻徒勞無功后，B博士意外得到了一本國(guó)際象棋棋譜。

　　他背完書里的上千棋譜后，用送來的面包做了副國(guó)際象棋，開始自己跟自己下棋，最終演變成一盤接一盤的相互瘋狂挑戰(zhàn)，這令他棋力大漲。出獄后，在一艘游艇上，他居然輕松地在首盤就擊敗當(dāng)時(shí)的世界冠軍。

　　在中文小說里也有類似的影子，它出現(xiàn)在金庸寫于1957年的武俠小說《射雕英雄傳》中。

　　王重陽(yáng)的師弟周伯通被東邪“黃藥師”困在桃花島的地洞里。為了打發(fā)時(shí)間，周伯通就用左手與右手打架，自?shī)首詷贰Ｆ湮涔Q竅在于要先“左手畫圓、右手畫方”，分心二用，保證可以同時(shí)使出兩種武功，從而使得武力倍增。

　　這兩部小說主人公功力大增的關(guān)鍵都是“自己跟自己決斗，試圖傾盡全力擊敗對(duì)方”，而結(jié)果都是練成后，去跟高手過招時(shí)能輕松秒殺對(duì)手。用一句俗話來解釋，叫“雙拳難敵四手”。

　　讓機(jī)器學(xué)會(huì)“左右互搏”

　　GAN網(wǎng)絡(luò)的原理本質(zhì)上就是這兩篇小說中主人公練功的人工智能或機(jī)器學(xué)習(xí)版本。

　　一個(gè)網(wǎng)絡(luò)中有兩個(gè)角色，修煉的過程中左手扮演攻方，即生成器(generator)，試圖生成和自然世界中擬完成任務(wù)足夠相似的目標(biāo);右手扮演守方，即判別器(discriminator)，試圖把這個(gè)假的、生成的目標(biāo)和真實(shí)目標(biāo)區(qū)分開來。經(jīng)過反復(fù)多次雙手互搏，左手右手的功力都會(huì)倍增，從而達(dá)到“舍我其誰”的目標(biāo)。

　　明白這個(gè)道理，就不難明白為什么GAN網(wǎng)絡(luò)一出，就有獨(dú)孤求敗的感覺了。

　　正是因?yàn)镚AN網(wǎng)絡(luò)的機(jī)理是“雙手互搏、一心兩用”，所以，雖然最初的應(yīng)用場(chǎng)景是針對(duì)圖像相關(guān)任務(wù)，但其機(jī)理是普適性的。只要能用這個(gè)“訣竅”的地方，都能把自己的功力提升一個(gè)檔次。不過，需要注意的是，GAN只把雙手互搏用來訓(xùn)練自己“雙手”的功力。在多數(shù)實(shí)際應(yīng)用中，它只用了自己千錘百煉出來的生成器，就得到了非常好的結(jié)果。

　　于是，自2014年GAN網(wǎng)絡(luò)被Ian J. Goodfellow等人提出，至今其演繹出的各種版本就像攻城掠地般在各個(gè)領(lǐng)域蔓延。

　　在今年的人工智能頂級(jí)會(huì)議IJCAI、機(jī)器學(xué)習(xí)頂級(jí)會(huì)議ICML和NIPS、深度學(xué)習(xí)著名會(huì)議ICLR上，光讀參會(huì)論文的標(biāo)題，就能發(fā)現(xiàn)大量GAN網(wǎng)絡(luò)的工作痕跡。圖像處理、計(jì)算機(jī)視覺、自然語言處理、語音識(shí)別、智能駕駛、安全監(jiān)控……似乎GAN已經(jīng)無所不能了。

　　張軍平用幾個(gè)比較火的人工智能應(yīng)用場(chǎng)景舉例——

　　在年齡估計(jì)中，GAN能通過攻守互搏，基于給定的人臉圖像實(shí)現(xiàn)對(duì)其人衰老或年輕時(shí)的樣貌生成。

　　在多視角人臉識(shí)別、跨視角步態(tài)識(shí)別領(lǐng)域，采用類似的機(jī)理，實(shí)現(xiàn)對(duì)人臉角度和步態(tài)角度的自動(dòng)旋轉(zhuǎn)，從而有效提高了多視角、跨視角人臉和步態(tài)識(shí)別的精度。

　　在自動(dòng)駕駛領(lǐng)域，需要對(duì)智能汽車進(jìn)行復(fù)雜環(huán)境下的虛擬訓(xùn)練。此時(shí)，就可以利用GAN來實(shí)現(xiàn)與實(shí)際交通場(chǎng)景分布一致的圖像生成。具體來說，可以先給GAN輸入一張隨機(jī)噪聲圖像，通過其生成器來最小化與真實(shí)場(chǎng)景接近的圖像，同時(shí)判別器最大化生成場(chǎng)景與真實(shí)場(chǎng)景間的差異。經(jīng)過反復(fù)迭代的攻守博弈，從而獲得與真實(shí)環(huán)境一致的交通場(chǎng)景。

　　“不光在應(yīng)用領(lǐng)域上有了突破，互搏的方式也有了不少變化。既然可以雙手互搏，那當(dāng)然可以三手甚至更多手的互搏，也可以組團(tuán)逐對(duì)互搏、成串互搏，諸如此類。還可以把圓和方換成其他東西或者所謂的函數(shù)或結(jié)構(gòu)來互搏。但萬變不離其宗，內(nèi)在的機(jī)理是不變的。”張軍平補(bǔ)充道。

　　GAN有什么“軟肋”

　　“毫無疑問，這種可倍增‘功力’的技術(shù)入選MIT年度十大突破性技術(shù)是當(dāng)之無愧的。但值得注意的是，這一技術(shù)仍然有較大需要改善的空間。”作為《IEEE Intelligent System》(智能系統(tǒng))和《IEEE Transactions on Intelligent Transportation Systems 》(智能交通系統(tǒng))等著名期刊的編委，張軍平對(duì)GAN的“軟肋”了如指掌——

　　首先，對(duì)抗不好是容易出問題的。比如那位B博士。國(guó)棋象棋的世界冠軍在覺察到他的強(qiáng)烈焦躁與急切情緒后，就有意識(shí)地放慢下棋速度。結(jié)果誘發(fā)了B博士的精神分裂，使得他再次陷入狂亂的自我對(duì)弈之中，最終才幡然醒悟而告別了棋局。對(duì)抗網(wǎng)也是如此，穩(wěn)定性一直是其存在的問題之一。盡管理論上Wasserstein GAN (WGAN)可以部分解決其收斂性問題，但實(shí)際的效果還沒有達(dá)到盡人意的地步。

　　其次，槍打出頭鳥，既然這項(xiàng)技術(shù)這么牛了，過來挑戰(zhàn)的也不少。據(jù)不完全報(bào)告，似乎已經(jīng)有十五波“武林高手”對(duì)GAN網(wǎng)絡(luò)的抗擊打能力進(jìn)行了挑戰(zhàn)。極端情況，在圖像中加一個(gè)像素就可能使GAN網(wǎng)絡(luò)產(chǎn)生誤判。

　　第三，GAN網(wǎng)絡(luò)也是深度網(wǎng)絡(luò)的一種，在可解釋性這條路上，仍然沒有找到非常明確的方向。

　　最后，雙手互搏的基礎(chǔ)還是手。而這一基礎(chǔ)的結(jié)構(gòu)并沒有從近幾十年來人工智能發(fā)展的框架中脫離出來。

　　因此，張軍平提醒，期望以GAN之奇技，從弱人工智能沖擊“能真正推理和解決問題，且有知覺、有自主意識(shí)的”的強(qiáng)人工智能還遙遙無期。

新聞中心

對(duì)抗性神經(jīng)網(wǎng)絡(luò)憑啥入選MIT2018十大突破性技術(shù)

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)