中國AI研究超美國?專家:比如深度學(xué)習(xí)已發(fā)文章數(shù)
當(dāng)今世界人工智能領(lǐng)域,有三位頂級(jí)專家被業(yè)內(nèi)奉為“神一樣的人物”,其中兩位來自加拿大,一位來自法國。他們分別是加拿大多倫多大學(xué)的GeoffreyHinton和蒙特利爾大學(xué)的終身教授YoshuaBengio,以及Facebook人工智能研究部門(FAIR)負(fù)責(zé)人YannLeCun(下稱“LeCun”)——這位來自巴黎的學(xué)者目前擔(dān)任紐約大學(xué)終身教授,他還是紐約大學(xué)數(shù)據(jù)科學(xué)中心的創(chuàng)始人。
本文引用地址:http://butianyuan.cn/article/201704/358402.htmYannLeCun在今年3月走進(jìn)中國的大學(xué),在清華大學(xué)和上海紐約大學(xué)分別進(jìn)行了兩場人工智能的頂尖對話,并接受了第一財(cái)經(jīng)記者的獨(dú)家專訪。
讓機(jī)器擁有常識(shí)
LeCun是法國學(xué)界非常引以為豪的科學(xué)家,也是在美國科技巨頭公司中擔(dān)任要職的為數(shù)不多的法國人。雖然同為“極客”,但法國人獨(dú)特的氣質(zhì)讓LeCun和很多美國科學(xué)家相比,看起來更加隨意、富有親和力。
1987年LeCun從巴黎第六代大學(xué)的計(jì)算機(jī)系畢業(yè)后,就去了多倫多大學(xué)讀博士后,師從“神經(jīng)網(wǎng)絡(luò)之父”GeoffreyHinton,Hinton也是將深度學(xué)習(xí)技術(shù)帶入谷歌的人。博士后研究結(jié)束后,LeCun就一直工作生活在美國,先后任職于貝爾實(shí)驗(yàn)室、AT&T等大公司。2008年他創(chuàng)立了一家從事大數(shù)據(jù)挖掘的咨詢公司YLC,直到目前,他還擔(dān)任他所創(chuàng)立的另一家從事音樂制作和教育公司的首席科學(xué)官。
目前LeCun領(lǐng)導(dǎo)著Facebook人工智能研究部門近百人的團(tuán)隊(duì)。他的工作是推進(jìn)人工智能的基礎(chǔ)科學(xué)與技術(shù)研究;通過實(shí)驗(yàn)來發(fā)展人工智能技術(shù)在各個(gè)領(lǐng)域中的實(shí)際應(yīng)用,如計(jì)算機(jī)視覺、人機(jī)對話系統(tǒng)、虛擬助手、語音識(shí)別和自然語言處理(NLP)等。
“人工智能的背后存在很多基礎(chǔ)科學(xué),它們也許并不面向應(yīng)用,你的研究可能只是通向?qū)χ悄芎腿斯ぶ悄艿睦斫狻?rdquo;LeCun對第一財(cái)經(jīng)記者表示。
LeCun開辟了將神經(jīng)網(wǎng)絡(luò)運(yùn)用于機(jī)器視覺的先例。五年前,其帶領(lǐng)研究人員在圖像識(shí)別的準(zhǔn)確性上,取得了巨大的突破,這背后的技術(shù)——人工神經(jīng)網(wǎng)絡(luò),促成了近年來人工智能的繁榮,也使得谷歌和Facebook得以讓人們在自己的相冊中使用搜索功能,并促成了一批使用面部識(shí)別的應(yīng)用程序問世。
訓(xùn)練機(jī)器如何學(xué)習(xí)是LeCun的團(tuán)隊(duì)最重要的工作。過去很長一段時(shí)間,他們給機(jī)器“喂”了成千上萬張圖片,來教會(huì)機(jī)器區(qū)分諸如“汽車”和“小狗”。不過LeCun在這個(gè)過程中也拋出了新的問題:當(dāng)有大量可用樣本(比如桌椅、貓狗和人)時(shí),訓(xùn)練機(jī)器沒有問題;但如果機(jī)器從來沒有見過這些實(shí)物,它還能識(shí)別出樣本嗎?
LeCun表示,人工智能發(fā)展的一大難題就是怎么樣才能讓機(jī)器掌握人類常識(shí),這是讓機(jī)器和人類自然互動(dòng)的關(guān)鍵。想要做到這一點(diǎn),它需要擁有一個(gè)內(nèi)在模型,以具備預(yù)測的能力。LeCun用一個(gè)公式簡潔地概括了這種人工智能系統(tǒng):預(yù)測+規(guī)劃=推理。而研究人員現(xiàn)在要做的,就是不需依賴人類訓(xùn)練,讓機(jī)器學(xué)會(huì)自己構(gòu)建這個(gè)內(nèi)在模型。
“人們花了很多年來研究如何給圖片和視頻自動(dòng)加入字幕或描述,從目前的技術(shù)來看,確實(shí)也已經(jīng)出現(xiàn)了令人印象深刻的實(shí)現(xiàn)方式。”LeCun對第一財(cái)經(jīng)記者表示,“但實(shí)際上,它們并沒有看起來的那么令人驚艷,那些機(jī)器的專業(yè)上很大程度受限于人們訓(xùn)練它的環(huán)境。你如果向機(jī)器展現(xiàn)非常規(guī)的情況,大多數(shù)機(jī)器就會(huì)不知所措,因?yàn)樗鼈儾痪邆涑WR(shí)。”
LeCun認(rèn)為,在機(jī)器視覺領(lǐng)域還有很大的進(jìn)步空間,機(jī)器視覺的下一個(gè)突破將會(huì)是以自主觀察世界的方式進(jìn)行學(xué)習(xí),比如通過觀看視頻來進(jìn)行學(xué)習(xí)。這也意味著未來計(jì)算機(jī)可能會(huì)像嬰兒學(xué)習(xí)那樣掌握常識(shí)性的知識(shí)。
關(guān)于機(jī)器視覺如何與常識(shí)相聯(lián)系,LeCun說,就連Facebook內(nèi)部也有很大分歧。“一些人認(rèn)為可以與智能系統(tǒng)只進(jìn)行語言交流,但是語言是一個(gè)相當(dāng)?shù)蛶?lowbandwidth)的渠道,信息密度很低。語言之所以能承載很多信息,是因?yàn)槿藗儞碛写罅康谋尘爸R(shí),也就是常識(shí),來幫助他們理解這些信息。”LeCun解釋道。
一些人工智能科學(xué)家認(rèn)為,給人工智能系統(tǒng)提供足夠信息的唯一方式是加入視覺認(rèn)知,因?yàn)橛跋駮?huì)比語言的信息密度高得多。比如,你告訴機(jī)器“這是一部智能手機(jī)”,“這是一輛壓路機(jī)”,“有些東西你可以推動(dòng)它而有些不可以”等等,也許機(jī)器能夠?qū)W會(huì)這個(gè)世界的基礎(chǔ)運(yùn)作原理。對此,LeCun表示:“這跟嬰兒的學(xué)習(xí)方式類似。然而,幼兒在學(xué)習(xí)很多事情的時(shí)候并不需要明確的指示。”LeCun認(rèn)為在沒有指導(dǎo)的過程中的學(xué)習(xí)才是他想要達(dá)到的。
他表示,F(xiàn)acebook很想做到的一點(diǎn)是,讓機(jī)器通過觀看視頻或觀察其他東西來認(rèn)識(shí)現(xiàn)實(shí)世界中的很多局限性,這最終會(huì)讓它們建立起常識(shí)。“目前機(jī)器還十分好騙,那是因?yàn)樗鼈儗@個(gè)世界缺乏基本理解。”LeCun說,“比如將來你給機(jī)器看一小段視頻,然后機(jī)器就能預(yù)測接下來會(huì)發(fā)生什么。如果我們能訓(xùn)練系統(tǒng)做到這一點(diǎn),那么我們就已經(jīng)創(chuàng)造了無監(jiān)管指導(dǎo)的機(jī)器學(xué)習(xí)的核心技術(shù)。這是我們?nèi)斯ぶ悄芎陥D的重要組成部分。”
卷積神經(jīng)網(wǎng)絡(luò)
在超過20年的研究歷程中,LeCun累計(jì)發(fā)表了超過180篇論文,他最廣為人知的研究是1988年參與開發(fā)著名的卷積神經(jīng)網(wǎng)絡(luò)(convolutionalneuralnetwork,CNN),因此LeCun在業(yè)內(nèi)也被稱為“卷積神經(jīng)網(wǎng)絡(luò)之父”。
卷積神經(jīng)網(wǎng)絡(luò)是近年發(fā)展起來的一種高效識(shí)別方法。其最初的概念形成要追溯到上世紀(jì)60年代,科研人員在研究貓腦皮層中用于局部敏感和方向選擇的神經(jīng)元時(shí),發(fā)現(xiàn)其獨(dú)特的網(wǎng)絡(luò)結(jié)構(gòu)可以有效降低反饋神經(jīng)網(wǎng)絡(luò)的復(fù)雜性,繼而提出了卷積神經(jīng)網(wǎng)絡(luò)。
現(xiàn)在,卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)成為眾多科學(xué)領(lǐng)域的研究熱點(diǎn)之一,特別是在模式分類領(lǐng)域,由于該網(wǎng)絡(luò)避免了對圖像的復(fù)雜前期預(yù)處理,可以直接輸入原始圖像,得到了更為廣泛的應(yīng)用。這種革命性的系統(tǒng)從一開始能夠識(shí)別手寫數(shù)字,并且隨著數(shù)據(jù)訓(xùn)練的不斷持續(xù),能夠開始從圖片像素中識(shí)別視覺特征,這就像為計(jì)算機(jī)打開了雙眼,讓它們可以從數(shù)據(jù)中自我學(xué)習(xí)。
LeCun對第一財(cái)經(jīng)記者表示:“如今深度卷積網(wǎng)絡(luò)已可用于解決包括目標(biāo)識(shí)別在內(nèi)的各類計(jì)算機(jī)視覺問題。并且,隨著網(wǎng)絡(luò)深度不斷增加,還出現(xiàn)了可用于圖像識(shí)別、語義分割、ADAS等眾多場景的新型深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。”
Facebook目前正在使用機(jī)器學(xué)習(xí)實(shí)現(xiàn)一系列不同的功能,這些功能包括人臉識(shí)別,機(jī)器能從網(wǎng)上識(shí)別出人臉,即使這個(gè)人的臉未被標(biāo)注,因?yàn)檫@一技術(shù)是基于模擬人腦的神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的。
這些網(wǎng)絡(luò)能夠被訓(xùn)練,并識(shí)別信息中的模式,包括語言、文字?jǐn)?shù)據(jù)或者視覺圖像,也是近幾年來大量的人工智能研發(fā)的基礎(chǔ)。機(jī)器系統(tǒng)的下一步任務(wù)將是通過觀察現(xiàn)實(shí)世界,學(xué)習(xí)世界的運(yùn)作方式,其中一種方法是通過與智能手機(jī)和可穿戴技術(shù)的互動(dòng)來學(xué)習(xí)。
從事人工智能領(lǐng)域研究20多年來,LeCun的目標(biāo)就一直是希望賦予機(jī)器更大的能力,讓機(jī)器變得更加聰明。他對第一財(cái)經(jīng)記者表示,在Facebook還有很多想做的事情,還有很多使命尚待完成。“我希望能在Facebook看到新技術(shù)的應(yīng)用,讓我們的研究變得更有意義,通過提升機(jī)器的深度學(xué)習(xí)能力,將它變成智能機(jī)器。”
LeCun還認(rèn)為人工智能未來能夠無所不能,包括預(yù)測人們的行為。“機(jī)器的下一步是能夠通過觀察現(xiàn)實(shí)世界的萬物來進(jìn)行學(xué)習(xí),并且預(yù)測。”LeCun在最新發(fā)布的推特和Facebook中,多次強(qiáng)調(diào)“無需監(jiān)管和指導(dǎo)(unsupervised)的機(jī)器人前景可觀”。
他認(rèn)為,在進(jìn)入到人工智能下一個(gè)階段的突破時(shí),F(xiàn)acebook面臨的最大挑戰(zhàn)將是如何通過機(jī)器學(xué)習(xí)將最好的內(nèi)容與個(gè)人需求相匹配。去年4月,F(xiàn)acebook在F8大會(huì)上推出了Chatbot聊天機(jī)器人,能夠幫助人們完成訂餐和行程安排等任務(wù)。在LeCun看來,聊天機(jī)器人的終極目標(biāo)是成為個(gè)人的虛擬助理,通過人工智能技術(shù)來連接人類和現(xiàn)實(shí)世界,執(zhí)行日常生活中的任務(wù)。
LeCun對第一財(cái)經(jīng)記者表示:“盡管短期我們還只能從一些簡單的功能應(yīng)用開始做,但我們的遠(yuǎn)期目標(biāo)是建立一個(gè)真正的智能機(jī)器,讓你可以與它直接對話,它需要能回答任何問題,并對你的生活提供幫助。這件事對于當(dāng)今的人工智能而言非常具有挑戰(zhàn)性,人機(jī)對話系統(tǒng)、自然語言處理,所有這些的基礎(chǔ)在于讓機(jī)器學(xué)會(huì)人類的常識(shí)。我們現(xiàn)在還不知道到底應(yīng)該怎么做,但我們對此有很多想法。”
人工智能是長期投資
針對目前全球科技巨頭在人工智能方面的激烈競逐,LeCun對第一財(cái)經(jīng)記者表示:“沒有誰跑在前面。許多公司都在做著大量的人工智能研發(fā),對于人才的競爭也很激烈,但現(xiàn)在并沒有誰發(fā)明了遠(yuǎn)遠(yuǎn)領(lǐng)先于其他公司的新技術(shù)。”他補(bǔ)充道,沒有哪家公司的新技術(shù)是需要?jiǎng)e人花費(fèi)三個(gè)月以上才能趕上的,大家的水平都很接近。處于第一梯隊(duì)的包括Facebook、谷歌的DeepMind、微軟和IBM。
對DeepMind發(fā)明的AlphaGo取得的成功,他表示:“這是人工智能領(lǐng)域的偉大勝利,我的一些學(xué)生和博士后參與了DeepMind的項(xiàng)目,這一成就建立在所有人的努力之上。”事實(shí)上,分析圍棋棋盤并決定落子位置的系統(tǒng)實(shí)際上正是LeCun發(fā)明的卷積神經(jīng)網(wǎng)絡(luò)。不過他也承認(rèn),F(xiàn)acebook對圍棋的研究并不多,和DeepMind的系統(tǒng)相比體量相差很多。“我們的圍棋研究主要作為計(jì)劃和勘探研究的載體。我們的系統(tǒng)工作得不錯(cuò),然后我們把它開源了。”
在人工智能的商業(yè)化方面,LeCun表示:“基礎(chǔ)研究的影響在比較長時(shí)間后才能體現(xiàn)出來。你不能幻想種下一顆種子,然后就突然冒出了實(shí)體產(chǎn)品線,商業(yè)形式就能發(fā)生徹底改變。這是一種長期投資,它需要的是有遠(yuǎn)見的人,這樣的人谷歌有,F(xiàn)acebook也有。”
Facebook最近傳出正在組建消費(fèi)品部門的消息,對此LeCun向第一財(cái)經(jīng)予以證實(shí),不過他表示,新部門與他所負(fù)責(zé)的人工智能部門是兩個(gè)獨(dú)立的團(tuán)隊(duì),并沒有直接的聯(lián)系。Facebook確實(shí)在研發(fā)消費(fèi)市場的人工智能技術(shù),有些是軟件應(yīng)用,有些是硬件,比如AR、VR和機(jī)器人等。“我們正在打造一個(gè)人工智能的生態(tài)系統(tǒng),能夠?qū)⒏鱾€(gè)部件與人的生活相連接。”
LeCun主張研究成果的開放,讓更多人了解自己正在從事的研究。他表示:“要和大學(xué)實(shí)驗(yàn)室保持良好關(guān)系,讓這些機(jī)構(gòu)為你輸出各類人才,進(jìn)行各種可能的研究,就必須要開放項(xiàng)目和成果。假設(shè)你是一名科研人員,你肯定總是想公開發(fā)表你的研究成果,對于科學(xué)家來說這很重要,因?yàn)槟愕牡匚辉谟趯W(xué)術(shù)影響。你不能簡單地告訴人們‘我正在為Facebook工作,但我不能告訴你們我在研究什么’,這樣你的職業(yè)生涯就毀了,這很重要。”
人工智能科普大使
機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等人工智能范疇的概念已經(jīng)開始逐漸被普通人接受,但真正要理解和表達(dá),對大多數(shù)人來說仍然十分困難。為此,LeCun近年來頻頻走進(jìn)全球高校,積極推動(dòng)人工智能方面的科普工作,他對第一財(cái)經(jīng)記者表示:“幫助公眾理解人工智能,對于推動(dòng)整個(gè)行業(yè)的發(fā)展非常重要。”
在中國的行程中,LeCun還參觀了中科院模式識(shí)別國家實(shí)驗(yàn)室。他在Facebook中發(fā)布的一張和中科院科研人員的合影中寫道:“很高興得知中國已經(jīng)有了多個(gè)人工智能的國家級(jí)項(xiàng)目。”
他表示:“中國海外投資是很有意思的現(xiàn)象,中國公司的投資途徑基本上是先在本土建立生態(tài)圈,再逐漸滲透到國外,進(jìn)行海外擴(kuò)張。事實(shí)上當(dāng)我們看到越來越多中國企業(yè)投資海外項(xiàng)目時(shí),也應(yīng)該看到很多歐洲和美國的企業(yè)正在投資中國的人工智能領(lǐng)域。這種資本的流動(dòng)是技術(shù)發(fā)展的必然。”
LeCun還表示,在一些人工智能的領(lǐng)域,中國已經(jīng)超過美國領(lǐng)先全球。比如在深度學(xué)習(xí)方面,根據(jù)去年11月美國政府發(fā)布的報(bào)告,中國發(fā)表的文章已經(jīng)超過美國。
但是和美國的科技巨頭相比,中國的研究和技術(shù)仍然有差距。LeCun認(rèn)為,兩國的人工智能科研實(shí)驗(yàn)室存在很大差別,“Facebook和谷歌DeepMind的人工智能實(shí)驗(yàn)室真的是研究非常超前的東西,比如預(yù)測學(xué)習(xí)和人工智能的未來趨勢,這是我在其他任何公司都沒有看到過的。”
盡管人工智能在中國的應(yīng)用已經(jīng)無處不在,從緩解城市交通擁堵,到為司法系統(tǒng)注入透明度。但是現(xiàn)在中國面臨的最大問題是專業(yè)人才緊缺。
針對人工智能領(lǐng)域激烈的人才競爭,LeCun表示:“中國占全球五分之一人口,這里擁有非常多的人才,扎克伯格非常重視中國市場。我們也和中國的大學(xué)和院校進(jìn)行人工智能以及很多其他方面的基礎(chǔ)研究合作,這對Facebook是有深刻意義的,但這不是說我們已經(jīng)在中國開展業(yè)務(wù)了。”
人工智能的快速發(fā)展,不斷帶來驚喜的同時(shí),也引發(fā)了各種擔(dān)憂。有一種擔(dān)憂認(rèn)為Facebook正在使用人工智能去監(jiān)視人們的行為。另外,隨著人工智能的迅速增長,很多人擔(dān)心機(jī)器人很快就會(huì)代替人類,甚至掌管整個(gè)世界。
LeCun表示:大可不必如此擔(dān)心。“盡管人工智能發(fā)展安全系統(tǒng)的學(xué)習(xí)曲線是在向上的趨勢,但機(jī)器最終還是會(huì)被人文社會(huì)均衡所控制。也許一個(gè)假設(shè)情境中的對沖基金可以通過破壞經(jīng)濟(jì)體系幫助人類實(shí)現(xiàn)收益最大化,但是這些行為最終會(huì)受到社會(huì)和法律制度的約束。”
LeCun曾在自己的Facebook上貼出一張美國漫畫作家比爾·沃特森(BillWatterson)的著作《凱文的幻虎世界》(CalvinandHobbes)中的一張漫畫,圖中6歲的男孩和老虎躺在草坪上,他們并不能明白對方的世界。漫畫中寫道:“如果我都不知道你為什么大笑,我們的生活將沒有太多的共鳴。”這段話也是LeCun對于人工智能和人類關(guān)系的總結(jié):有機(jī)遇也有挑戰(zhàn),充滿著迷人和激情的色彩,但又讓人有未知的恐懼。
評論