新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 院士鄔賀銓:人工智能的魅力是“永遠(yuǎn)在路上”

院士鄔賀銓:人工智能的魅力是“永遠(yuǎn)在路上”

作者: 時間:2019-01-08 來源:網(wǎng)易智能 收藏
編者按:中國日報網(wǎng)與網(wǎng)易傳媒共同舉辦的2019影響力峰會在北京召開,首屆影響力峰會的主題為“預(yù)見未來”。會上,中國工程院院士鄔賀銓擔(dān)任“預(yù)見科技未來”發(fā)布人,發(fā)表了主題為“迎接人工智能的未來”的演講。

  深度神經(jīng)網(wǎng)絡(luò)實際上是個分類器

本文引用地址:http://butianyuan.cn/article/201901/396443.htm

  現(xiàn)在深度神經(jīng)網(wǎng)絡(luò),就算你寫本書告訴計算機什么是貓什么是狗,它也學(xué)不會,但如果像對待人類小孩的教學(xué)方式那樣,感性地把一堆貓和狗的視頻送到深度神經(jīng)網(wǎng)絡(luò),它就會分類,分類結(jié)束后,如果照片視頻上有標(biāo)簽,它就會知道分的這類是貓。如果籃子里有個小狗,放進(jìn)去,它照樣會分類為“狗”。所以深度神經(jīng)網(wǎng)絡(luò)實際上是個分類器,當(dāng)你告訴它是什么,它就學(xué)會了。

  是深度神經(jīng)網(wǎng)絡(luò)的主要技術(shù),從近10年里的論文里可以發(fā)現(xiàn),現(xiàn)在的技術(shù)熱點,可以看到神經(jīng)網(wǎng)絡(luò)和進(jìn)化編程等計算密集型算法在機器學(xué)習(xí)研究中的出色表現(xiàn)。

  人每天吃飯大概要輸入2500卡路里的能量,卡路里換算成焦耳大概是1000萬焦耳,下圍棋5個小時大概要消耗人類3.3兆焦耳。AlphaGo跟李世石下棋時用了1000多個CPU,176個GPU,一個CPU功率100W,1個GPU200W,換算出來是173000W(這是以秒計的),如果5小時就是3000兆焦耳,這相當(dāng)于李世石用的能耗是AlphaGo能耗的千分之一,也就是說,目前還需要很大的能量支持。

  后來隔了一年,改進(jìn)了AlphaGo Zero,換算成TPU,它只是AlphaGo原有1/12(能耗),用1/12的能耗跟AlphaGo下棋,100比0,當(dāng)時AlphaGo還要搜集所有的圍棋棋譜,然后訓(xùn)練三個月,AlphaGoZero只需要了解圍棋的規(guī)則,兩個AlphaGoZero互相對應(yīng),能把所有人類沒有走過的棋譜都走完,它就能戰(zhàn)勝了。所以優(yōu)化算法、改進(jìn)硬件,包括GPU替換CPU(提高了三倍),TPU替換GPU(提高了15到30倍)。

  最近不單AlphaGo Zero圍棋天下無敵,而且通過自學(xué)2個小時,還擊敗了日本的將棋(有點像中國的象棋),自學(xué)4個小時,把國際象棋也全部打贏了。

  能做的事情有太多

  在醫(yī)學(xué)上,剛剛過去的三個月,谷歌在機器學(xué)習(xí)又開發(fā)了Alpha Fold,Alpha Go的折疊,所謂折疊是來預(yù)測蛋白質(zhì)結(jié)構(gòu)的,在蛋白質(zhì)結(jié)構(gòu)預(yù)測的國際競賽里,打敗了所有由人組成的各種團隊,這有什么意義?如果能解釋蛋白質(zhì)的結(jié)構(gòu),我們的很多疾病(包括癌癥)可能就會找到解決辦法。所以現(xiàn)在很多用在醫(yī)學(xué)上開發(fā)藥物,美國人工智能能比醫(yī)生提早六年診斷出阿茲海默病,醫(yī)療人工智能的器械也開始投入商用了。除此之外我們看一看蛋白質(zhì)折疊結(jié)構(gòu),我們可以通過人工智能將它解釋出來。

  我們知道門捷列夫開發(fā)元素周期表用了很長時間,現(xiàn)在假設(shè)我們不知道元素周期表,利用人工智能程序,幾個小時就可以把元素周期表重新定義出來。也就是說,人工智能確實能做好多事。

  在語音識別方面,人工智能已經(jīng)超過了人,一般人類語音識別的錯誤率是5.1%,現(xiàn)在百度對漢語的語音識別,微軟對應(yīng)于的語音識別已經(jīng)比這個水平要高了。當(dāng)然,在嘈雜噪聲環(huán)境下,識別率現(xiàn)在也只有54%,不過人更識別不了,人還達(dá)不到這個水平。

  包括人臉識別,中國上海依圖科技的人臉識別率在萬分之一,誤失率前提下可以通過98%,銀行柜臺人員用肉眼比對,誤差一般在1%,也就是說機器準(zhǔn)確性是超過人的眼睛的。

  當(dāng)然,動態(tài)三維活體檢測更難,下面的圖是小布什的原相,右邊的小部什頭像和原圖一樣,但嘴型和上圖的胖子嘴型一樣,我們聽不出胖子講什么,但小布什可以通過口形恢復(fù)出他講話的聲音,讀懂唇語。

  我們知道張學(xué)友在好幾場演唱會上抓到了逃犯,這不是因為張學(xué)友,而是演唱會門口的人臉識別門口。所以張學(xué)友說“抓逃犯是我的正業(yè),唱歌只是副業(yè)”。

  機器視覺應(yīng)用于什么?這是一個肺部CT照片,大家可以從中發(fā)現(xiàn)有沒有長瘤子、有沒有癌癥,但CT可以掃描出幾百張圖片,很麻煩。我們通過人工智能把這些CT照片還原成一個肺,看看有沒有纖維化,再看看肺周邊的器官怎么樣。

  語音識別可以用于醫(yī)學(xué),還有圖像識別,可以重建三維影像,比如醫(yī)學(xué)教育,包括在增進(jìn)醫(yī)療手術(shù)的輔導(dǎo)可以起到很好的作用。

  在產(chǎn)業(yè)上,清華和英業(yè)達(dá)合作(做影像電路板的),影像電路板很復(fù)雜,可以看看該連的線是不是連了,不該連的線是不是沒連,人的肉眼很容易錯檢,但利用機器視覺就可以發(fā)覺人的肉眼沒法兒發(fā)現(xiàn)的問題,每年的經(jīng)濟效益9000萬。

  看好AI在醫(yī)療保健、汽車和金融服務(wù)的應(yīng)用,但挑戰(zhàn)很大

  人工智能對經(jīng)濟效益的貢獻(xiàn),有一些統(tǒng)計,人工智能可以改進(jìn)勞動生產(chǎn)率,可以激發(fā)消費需求、可以提高產(chǎn)品質(zhì)量,有人預(yù)測2017到2030年,人工智能對勞動生產(chǎn)率的貢獻(xiàn)超過GDP的55%,其中中國占了全球?qū)⒔话耄?030年人工智能會帶來7萬億美元的GDP增長貢獻(xiàn),占GDP的26.1%,這個數(shù)字來源于普華永道,這里面講了幾個領(lǐng)域,是最重要的人工智能應(yīng)用領(lǐng)域。

  AI指數(shù)比較高的應(yīng)用效果比較好的領(lǐng)域是:一是醫(yī)療保健,二是汽車,三是金融服務(wù)業(yè)。

  以自動駕駛為例,麥肯錫估計2025年帶來的經(jīng)濟規(guī)模將達(dá)到萬億美元,降低交通事故,每年能挽救3到15萬人的生命,減少廢氣排放90%,麥肯錫還認(rèn)為到2030年人工智能可以為全球額外貢獻(xiàn)13萬億美元的GDP增長,普華永道的估計是15.7萬億,平均年均GDP會增加1.2%。后面那句話更重要:足以比肩19世紀(jì)的蒸汽機、20世紀(jì)的工業(yè)機器人和21世紀(jì)的信息技術(shù)。

  自動駕駛在簡單路況中是好的,復(fù)雜路況就很難,因為行人和司機不見到都遵守交通規(guī)則,很難用訓(xùn)練的辦法掌握,還需要駕駛員的經(jīng)驗和知識,而且人類犯錯是偶然的,機器一旦犯錯可能就是系統(tǒng)性的。

  人工智能可以檢測腫瘤,但醫(yī)院還不敢這么用,因為人工智能本身可以告訴你應(yīng)該做什么,但它不會告訴你為什么,比如人工智能診斷一個病人,最后得出結(jié)論“鋸掉一條腿”,但不告訴你為什么,那醫(yī)院敢鋸掉腿嗎?

  還有很多功能是人工智能難以勝任的,神經(jīng)網(wǎng)絡(luò)是以輸入為導(dǎo)向的算法,首先的前提是大量數(shù)據(jù),而且數(shù)據(jù)要比較準(zhǔn)確,如果受了干擾他就很難,醫(yī)生受干擾可能會產(chǎn)生很多錯誤,比如北加州一個組織(美國公民自由聯(lián)盟)利用亞馬遜面部識別算法把美國535位國會議員的照片和美國警察局掌握的2.5萬名罪犯照片進(jìn)行比對,發(fā)現(xiàn)28個議員被當(dāng)成了罪犯。分類數(shù)據(jù)終美國的數(shù)據(jù)嚴(yán)重偏向白人男性,所以黑皮膚的可能就容易被錯認(rèn)。

  目前機器學(xué)習(xí)還有很多不足,圖靈獎的獲獎?wù)哒f,目前機器學(xué)習(xí)只是曲線的擬合,一個諾貝爾獎經(jīng)濟學(xué)獎得主(Judea Pear)說“人工智能不過是統(tǒng)計學(xué)”,也就是說目前還是有很多不夠的地方。

  剛才我用的兩張圖映射的貓和狗的區(qū)別有個曲線,但只要擬合的地方稍微錯一點,可能就會發(fā)生錯誤。比如本來是熊貓,在照片上加上一些噪音,機器就可能識別成長臂猿,所以人工智能識別目前來講還是比較嬌氣的。

  大家看這張圖,有人看是順時針轉(zhuǎn),有人看是逆時針轉(zhuǎn),哪怕是同一個人,一會兒看著是順時針轉(zhuǎn),眨眨眼睛卻變成了逆時針轉(zhuǎn),究竟是順還是逆?其實只是左腿在前還是右腿在前的問題,是你的錯覺。

  為什么會出現(xiàn)這個錯覺?因為它正好處于人工智能辨識(包括人辨識)的分界線,這時就可能發(fā)生誤導(dǎo)。

  比如這個圖里的圓圈,大家都覺得它是滾動的、是圓的,可是真的是這樣嗎?每個球都這樣走嗎?不一定,我們可以看看。實際上每個球走的都是直線,所以人工智能的模型是會被誤導(dǎo)的。

  這張圖中最后一個打問號的地方應(yīng)該放(幾個數(shù)字),人很容易看出來應(yīng)該放哪個,因為第一行232,第二行343,第三行應(yīng)該是454,可是人工智能就很難看出來,因為人工智能要獲得人類常識不是那么容易的。

  人工智能的進(jìn)化與對就業(yè)的沖擊

  當(dāng)然,神經(jīng)網(wǎng)絡(luò)現(xiàn)在還在演進(jìn),關(guān)鍵是怎樣選擇正確框架以及訓(xùn)練,清華大學(xué)的張鈸院士說我們要把感知和認(rèn)知放到同一個空間里,不是簡單用概率統(tǒng)計的理論,要用模糊級的理論來重新定義它,否則我們沒辦法跟機器人交流,機器人之間也沒辦法交流。

  機器學(xué)習(xí)著重于通過數(shù)據(jù)了解環(huán)境,而人類能夠同時洞悉不同的環(huán)境,群體學(xué)習(xí)是人類與生俱來的本領(lǐng),而電腦是不具備的。我曾經(jīng)跟一個搞人工智能的公司說,識別語音、下圍棋都不算什么,能不能組織11人的機器人足球隊,什么時候踢贏皇馬了,那你就算厲害了,因為11人的機器人足球隊是要群體活動的。

  剛才談到就業(yè),實際上人工智能確實會取代很多現(xiàn)在的就業(yè),49%的勞動人口可能會被取代,但一半以上的人是不會被取代的,因為人工智能沒有情感,有情感創(chuàng)作的文藝工作是不能被取代的,人工智能不能取代文藝,要由人來做。美國高德納咨詢公司以及世界經(jīng)濟論壇發(fā)布的《2018未來就業(yè)》報告中都說,實際上取代了一部分工作,但會新增一些工作崗位。人工智能會帶來數(shù)字鴻溝,發(fā)達(dá)國家、先進(jìn)企業(yè),還會拉大社會貧富懸殊,高智能崗位會增加,一般勞動崗位會減少,自動駕駛出了問題是誰的責(zé)任?機器人創(chuàng)作的小說、詩歌是否享有相應(yīng)的知識產(chǎn)權(quán)?有法律道德的問題,還有安全問題,如果人工智能殺人了怎么辦?

  最后,總書記提到,要加快發(fā)展新一代人工智能,是我們贏得全球科技競爭主動權(quán)的重要抓略抓手。

  清華大學(xué)張鈸院士說,我們現(xiàn)在正在通往AI的路上,現(xiàn)在走得并不遠(yuǎn),在出發(fā)點附近,但人工智能永遠(yuǎn)在路上,大家要有思想準(zhǔn)備,而這也就是人工智能的魅力。

  人工智能會使得我們的生活更美好,或是走到我們的反面,這一切取決于人類自己。

  謝謝。


上一頁 1 2 下一頁

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉