深度學(xué)習(xí)也有缺陷,同質(zhì)化的AI創(chuàng)業(yè)競爭將很殘酷
人工智能這一輪的浪潮來的很快,接連攻克了圖像識別、語音識別、自動駕駛等多個(gè)難題,簡直是處于宇宙中心。從資本、媒體到創(chuàng)業(yè)者都對這個(gè)領(lǐng)域懷有極大的熱情。
本文引用地址:http://butianyuan.cn/article/201703/344931.htm對于吃瓜群眾來說,觀感大概是這樣:不知不覺,人工智能創(chuàng)業(yè)公司就到處都是了,各大巨頭也紛紛入場;一夜之間,AlphaGo狂掃一波頂級棋手,笑傲世界棋壇;下一步,大家是不是該擔(dān)心普通人的飯碗不保,以及未來會被機(jī)器人奴役了?
亞里士多德對自身智能及其模擬也曾發(fā)出過天問
然而假如我們認(rèn)真地把目光投向這個(gè)上可追溯至公元前300年、下至1956年才正式得名“Artificial Intelligence”的領(lǐng)域,就會發(fā)現(xiàn),其實(shí)引起這一波狂潮的不是“人工智能”本身,而是處于這個(gè)領(lǐng)域里的機(jī)器學(xué)習(xí)中的一項(xiàng)技術(shù):深度學(xué)習(xí)。
通過構(gòu)建人工神經(jīng)網(wǎng)絡(luò),它第一次解決了許多人們無法觸及的難題、讓人工智能前所未有地和人類的生活產(chǎn)生交集,也因此獲得了最大限度的關(guān)注。
然而深度學(xué)習(xí)真的如此神乎其神嗎?它有沒有致命缺陷,未來又在哪里?鈦媒體駐硅谷記者采訪了AI領(lǐng)域的創(chuàng)業(yè)者、學(xué)者、投資人,還注冊了EDX上的人工智能課程,得到了這些初步答案:
深度學(xué)習(xí)也有致命缺陷
創(chuàng)投圈對于人工智能的再次關(guān)注,對深度學(xué)習(xí)的追捧,其實(shí)就是“人工神經(jīng)網(wǎng)絡(luò)”的一次復(fù)興。數(shù)十年前,許多學(xué)者曾經(jīng)刻苦鉆研過它,只是由于當(dāng)時(shí)技術(shù)的限制,計(jì)算能力不足,神經(jīng)網(wǎng)絡(luò)很小很淺,它在吸引一波注意力之后回歸沉寂,也令投資人對它失去了興趣。
隨著基礎(chǔ)設(shè)施領(lǐng)域的進(jìn)步,計(jì)算機(jī)的運(yùn)算能力及數(shù)據(jù)資源的積累能力在不斷提高,數(shù)學(xué)、系統(tǒng)控制、經(jīng)濟(jì)等領(lǐng)域的技術(shù)也在不斷融合,人工神經(jīng)網(wǎng)絡(luò)技術(shù)又再一次走上了歷史舞臺。然而這時(shí)候,上一個(gè)“人工智能冬天”的影響?yīng)q在,于是有識之士給它換了個(gè)名字來進(jìn)行下一輪的發(fā)展……
毫無疑問,這個(gè)做法奏效了。
在21世紀(jì),深度學(xué)習(xí)讓人工智能第一次能夠開始解決大眾生活里的問題,存在感超強(qiáng)——它的特點(diǎn)是不再像以前一樣依靠硬編碼來解決各種問題,而是通過搭建一個(gè)模仿人工神經(jīng)網(wǎng)絡(luò)的架構(gòu),來讓機(jī)器通過大量數(shù)據(jù)訓(xùn)練而自己找出其中的規(guī)律。
其中涉及多層復(fù)雜的人工神經(jīng)網(wǎng)絡(luò),機(jī)器在經(jīng)過大量訓(xùn)練后最終能夠得出準(zhǔn)確率極高的結(jié)果。在許多領(lǐng)域,深度學(xué)習(xí)技術(shù)都帶來了令人驚艷的結(jié)果:AlexNet,AlphaGo,自動駕駛,圖像識別,機(jī)器翻譯……
不過,“深度學(xué)習(xí)”(也就是“依賴深度神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)”)也有著一項(xiàng)幾乎是與生俱來的缺陷:這些復(fù)雜的人工神經(jīng)網(wǎng)絡(luò),不僅讓向其他人解釋變得困難無比,就連學(xué)者本身也無法考證他所創(chuàng)造的系統(tǒng),是如何得出這個(gè)結(jié)果的。
這是一個(gè)可怕的特點(diǎn)——“Uninterpretable”。在學(xué)術(shù)界,這意味著人類無法知道機(jī)器給出這個(gè)結(jié)果的原因。它有可能會讓你在不知不覺間,失去“發(fā)現(xiàn)錯(cuò)誤”的機(jī)會。
機(jī)器學(xué)習(xí)學(xué)者Rich Caruana描述的一個(gè)事件中,就出現(xiàn)了這樣一個(gè)生死攸關(guān)的“錯(cuò)誤”:
在匹茲堡大學(xué)的醫(yī)療中心里,有一個(gè)小組利用不同的機(jī)器學(xué)習(xí)技術(shù)預(yù)測肺炎患者是否會患上嚴(yán)重的并發(fā)癥。這樣一來,就能讓有較低患上嚴(yán)重并發(fā)癥的病人提早出院,來減少床位壓力及醫(yī)護(hù)人員的負(fù)擔(dān)。
然而其中一種可以學(xué)習(xí)規(guī)則的機(jī)器學(xué)習(xí)系統(tǒng)輸出了這樣一條規(guī)則,讓這個(gè)小組覺得很奇怪:讓所有患有哮喘的肺炎患者出院。
為了解讀這個(gè)奇怪的規(guī)則,他們查閱了醫(yī)院規(guī)定,發(fā)現(xiàn)了這樣一條:哮喘患者得了肺炎后很容易患上嚴(yán)重并發(fā)癥,所以要尤其注意他們。這條規(guī)則在這醫(yī)院執(zhí)行的太好了,導(dǎo)致這些脆弱的病人實(shí)際上很少真正患上并發(fā)癥。
這就是機(jī)器只看數(shù)據(jù)的局限性,“我們可能會不小心害死一些病人?!睂W(xué)者總結(jié)道。
這一次,他們用了多種方法,所以通過基于這種會輸出規(guī)則的方法而發(fā)現(xiàn)了這一點(diǎn)。如果他們僅僅采用了人工神經(jīng)網(wǎng)絡(luò)的話,人們大概只能知道這一部分人被它標(biāo)記“可以出院”,然后在一段時(shí)間后通過急劇升高的肺炎并發(fā)癥數(shù)量而意識到這一切……
“人工智能只能分析數(shù)據(jù),而數(shù)據(jù)建模與真實(shí)生活之間很難直接劃上等號?!惫韫韧顿Y人郭威這樣告訴記者。當(dāng)然,這也許并不會是一個(gè)永遠(yuǎn)的缺陷。已經(jīng)有學(xué)者在研究人工神經(jīng)網(wǎng)絡(luò)的“行為習(xí)慣”(對就是像研究野生動物一樣),希望能通過這個(gè)過程找到“解讀”人工神經(jīng)網(wǎng)絡(luò)的方法。
同時(shí),如今的深度學(xué)習(xí)技術(shù)還有另一個(gè)問題,它需要大量的數(shù)據(jù)作為訓(xùn)練基礎(chǔ),而訓(xùn)練所得的結(jié)果卻難以應(yīng)用到其他問題上。
很簡單的例子,比如曾經(jīng)虐翻中日韓圍棋天才的AlphaGo,在跳棋賽場上可能就束手無策了……這也意味著花費(fèi)了很大精力、數(shù)據(jù)來訓(xùn)練的模型,很難跨行業(yè)、甚至只是跨項(xiàng)目的應(yīng)用。
1997年,國際象棋世界冠軍Garry Kasparov對陣Deep Blue
同質(zhì)化的AI創(chuàng)業(yè)
雖然深度學(xué)習(xí)還不是一個(gè)完美的技術(shù),但在它成功地“吸引了全世界的注意力”之后,工業(yè)界的進(jìn)展正不斷加速。
“如今人工智能行業(yè)正處于一個(gè)‘四處開花’的階段,能看到不同方向上的創(chuàng)新?!比A盛頓大學(xué)人工智能博士徐宥告訴鈦媒體記者,他曾在FitBit領(lǐng)導(dǎo)機(jī)器學(xué)習(xí)團(tuán)隊(duì),離職后也加入了AI創(chuàng)業(yè)浪潮,做了一個(gè)用AI幫助程序員更好地寫代碼的公司。
比如上文中提到的Google翻譯,就在某種程度上實(shí)現(xiàn)了類似人類的遷移學(xué)習(xí)能力。毫無疑問,這也是一個(gè)未來很有希望的AI創(chuàng)業(yè)方向。
除此之前,我們還能在模型架構(gòu)、訓(xùn)練方法等方面看到各類創(chuàng)新。比如DeepMind就提出了完全人工的神經(jīng)網(wǎng)絡(luò)架構(gòu),“這可能不是受生物啟發(fā),但是對這個(gè)問題理解很深刻才能做到?!毙戾墩f。
訓(xùn)練方法則意味著讓機(jī)器找到“學(xué)習(xí)的方法”(learning to learn)。在人們訓(xùn)練自己家的小狗時(shí),不同訓(xùn)練的方法會帶來不同的結(jié)果;在訓(xùn)練機(jī)器的時(shí)候,這仍然成立。
雖然此刻我們很難預(yù)測深度學(xué)習(xí)乃至人工智能的未來,但是行業(yè)內(nèi)有一個(gè)共識——“它會持續(xù)給市場帶來驚喜,而如今以深度學(xué)習(xí)技術(shù)為主的人工智能創(chuàng)業(yè)生態(tài)也將面臨洗牌?!惫τ浾哒f道。作為硅谷知名早期投資人,他的成績顯著,在CB Insights剛剛發(fā)布的100家變革人工智能產(chǎn)業(yè)的創(chuàng)業(yè)項(xiàng)目榜單里,他投中的就有Skymind,Mode,Atomwise和TalkIQ。
根據(jù)VentureScanner今年發(fā)布的數(shù)據(jù),全球范圍內(nèi)的人工智能公司數(shù)量達(dá)到1464家,其中有超過三分之一都有關(guān)機(jī)器學(xué)習(xí)。
在任何一個(gè)對人類極其重要、競爭又面臨同質(zhì)化的行業(yè)而言,這個(gè)未來并不難以想象:在某個(gè)節(jié)點(diǎn),巨頭入場,end of story。
“真正對人類有價(jià)值的問題就那么多,巨頭一定不會把這類問題讓給大批小公司?!毙戾墩f,他認(rèn)為面臨這類競爭時(shí),模型上的優(yōu)勢對于創(chuàng)業(yè)公司來說,幾乎難以構(gòu)成護(hù)城河。在巨頭進(jìn)場以后,專注于技術(shù)的小型AI創(chuàng)業(yè)公司的慘淡未來不難預(yù)期。徐宥在創(chuàng)業(yè)一段時(shí)間后,寫下了這樣一段博文:
目前宣稱有獨(dú)特模型和算法的,是把賭注押在一個(gè)特定的方法上,而和全世界的所有研究者競爭。目前來說這注定是無效的——誰也不知道明天DeepMind會公開什么黑科技,一下子超越了你的獨(dú)特模型。或許在這個(gè)賽道上再走幾年,有些公司的確能夠領(lǐng)先其他。
目前大家都在同樣的起跑線上,模型或者算法的領(lǐng)先可以忽略不計(jì)。
就像Oriza Venture的合伙人John Yu在采訪中提到的,面對深度科技時(shí),大眾、乃至有些投資人往往過度關(guān)注這項(xiàng)科技聽上去的“先進(jìn)性”,而忽略了一點(diǎn):除了極其少數(shù)的顛覆性技術(shù)以外,大部分科技都必須找到與產(chǎn)業(yè)結(jié)合的落腳點(diǎn),在技術(shù)以外的維度上建立起競爭優(yōu)勢,才能夠真正發(fā)揮其價(jià)值,“成為一個(gè)擁有商業(yè)前景的項(xiàng)目”。
對于人工智能企業(yè)來說也是一樣,在圖像處理、語音識別等各個(gè)AI行業(yè)內(nèi)的問題漸漸都被打上“已解決”的標(biāo)記之際,也許這才是在越來越激烈的AI賽場上占據(jù)一席之地的機(jī)會。
評論