人工智能十年:風(fēng)起于青萍之末
一、人工智能悄然興起
本文引用地址:http://butianyuan.cn/article/284830.htm“人工智能”涵蓋了很多前沿技術(shù)和分支,卻很難用一句話來定義,因?yàn)樗恢碧幵诎l(fā)展當(dāng)中。比如,一些在過去看來很“人工智能”的事情,現(xiàn)在卻變成了簡單的“機(jī)械重復(fù)”,像是數(shù)字的高速計(jì)算、圖像的處理等。但總體上來看,“人工智能”的本質(zhì)和目的一直沒有發(fā)生太多變化,那就是“完成人類的部分腦力工作”。
20世紀(jì)60年代開始,就有許多科幻電影和科幻小說描述著人類對(duì)“人工智能”的憧憬和恐懼,比如斯皮爾伯格的知名影片《人工智能》。不過在現(xiàn)實(shí)中,長久以來,受到技術(shù)、科技發(fā)展和應(yīng)用層面的限制,人工智能只是一件人人都在說,都以為別人在做,但事實(shí)上卻沒多少人知道該怎么做的事——無論在學(xué)術(shù)研究層面還是在應(yīng)用層面都是如此。
人工智能曾經(jīng)在20世紀(jì)90年代互聯(lián)網(wǎng)泡沫破裂前風(fēng)靡一時(shí),到了21世紀(jì)伊始卻變成了一個(gè)禁忌,大家開始懷疑它是否存在。而到了2011年,美國資本市場(chǎng)再度為人工智能而瘋狂。風(fēng)險(xiǎn)投資機(jī)構(gòu)和頂級(jí)科技公司們開始頻繁投資這個(gè)領(lǐng)域的創(chuàng)業(yè)公司,投資范圍從應(yīng)用層面的機(jī)器人、增強(qiáng)現(xiàn)實(shí),到底層技術(shù)層面的深度學(xué)習(xí)算法、神經(jīng)網(wǎng)絡(luò)芯片等,人工智能項(xiàng)目也遍地開花。比如,Google接連投資了虛擬現(xiàn)實(shí)創(chuàng)業(yè)公司Magic Leap,收購了人工智能公司DeepMind;Facebook收購語音識(shí)別公司W(wǎng)it.ai,等等。
除了投資外部團(tuán)隊(duì)之外,像IBM、Google、Facebook和百度等國內(nèi)外科技巨頭們也紛紛加強(qiáng)自己的人工智能方面的專業(yè)團(tuán)隊(duì),招募了一批人工智能尤其是深度學(xué)習(xí)相關(guān)領(lǐng)域的科學(xué)家,如深度學(xué)習(xí)鼻祖之一Geoffrey Hinton加入了Google,Yann LeCun加入了Facebook擔(dān)任人工智能實(shí)驗(yàn)室負(fù)責(zé)人,Andrew Ng(吳恩達(dá))加入百度負(fù)責(zé)深度學(xué)習(xí)研究院等。
二、驅(qū)動(dòng)人工智能發(fā)展的內(nèi)外動(dòng)因
“人工智能”的再度興起并非偶然,外部環(huán)境和人工智能自身都在發(fā)生演化。我們認(rèn)為,驅(qū)動(dòng)人工智能領(lǐng)域發(fā)展到現(xiàn)在程度的外部動(dòng)因有:
1.傳感器能力和數(shù)量的大幅提升:LIGA等微電子技術(shù)的日趨成熟,推動(dòng)著傳感器的能力有了質(zhì)的飛躍,而大量智能設(shè)備的出現(xiàn)則進(jìn)一步加速了傳感器領(lǐng)域的繁榮。這些延伸向真實(shí)世界各個(gè)領(lǐng)域的觸角是機(jī)器感知世界的基礎(chǔ),而感知?jiǎng)t是智能實(shí)現(xiàn)的前提之一。
2.計(jì)算成本的大幅下降:摩爾定律使得計(jì)算成本在迅速下降,同時(shí)云計(jì)算的出現(xiàn)、GPU的大規(guī)模應(yīng)用使得集中化的數(shù)據(jù)計(jì)算能力變得前所未有得強(qiáng)大。大規(guī)模的的集中式計(jì)算使得人工智能的發(fā)展速度指數(shù)級(jí)加快。過去僅訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)模型對(duì)某一物體的認(rèn)知就要花費(fèi)近一年時(shí)間,而現(xiàn)在這個(gè)時(shí)間被縮短到幾天內(nèi)。
3.海量數(shù)據(jù)的出現(xiàn):根據(jù)預(yù)計(jì),2015年全球產(chǎn)生的數(shù)據(jù)總量將達(dá)到十年前的20多倍。如此海量的數(shù)據(jù)給機(jī)器學(xué)習(xí)的提供了足夠多的素材(但是需要注意的是,在其中真正有標(biāo)注的數(shù)據(jù)不超過總量的10%)。
當(dāng)然,更重要的驅(qū)動(dòng)因素是內(nèi)因——算法的進(jìn)步。當(dāng)下人工智能領(lǐng)域最先進(jìn)、應(yīng)用最廣泛的核心技術(shù)是深度神經(jīng)網(wǎng)絡(luò)(深度學(xué)習(xí))。而且,直到2006年,深度神經(jīng)網(wǎng)絡(luò)才得到快速發(fā)展,逐漸成為人工智能領(lǐng)域的主流研究方向。
21世紀(jì)人工智能的里程碑事件之一是,2006年Geoffrey Hinton發(fā)表的論文《A fast learning algorithm for deep belief nets》。他在此文中提出的深層神經(jīng)網(wǎng)絡(luò)逐層訓(xùn)練的高效算法,讓當(dāng)時(shí)計(jì)算條件下的神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練成為了可能,同時(shí)通過深度神經(jīng)網(wǎng)絡(luò)模型得到的優(yōu)異的實(shí)驗(yàn)結(jié)果讓人們開始重新關(guān)注人工智能。之后,深度神經(jīng)網(wǎng)絡(luò)模型成為了人工智能領(lǐng)域的重要前沿陣地,深度學(xué)習(xí)算法模型也經(jīng)歷了一個(gè)快速迭代的周期,Deep Belief Network、Sparse Coding、Recursive Neural Network, Convolutional Neural Network等各種新的算法模型被不斷提出,而其中卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)更是成為圖像識(shí)別最炙手可熱的算法模型。
目前,隨著GPU和CPU集群的出現(xiàn),云端的計(jì)算資源已經(jīng)慢慢不再是人工智能的發(fā)展瓶頸。而人工智能算法模型的進(jìn)一步豐富和改進(jìn)以及本地化人工智能的實(shí)現(xiàn)成為了人工智能新的主要發(fā)展方向。
三、人工智能的三步走
從人工智能的整個(gè)發(fā)展歷程來看,按照應(yīng)用場(chǎng)景和人工智能資源的集中度,可以大致分成三個(gè)階段。
第一階段:實(shí)驗(yàn)室研究階段,這一階段的人工智能資源高度集中。人工智能在2011年前的發(fā)展大致還處于實(shí)證研究階段,資源高度集中在國家或大學(xué)資助的研究機(jī)構(gòu)中,用于算法模型的訓(xùn)練和研究,人工智能還只能為極少數(shù)人接觸到。這一階段大量的工作除了在算法模型本身的研究外,還包括建立計(jì)算能力本身。
第二階段:企業(yè)應(yīng)用階段,這一階段的人工智能資源被少部分科技巨頭掌握。在人工智能表現(xiàn)出一定的實(shí)際應(yīng)用價(jià)值后,科技巨頭們一擁而上,紛紛希望在這個(gè)領(lǐng)域取得突破。在少部分核心企業(yè)掌握了大規(guī)模的人工智能資源以后,其它小規(guī)模的企業(yè)一般會(huì)利用這些核心企業(yè)提供的人工智能資源接口和其支持的人工智能應(yīng)用為自身的發(fā)展提供服務(wù)。由于掌握大規(guī)模的計(jì)算資源是這一模式的前提,因此這一階段人工智能資源的集中度仍然非常高,而這將是人工智能在企業(yè)場(chǎng)景下的主要應(yīng)用形式,即集中計(jì)算,分布使用。
第三步:個(gè)人應(yīng)用階段,這一階段的人工智能資源被分散到個(gè)人手中。顯然,依賴于云端大規(guī)模計(jì)算資源的人工智能算法限制著人工智能在消費(fèi)者場(chǎng)景的應(yīng)用,因?yàn)榧惺接?jì)算意味著巨量的網(wǎng)絡(luò)資源消耗,并且因?yàn)榫W(wǎng)絡(luò)問題,難以在消費(fèi)者應(yīng)用場(chǎng)景中有穩(wěn)定的表現(xiàn)。因此,人工智能的本地化,也就是從集中走向分布(細(xì)化到智能手機(jī)、可穿戴設(shè)備等)實(shí)現(xiàn)將是人工智能在消費(fèi)者場(chǎng)景中得到普及的關(guān)鍵一步。伴隨著人工智能的本地化實(shí)現(xiàn),將使得人工智能真正延展到手持設(shè)備、家用電器、汽車等消費(fèi)級(jí)應(yīng)用。
人工智能本地化實(shí)現(xiàn)的難點(diǎn)在于本地的計(jì)算能力在如今動(dòng)輒幾個(gè)G的算法模型面前杯水車薪、無能為力。一部iPhone 6手機(jī)采用一般的CNN算法去處理一張200*200像素圖像的ImageNet千分類問題需要的時(shí)間是300毫秒,但這樣的處理速度對(duì)于用戶體驗(yàn)來說是災(zāi)難性的。要提高本地的圖像識(shí)別處理速度,目前能夠想到的途徑有三條:一是精簡算法模型,根據(jù)實(shí)際的場(chǎng)景適配需要的精度,讓模型盡可能簡化,二是提升CPU的計(jì)算能力。目前的智能手機(jī)CPU已經(jīng)在20nm制程以下,按照傳統(tǒng)路線,CPU提升的極限可能在7-10nm,這其實(shí)非常有限。而且,大功耗也是一般移動(dòng)設(shè)備難以承受的,因此只有為人工智能算法模型重新開發(fā)專門的芯片才有可能滿足本地的計(jì)算要求。
從這個(gè)角度來看,人工智能在消費(fèi)者場(chǎng)景實(shí)現(xiàn)的關(guān)鍵是對(duì)算法模型優(yōu)化和用戶場(chǎng)景的綜合理解,以及底層硬件的設(shè)計(jì)制造。而人工智能的企業(yè)應(yīng)用則會(huì)是巨頭們的游戲。
四、人工智能的產(chǎn)業(yè)生態(tài)
人工智能產(chǎn)業(yè)主要由底層可應(yīng)用技術(shù)(圖像識(shí)別、語音識(shí)別、自然語言處理、硬件技術(shù)等)、計(jì)算資源(大規(guī)模GPU集群)、基礎(chǔ)數(shù)據(jù)服務(wù),以及企業(yè)/政府/消費(fèi)者應(yīng)用組成。遵循產(chǎn)業(yè)的一般發(fā)展規(guī)律,人工智能的發(fā)展路徑仍然是從底層可應(yīng)用技術(shù)的成熟開始,再到商業(yè)化計(jì)算資源、數(shù)據(jù)服務(wù)等基礎(chǔ)設(shè)施的完善,最后形成企業(yè)和消費(fèi)者應(yīng)用的繁榮。
目前還是人工智能的早期階段,我們需要關(guān)注的是三方面的發(fā)展:一方面是底層可應(yīng)用技術(shù)的突破,包括算法的和硬件的;另一方面是中間的數(shù)據(jù)服務(wù)和計(jì)算資源利用的進(jìn)步;最后也是最重要的是,基于現(xiàn)有技術(shù)的應(yīng)用場(chǎng)景的發(fā)掘。其中,底層技術(shù)不一定是“獨(dú)門秘技”,能夠把底層技術(shù)商業(yè)化的公司一定是因?yàn)樽陨淼某杀厩€優(yōu)于大部分用戶的成本曲線。如果不滿足這個(gè)特性,那么某些企業(yè)即使有短暫的技術(shù)領(lǐng)先,最后都難以實(shí)現(xiàn)大規(guī)模商業(yè)化。
五、風(fēng)起于青萍之末
乍看上去,人工智能是個(gè)巨頭間的游戲,巨頭企業(yè)無論從資本、人才還是技術(shù)積累上似乎都更有優(yōu)勢(shì)。然而事實(shí)未必如此。如果以汽車行業(yè)做類比,汽車電動(dòng)化的先驅(qū)并非寶馬、大眾這樣的傳統(tǒng)汽車巨頭,而是特斯拉這樣的“小”公司。這其中的原因在于,大公司面對(duì)創(chuàng)新變革時(shí),往往看不上小機(jī)會(huì),因?yàn)樾C(jī)會(huì)對(duì)它們的吸引力實(shí)在太小了。巨頭們往往喜歡憋大招,喜歡一步到位,從而徹底甩開競爭對(duì)手。但是創(chuàng)新、特別是針對(duì)大眾消費(fèi)者的創(chuàng)新卻是循序漸進(jìn)的,所謂“大招”中其實(shí)包含著不少對(duì)用戶需求的錯(cuò)誤假設(shè)。小步快跑,不斷尋求和用戶互動(dòng),積跬步終能致千里。因此,創(chuàng)業(yè)公司在人工智能的創(chuàng)新變革中反而會(huì)更有機(jī)會(huì)。從Google和Yahoo在搜索領(lǐng)域,到Facebook和MySpace在社交領(lǐng)域,再到Apple和Nokia在手機(jī)領(lǐng)域,最終變革的主導(dǎo)力量其實(shí)都是“小”公司。
基于這個(gè)方向判斷,有志于在人工智能領(lǐng)域挑戰(zhàn)巨頭的創(chuàng)業(yè)者們需要先想清楚三件事:
一、人工智能改變了什么。偉大的產(chǎn)品或技術(shù)一定是改變了消費(fèi)者在某些場(chǎng)景下的行為,有沒有都一樣的產(chǎn)品,很難給消費(fèi)者使用它的理由。人工智能相關(guān)產(chǎn)品核心是要能夠替代一部分人的功能或者提高人的效率,那么在這個(gè)大前提下要考慮兩個(gè)小問題,第一個(gè)是,產(chǎn)品對(duì)應(yīng)的用戶場(chǎng)景下人的介入頻次高不高,頻次決定了這個(gè)產(chǎn)品的天花板。第二個(gè)是,這個(gè)應(yīng)用場(chǎng)景下替代掉的人的價(jià)值有多大,顯然替代掉的這部分價(jià)值轉(zhuǎn)化成了產(chǎn)品的內(nèi)在價(jià)值。最后不妨做一個(gè)乘法,把產(chǎn)品所替代的工作/操作的頻次乘以每次工作/操作能夠產(chǎn)生的價(jià)值,這個(gè)乘積越大說明人工智能在該應(yīng)用場(chǎng)景中發(fā)揮的作用越大。
二、該方向上的人工智能是否能夠?qū)崿F(xiàn)。人工智能的許多技術(shù)都還沒到非常成熟的地步。之前提到,創(chuàng)業(yè)者的優(yōu)勢(shì)在于小步快跑,因此在人工智能還不成熟的領(lǐng)域,一味追求技術(shù)上的突破來解決所有問題并不可取。無法解決一個(gè)通用場(chǎng)景就從幾個(gè)專門的場(chǎng)景先入手,無法做出一個(gè)“萬能”的產(chǎn)品不妨先做出一個(gè)可以用的產(chǎn)品。只有用戶使用了產(chǎn)品并給予反饋,才可能真正知道自己產(chǎn)品的缺陷和下一步的方向。
三、人工智能能否成為該產(chǎn)品的核心競爭力。核心競爭力是一個(gè)產(chǎn)品的拳頭,如果拳頭不硬,這個(gè)產(chǎn)品無疑打開不了市場(chǎng)。因此產(chǎn)品的核心競爭力如果是人工智能,那么該方面的人工智能必須是完美適用于該特定場(chǎng)景的。如果產(chǎn)品倚重的是還存在很多瑕疵的人工智能技術(shù),那么這個(gè)產(chǎn)品本身的被接受程度就會(huì)很不理想。但不要籠統(tǒng)地認(rèn)為人工智能技術(shù)的某些局限會(huì)成為產(chǎn)品的絆腳石。以特斯拉電動(dòng)車為例:電池性能至今還在很多方面限制著電動(dòng)車的表現(xiàn),依然有很多用戶青睞特斯拉,原因是特斯拉的核心競爭力在于它出色的啟動(dòng)、智能化的駕駛體驗(yàn)和簡易的維護(hù),電池盡管是一個(gè)短板但不是核心功能。因此,關(guān)鍵仍然在于定義自己的核心競爭力,并確保在核心競爭力上的技術(shù)是經(jīng)得起推敲的。
人工智能之風(fēng),在未來會(huì)起于青萍之末。
評(píng)論