AI的下一主戰(zhàn)場:手機與物聯(lián)網(wǎng)終端
手機與物聯(lián)網(wǎng)終端市場潛力大
本文引用地址:http://butianyuan.cn/article/201707/361721.htm現(xiàn)在人工智能(AI)剛剛興起,很多公司關(guān)注自動駕駛,或到ImageNet ILSVRC比賽上去顯示實力,或進行下棋。同時應(yīng)該更關(guān)注AI實際為人們帶來了什么,例如現(xiàn)在已經(jīng)成熟的手機,以及正在興起的物聯(lián)網(wǎng)終端市場的機會。 “如果有想創(chuàng)業(yè)的企業(yè)家,可以向這些方向想象,這方面的潛力非常大。”美國高通公司產(chǎn)品市場資深經(jīng)理劉學徽先生對電子產(chǎn)品世界的記者說。
近日,劉學徽經(jīng)理出席了在京舉辦的“人工智能與芯片高峰論壇”,并發(fā)表了“終端設(shè)備上的人工智能”的主旨講演。該論壇由電子產(chǎn)品世界、啟迪之星和洪泰智造工廠聯(lián)合主辦。
劉學徽經(jīng)理指出,中國每年大約有6億部手機出貨,如果這6億部手機中有10%用上了人工智能算法實現(xiàn)的功能,收益將十分驚人,對于廠商來說其收入也是相當可觀的。另外,目前手機通過滑屏、觸屏等方式控制,未來通過語音算法和語音識別,實現(xiàn)手機控制的方式將會慢慢流行起來。通過AI技術(shù),未來手機還可以了解用戶的喜好、自動幫助打開App,也可以作為一些廣告的推薦入口等。
現(xiàn)在大家熱衷談?wù)撛朴嬎?,但人工智能運算并不是所有場合都適合云端處理,有些需要在傳感器端附近立即計算。例如無人機、自動駕駛、IP camera(攝像頭)、手機拍照等。因為無人機和自動駕駛需要實時避障,而IP camera的人臉識別如果完全在云上計算,從原始圖像采集,之后壓縮、傳輸、解壓,算完再把結(jié)果告訴端,這非常浪費時間時間。在手機中,拍照前要對手機預覽、對焦,也一定是在終端上運算。
在廠商近期發(fā)布的最新智能手機當中,有些型號采用了背景虛化技術(shù),使拍攝效果達到了單反效果,這其實就用到了AI算法開發(fā)的功能。實際上,手機上還有很多功能可以利用AI技術(shù),例如拍照的美顏,還有人臉識別方面,是采用10個特征點,還是一二百個特征點、四百個特征點,對人臉識別的效果會不同。可把這些算法在云上培訓好,然后轉(zhuǎn)移置到手機上運行。
在VR/AR方面,目前存在的瓶頸之一是用戶缺乏存在感體驗,沒有定位。如果把AI加入VR終端,戴著頭盔可以看到自己的手和腳。根據(jù)你的攝像頭的移動,可以看到周圍的物體。其方法是頭盔/眼鏡外裝個攝像頭,假設(shè)識別周邊有一個凳子,那么在人的視野里放一個虛擬凳子,這樣效果更逼真。在直播社交娛樂場景中,主播跳舞時的頭飾因為延時常常跟不上臉部的移動;另外如果人在移動,聊天的效果也大打折扣。如果在端上做AI運算,效果會大大提升。
驍龍神經(jīng)元處理引擎SDK
Qualcomm提供了專為端上運行神經(jīng)元網(wǎng)絡(luò)的驍龍神經(jīng)元處理引擎(Snapdragon Neural Processor Engine)簡稱SNPE。 目前在Qualcomm? 驍龍 600系列部分平臺和820、835上都得到了支持。通過這個引擎,算法可以運行在GPU和DSP上,速度和功耗相對CPU可以得到大幅提升。目前支持的架構(gòu)有Caffe,Caffe 2,Tensorflow,我們提供轉(zhuǎn)化工具和benchmark工具,方便算法廠商的開發(fā)調(diào)試。
以Qualcomm? 驍龍TM 835移動平臺上的測試為例,得到的結(jié)果是同樣的神經(jīng)元網(wǎng)絡(luò),在GPU上運行比CPU上運行平均快4倍,在DSP上運行比CPU快16倍;功耗上, 在GPU上運行的功耗是CPU上的1/8,在DSP上運行的功耗是CPU上的1/25。
使用SNPE SDK的基本流程是以TensorFlow、caffe、caffe2做的模型,配置調(diào)用GPU,DSP或CPU的API,然后通過轉(zhuǎn)換工具轉(zhuǎn)換成在DLC格式,再通過SDK讓算法在驍龍移動平臺三種內(nèi)核上運行,實現(xiàn)各種各樣的功能,例如人臉識別、語音識別、文字識別等功能。換言之,Qualcomm SNPE SDK中提供了現(xiàn)成算法和函數(shù),諸如卷積、池化等常用函數(shù)都已將做好,算法開發(fā)者直接調(diào)用即可。同時還支持用戶定義層(User Defined Layer, UDL)。
關(guān)于軟件算法,值得一提的是,過去是傳統(tǒng)算法,現(xiàn)在基于機器學習的算法,速度更快效果更好,而且功耗更低,開發(fā)更為方便。此外隨著算法的進步,對硬件的依賴度降低,例如要拍照清晰,過去通常要高像素分辨率,現(xiàn)在可以不用很貴的硬件,依靠算法提升效果。
終端與云端相輔相成
那么,相比市面上的一些硬件處理器,高通的特色及與他們的關(guān)系是什么?
目前AI芯片有兩種形態(tài),一種是像Qualcomm一樣是做在一個SoC中,特點是體積更小、功耗更低,運算速度快,因為CPU、GPU和DSP等計算內(nèi)核都做在一個SoC上,會對數(shù)據(jù)搬移、延遲和功耗等進行優(yōu)化。未來隨著運算要求的提升,也許會出現(xiàn)專門運算Neural Network(NN,神經(jīng)網(wǎng)絡(luò))的核。第二種形態(tài),是一些公司做的所謂的AI芯片,實際上是在主處理器外做的協(xié)處理器,因此主芯片和外置芯片之間的大量數(shù)據(jù)搬移、交互等將是挑戰(zhàn)。
同樣是NN芯片,各家的定位是有差異化的。例如FPGA較為適合在云上或車載等對功率和體積不太講究的應(yīng)用場景。一些IP公司也推出了AI架構(gòu)和指令集,但目前還沒有到定論時。因為各種技術(shù)都是演進過程中,最終要看市場的選擇。
Qualcomm與很多云端處理器廠商是相輔相成的關(guān)系。例如云端處理器的GPU非常強大,培訓/training做得非常好,但功耗不理想,據(jù)悉某專用神經(jīng)元網(wǎng)絡(luò)芯片功耗高達30W。云端適合模型的培訓,訓練后的結(jié)果可轉(zhuǎn)移到端去運行。驍龍終端芯片目前不做培訓,但十分擅長運行。 “我們的生態(tài)成長有賴于云端,云端的模型做得越好,越有利于我們AI技術(shù)的實現(xiàn)和落地。”劉學徽經(jīng)理強調(diào)。
已與Facebook合作
實際上,Qualcomm? 驍龍TM 移動平臺在手機端也有靚麗的業(yè)績。例如今年4月18日,F(xiàn)acebook 和高通宣布合作支持 Facebook 開源深度學習框架 Caffe2 和Qualcomm? 驍龍TM 神經(jīng)處理引擎(NPE)框架的優(yōu)化。Facebook將在其所有安卓應(yīng)用中集成SNPE SDK, 運行在驍龍移動平臺上時,比沒有SNPE的速度提升5倍。
隨著中國手機與AI的發(fā)展,期待會有更多的中國算法公司開發(fā)手機上AI應(yīng)用!
評論