AI的下一主戰(zhàn)場：手機與物聯(lián)網(wǎng)終端

—— AI的下一主戰(zhàn)場 —— 手機與物聯(lián)網(wǎng)終端

作者：王瑩王金旺時間：2017-07-13 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

　　手機與物聯(lián)網(wǎng)終端市場潛力大

本文引用地址：http://butianyuan.cn/article/201707/361721.htm

　　現(xiàn)在人工智能（AI）剛剛興起，很多公司關(guān)注自動駕駛，或到ImageNet ILSVRC比賽上去顯示實力，或進行下棋。同時應(yīng)該更關(guān)注AI實際為人們帶來了什么，例如現(xiàn)在已經(jīng)成熟的手機，以及正在興起的物聯(lián)網(wǎng)終端市場的機會。 “如果有想創(chuàng)業(yè)的企業(yè)家，可以向這些方向想象，這方面的潛力非常大。”美國高通公司產(chǎn)品市場資深經(jīng)理劉學徽先生對電子產(chǎn)品世界的記者說。

　　近日，劉學徽經(jīng)理出席了在京舉辦的“人工智能與芯片高峰論壇”，并發(fā)表了“終端設(shè)備上的人工智能”的主旨講演。該論壇由電子產(chǎn)品世界、啟迪之星和洪泰智造工廠聯(lián)合主辦。

　　劉學徽經(jīng)理指出，中國每年大約有6億部手機出貨，如果這6億部手機中有10%用上了人工智能算法實現(xiàn)的功能，收益將十分驚人，對于廠商來說其收入也是相當可觀的。另外，目前手機通過滑屏、觸屏等方式控制，未來通過語音算法和語音識別，實現(xiàn)手機控制的方式將會慢慢流行起來。通過AI技術(shù)，未來手機還可以了解用戶的喜好、自動幫助打開App，也可以作為一些廣告的推薦入口等。

　　現(xiàn)在大家熱衷談?wù)撛朴嬎?，但人工智能運算并不是所有場合都適合云端處理，有些需要在傳感器端附近立即計算。例如無人機、自動駕駛、IP camera（攝像頭）、手機拍照等。因為無人機和自動駕駛需要實時避障，而IP camera的人臉識別如果完全在云上計算，從原始圖像采集，之后壓縮、傳輸、解壓，算完再把結(jié)果告訴端，這非常浪費時間時間。在手機中，拍照前要對手機預覽、對焦，也一定是在終端上運算。

　　在廠商近期發(fā)布的最新智能手機當中，有些型號采用了背景虛化技術(shù)，使拍攝效果達到了單反效果，這其實就用到了AI算法開發(fā)的功能。實際上，手機上還有很多功能可以利用AI技術(shù)，例如拍照的美顏，還有人臉識別方面，是采用10個特征點，還是一二百個特征點、四百個特征點，對人臉識別的效果會不同。可把這些算法在云上培訓好，然后轉(zhuǎn)移置到手機上運行。

　　在VR/AR方面，目前存在的瓶頸之一是用戶缺乏存在感體驗，沒有定位。如果把AI加入VR終端，戴著頭盔可以看到自己的手和腳。根據(jù)你的攝像頭的移動，可以看到周圍的物體。其方法是頭盔/眼鏡外裝個攝像頭，假設(shè)識別周邊有一個凳子，那么在人的視野里放一個虛擬凳子，這樣效果更逼真。在直播社交娛樂場景中，主播跳舞時的頭飾因為延時常常跟不上臉部的移動；另外如果人在移動，聊天的效果也大打折扣。如果在端上做AI運算，效果會大大提升。

　　驍龍神經(jīng)元處理引擎SDK

　　Qualcomm提供了專為端上運行神經(jīng)元網(wǎng)絡(luò)的驍龍神經(jīng)元處理引擎（Snapdragon Neural Processor Engine）簡稱SNPE。目前在Qualcomm^? 驍龍 600系列部分平臺和820、835上都得到了支持。通過這個引擎，算法可以運行在GPU和DSP上，速度和功耗相對CPU可以得到大幅提升。目前支持的架構(gòu)有Caffe，Caffe 2，Tensorflow，我們提供轉(zhuǎn)化工具和benchmark工具，方便算法廠商的開發(fā)調(diào)試。

　　以Qualcomm^? 驍龍^TM 835移動平臺上的測試為例，得到的結(jié)果是同樣的神經(jīng)元網(wǎng)絡(luò)，在GPU上運行比CPU上運行平均快4倍，在DSP上運行比CPU快16倍；功耗上，在GPU上運行的功耗是CPU上的1/8，在DSP上運行的功耗是CPU上的1/25。

　　使用SNPE SDK的基本流程是以TensorFlow、caffe、caffe2做的模型，配置調(diào)用GPU，DSP或CPU的API，然后通過轉(zhuǎn)換工具轉(zhuǎn)換成在DLC格式，再通過SDK讓算法在驍龍移動平臺三種內(nèi)核上運行，實現(xiàn)各種各樣的功能，例如人臉識別、語音識別、文字識別等功能。換言之，Qualcomm SNPE SDK中提供了現(xiàn)成算法和函數(shù)，諸如卷積、池化等常用函數(shù)都已將做好，算法開發(fā)者直接調(diào)用即可。同時還支持用戶定義層（User Defined Layer, UDL）。

　　關(guān)于軟件算法，值得一提的是，過去是傳統(tǒng)算法，現(xiàn)在基于機器學習的算法，速度更快效果更好，而且功耗更低，開發(fā)更為方便。此外隨著算法的進步，對硬件的依賴度降低，例如要拍照清晰，過去通常要高像素分辨率，現(xiàn)在可以不用很貴的硬件，依靠算法提升效果。

　　終端與云端相輔相成

　　那么，相比市面上的一些硬件處理器，高通的特色及與他們的關(guān)系是什么？

　　目前AI芯片有兩種形態(tài)，一種是像Qualcomm一樣是做在一個SoC中，特點是體積更小、功耗更低，運算速度快，因為CPU、GPU和DSP等計算內(nèi)核都做在一個SoC上，會對數(shù)據(jù)搬移、延遲和功耗等進行優(yōu)化。未來隨著運算要求的提升，也許會出現(xiàn)專門運算Neural Network（NN，神經(jīng)網(wǎng)絡(luò)）的核。第二種形態(tài)，是一些公司做的所謂的AI芯片，實際上是在主處理器外做的協(xié)處理器，因此主芯片和外置芯片之間的大量數(shù)據(jù)搬移、交互等將是挑戰(zhàn)。

　　同樣是NN芯片，各家的定位是有差異化的。例如FPGA較為適合在云上或車載等對功率和體積不太講究的應(yīng)用場景。一些IP公司也推出了AI架構(gòu)和指令集，但目前還沒有到定論時。因為各種技術(shù)都是演進過程中，最終要看市場的選擇。

　　Qualcomm與很多云端處理器廠商是相輔相成的關(guān)系。例如云端處理器的GPU非常強大，培訓/training做得非常好，但功耗不理想，據(jù)悉某專用神經(jīng)元網(wǎng)絡(luò)芯片功耗高達30W。云端適合模型的培訓，訓練后的結(jié)果可轉(zhuǎn)移到端去運行。驍龍終端芯片目前不做培訓，但十分擅長運行。 “我們的生態(tài)成長有賴于云端，云端的模型做得越好，越有利于我們AI技術(shù)的實現(xiàn)和落地。”劉學徽經(jīng)理強調(diào)。

　　已與Facebook合作

　　實際上，Qualcomm^? 驍龍^TM 移動平臺在手機端也有靚麗的業(yè)績。例如今年4月18日，F(xiàn)acebook 和高通宣布合作支持 Facebook 開源深度學習框架 Caffe2 和Qualcomm^? 驍龍^TM 神經(jīng)處理引擎（NPE）框架的優(yōu)化。Facebook將在其所有安卓應(yīng)用中集成SNPE SDK，運行在驍龍移動平臺上時，比沒有SNPE的速度提升5倍。

　　隨著中國手機與AI的發(fā)展，期待會有更多的中國算法公司開發(fā)手機上AI應(yīng)用！

新聞中心

AI的下一主戰(zhàn)場：手機與物聯(lián)網(wǎng)終端

評論

相關(guān)推薦

技術(shù)專區(qū)