新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 嵌入式人工智能應(yīng)用廣泛興起但門(mén)檻正在提高

嵌入式人工智能應(yīng)用廣泛興起但門(mén)檻正在提高

作者:Benny Har-Even 時(shí)間:2018-07-30 來(lái)源:電子產(chǎn)品世界 收藏

  現(xiàn)在,我們每天使用的很多設(shè)備都利用了神經(jīng)網(wǎng)絡(luò)技術(shù):在智能手機(jī)中它們?yōu)檎掌阉鞴δ芴峁┲С?,還用于人臉識(shí)別幫助大家使用人臉解鎖手機(jī);它們可以通過(guò)識(shí)別車(chē)牌了解你駕車(chē)駛?cè)牖螂x開(kāi)擁堵區(qū)。它們足夠的“聰明”,能夠檢測(cè)一個(gè)人的肢體語(yǔ)言——這對(duì)監(jiān)控系統(tǒng)非常的有用,它們也被應(yīng)用到帶攝像頭的AV系統(tǒng)中,可以識(shí)別每個(gè)人并讓系統(tǒng)提供個(gè)性化的內(nèi)容服務(wù),在汽車(chē)上涉及的應(yīng)用包括車(chē)道偏離預(yù)警、司機(jī)狀態(tài)監(jiān)控等,此外,通過(guò)大量實(shí)驗(yàn)和應(yīng)用證明神經(jīng)網(wǎng)絡(luò)比人類(lèi)更擅長(zhǎng)檢測(cè)皮膚癌——可見(jiàn)神經(jīng)網(wǎng)絡(luò)的應(yīng)用既廣泛又多樣。

本文引用地址:http://butianyuan.cn/article/201807/389743.htm

  區(qū)別于“傳統(tǒng)”一切都基于云的(AI),這些基于現(xiàn)場(chǎng)應(yīng)用設(shè)備的神經(jīng)網(wǎng)絡(luò)計(jì)算,可以被稱(chēng)為AI;這是一個(gè)快速發(fā)展但也渴求技術(shù)創(chuàng)新的市場(chǎng),也是眾多SoC設(shè)計(jì)公司正在以創(chuàng)新產(chǎn)品去開(kāi)拓的市場(chǎng)。隨著Imagination在去年9月推出Series2NX神經(jīng)網(wǎng)絡(luò)加速器(NNA),AI加速領(lǐng)域內(nèi)的游戲規(guī)則正在被改變。現(xiàn)在,我們以Imagination新發(fā)布的兩款內(nèi)核產(chǎn)品為例,來(lái)分析不同應(yīng)用市場(chǎng)對(duì)AI的綜合性能指標(biāo)。這兩款產(chǎn)品是面向高端市場(chǎng)的PowerVR AX2185,以及面向中檔市場(chǎng)的AX2145。下面我們將詳細(xì)地向大家介紹。

  神經(jīng)網(wǎng)絡(luò)作為解決問(wèn)題以及驅(qū)動(dòng)多領(lǐng)域新型應(yīng)用的工具正變得越來(lái)越流行,下圖分別說(shuō)明了在移動(dòng)設(shè)備和智能監(jiān)控?cái)z像機(jī)等領(lǐng)域內(nèi)快速發(fā)展的嵌入式AI應(yīng)用。

  雖然神經(jīng)網(wǎng)絡(luò)可以進(jìn)行離線(xiàn)訓(xùn)練,但是在進(jìn)行推斷處理時(shí)——運(yùn)行神經(jīng)網(wǎng)絡(luò)實(shí)時(shí)識(shí)別和處理對(duì)象——有必要將這些技術(shù)轉(zhuǎn)移到終端設(shè)備中,而不是將這些任務(wù)放在云端進(jìn)行處理。舉一個(gè)例子:無(wú)人機(jī),它們的飛行速度可以超過(guò)150mph(英里每小時(shí)),神經(jīng)網(wǎng)絡(luò)可以驅(qū)動(dòng)碰撞檢測(cè)系統(tǒng),然而如果沒(méi)有專(zhuān)門(mén)的硬件來(lái)進(jìn)行圖像處理,無(wú)人機(jī)將需要看到前方10-15米的物體才能避開(kāi)障礙物。由于發(fā)送和接收信息所需的延遲和帶寬,云服務(wù)器并不是合適的解決方案。搭建專(zhuān)用PowerVR NNA的無(wú)人機(jī)能夠以每小時(shí)150英里的速度飛行,并且避開(kāi)1米以?xún)?nèi)的障礙物,這大大提高了響應(yīng)能力和安全性,并增強(qiáng)這類(lèi)應(yīng)用的創(chuàng)造性。

  專(zhuān)用神經(jīng)網(wǎng)絡(luò)硬件往往被視為SoC集成中的下一步,在20世紀(jì)80年代除了早期的桌面CPU之外還集成了數(shù)字協(xié)同處理器,而且很快就成為了這類(lèi)設(shè)計(jì)的標(biāo)準(zhǔn)。雖然很多計(jì)算任務(wù)已經(jīng)從CPU轉(zhuǎn)移到GPU上來(lái),但這對(duì)于工作來(lái)說(shuō)仍然不是最有效的設(shè)計(jì)工具,將它們轉(zhuǎn)移到專(zhuān)用的本地硬件才是符合邏輯的解決方案,性能優(yōu)勢(shì)是顯而易見(jiàn)的,采用高端GPU檢索1000張圖片需要60秒,但是使用我們的NNA只需要2秒,之前的方案對(duì)這些圖片進(jìn)行分類(lèi)要消耗1%的電量,但是NNA消耗1%的電量可以處理42萬(wàn)8千張圖片,這是非常具有說(shuō)服力的。

  去年9月,Imagination推出的Series2NX加速器是基于神經(jīng)網(wǎng)絡(luò)推理而構(gòu)建的,是目前業(yè)界性能最好的解決方案,同時(shí)這些加速器還對(duì)所有的主要卷積神經(jīng)網(wǎng)絡(luò)層提供支持,比如Inception、ResNet,框架包括Tensorflow、Caffe2和PyTorch等。

  該解決方案一個(gè)關(guān)鍵的差異化因素在于它提供了靈活的精度,使用由16位數(shù)據(jù)組成的經(jīng)過(guò)訓(xùn)練的網(wǎng)絡(luò)可以達(dá)到非常高的準(zhǔn)確度,然而使用較低的精度訓(xùn)練網(wǎng)絡(luò)意味著仍然可以保持較高的精度,而且其優(yōu)勢(shì)是可以顯著降低功耗和帶寬。在實(shí)際情況中這使得將NNA集成到智能相機(jī)、智能手機(jī)等嵌入式設(shè)備中可以花費(fèi)較低的成本同時(shí)保持較高的實(shí)用性。針對(duì)這些已經(jīng)被驗(yàn)證過(guò)的創(chuàng)新,查看Imagination網(wǎng)站上相關(guān)博客,可以了解更多關(guān)于采用高效推理訓(xùn)練神經(jīng)網(wǎng)絡(luò)的處理過(guò)程和好處。

  下表展示了精度靈活性的好處,簡(jiǎn)而言之采用4位精度你可以大幅度降低功耗和帶寬(內(nèi)存)需求,精確度僅下降1%,這在大多數(shù)實(shí)際情況下對(duì)于設(shè)備的效率沒(méi)有明顯的影響。下面,我們以Imagination的兩款神經(jīng)網(wǎng)絡(luò)加速器為例,來(lái)說(shuō)明不同市場(chǎng)對(duì)性能指標(biāo)和其他因素的考量:

  PowerVR AX2185

  Imagination的Series2NX已經(jīng)在市場(chǎng)上取得了成功并且已經(jīng)授權(quán)給多家廠商,今天它們正在不斷擴(kuò)大市場(chǎng)的選擇范圍。首先,通過(guò)增強(qiáng)原始內(nèi)核推出了PowerVR AX2185,其次發(fā)布另一個(gè)版本即PowerVR AX2145。一個(gè)關(guān)鍵的新特性是這兩款核心都增加了對(duì)Android NN API的硬件支持,使得開(kāi)發(fā)人員能夠開(kāi)發(fā)更多基于深度學(xué)習(xí)的應(yīng)用,大大豐富了安卓市場(chǎng)應(yīng)用。

  從性能角度來(lái)看,PowerVR AX2185面向的是高端嵌入式市場(chǎng),它集成了8個(gè)全位寬計(jì)算引擎,能夠提供每秒最多可達(dá)4.1兆赫的運(yùn)算,在目前市場(chǎng)上其每平方毫米性能參數(shù)是最高的。實(shí)際上這個(gè)水平是最新的桌面GPU性能的3.5倍。對(duì)于那些正在使用功耗較高的GPU進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練的公司來(lái)說(shuō),這是非常具有吸引力的,尤其是汽車(chē)領(lǐng)域。與友商提供的硬件解決方案相比,基于4位數(shù)據(jù)的網(wǎng)絡(luò)AX2185僅需要50%的帶寬,而與基于DSP的競(jìng)爭(zhēng)廠商的方案相比則降低了75%。

  雖然高端設(shè)備已經(jīng)具備了人臉解鎖等諸多功能,但是這些功能正在迅速地更新迭代,設(shè)備制造商希望以更低的價(jià)格提供這些功能,當(dāng)然消費(fèi)者也想為他們的手機(jī)支付更少的錢(qián)但同時(shí)還能擁有相同甚至更好的功能,比如智能相機(jī)確保家庭安全、智能手機(jī)的人臉解鎖等。是的,消費(fèi)者也想分享這個(gè)蛋糕。

  PowerVR AX2145

  如何在內(nèi)存有限的設(shè)備上保持這種用戶(hù)體驗(yàn)?zāi)?答案是PowerVR AX2145。它為性能效率而調(diào)整了整體性能,此外它高度調(diào)優(yōu)了矢量計(jì)算,卷積引擎結(jié)合了優(yōu)化的內(nèi)核存儲(chǔ)結(jié)構(gòu),能夠提供明顯的最大性能參數(shù),而且與AX2185相比每平方毫米面積的推理性能提升了50%,同時(shí)降低了系統(tǒng)峰值內(nèi)存帶寬(以GB/s計(jì)算)。我們?yōu)槠鋵?shí)現(xiàn)的性能和效率之間的平衡而感到驕傲,我們認(rèn)為這對(duì)于成本敏感的設(shè)備是非常理想的選擇。

  開(kāi)發(fā)工具包也是值得去考量的另一個(gè)因素,這是因?yàn)橛布旧聿⒉荒芩闶墙鉀Q方案。Imagination這樣的領(lǐng)先廠商提供了PowerVR AI工具包,這大大簡(jiǎn)化了用戶(hù)的部署流程,調(diào)試和網(wǎng)絡(luò)分析都非常的簡(jiǎn)單,此外,它還支持對(duì)訓(xùn)練后的網(wǎng)絡(luò)進(jìn)行優(yōu)化,其中的API支持包括IMG DNN和Android DNN,提供GPU和NNA之間無(wú)縫的互操作性。

  總結(jié)

  面對(duì)快速發(fā)展的嵌入式AI市場(chǎng),隨著諸如Imagination這兩款全新內(nèi)核產(chǎn)品的新引擎不斷推出,業(yè)界將能夠在終端設(shè)備上實(shí)現(xiàn)低成本的AI功能,為消費(fèi)者提供更多新型的AI應(yīng)用程序。通過(guò)這些核心將能夠滿(mǎn)足開(kāi)發(fā)人員創(chuàng)建應(yīng)用程序所需的性能要求,真正實(shí)現(xiàn)帶來(lái)的變革,而且這些這些提升將很快會(huì)變成現(xiàn)實(shí),它將涉及多個(gè)應(yīng)用市場(chǎng)比如智能手機(jī)、智能相機(jī)和汽車(chē)等。未來(lái)的可能性是無(wú)限的,唯一需要的就是一點(diǎn)兒想象力(Imagination)。

  作者:Benny Har-Even

  職務(wù):Imagination Technologies技術(shù)傳播專(zhuān)家



關(guān)鍵詞: 嵌入式 人工智能

評(píng)論


相關(guān)推薦

技術(shù)專(zhuān)區(qū)

關(guān)閉