嵌入式人工智能方向(嵌入式人工智能技術(shù)報(bào)告)
人工智能是兵家必爭(zhēng)之地,在高通的驍龍移動(dòng)平臺(tái)之外,還有蘋(píng)果A11仿生芯片、華為Kirin970內(nèi)置的寒武紀(jì)NPU等產(chǎn)品。但直到高通5月24日的人工智能創(chuàng)新論壇,人工智能應(yīng)用生態(tài)才算真正意義上開(kāi)始組建和落地。
本文引用地址:http://butianyuan.cn/article/202209/438433.htm論壇的核心部分是驍龍710的發(fā)布、高通AI實(shí)驗(yàn)室成立以及高通公布與大批AI廠商合作。除了展示對(duì)人工智能的景愿和布局外,論壇之后,高通還用了多達(dá)9個(gè)展區(qū)進(jìn)行了人工智能產(chǎn)品的DEMO展示。
當(dāng)中涵蓋了端側(cè)個(gè)人助理、加速算法硬件、驍龍AI手機(jī)、AI優(yōu)化物聯(lián)網(wǎng)、未來(lái)汽車(chē)等多個(gè)領(lǐng)域。順著高通的展區(qū)規(guī)劃,就能一路看到高通和它的合作伙伴眼中的人工智能未來(lái)。
智能手機(jī)AI體驗(yàn)
小米、OPPO、vivo、黑鯊、一加、錘子等大家熟悉的手機(jī)廠商,都出現(xiàn)在了高通的產(chǎn)品展示?,F(xiàn)場(chǎng)的驍龍845和驍龍660AIE手機(jī)上,運(yùn)行著一些我們或許熟悉但未曾留意到的AI應(yīng)用。
高通驍龍人工智能平臺(tái)由Hexagon DSP、Adreno GPU 和 Kryo CPU組成的人工智能引擎(即AIE),其構(gòu)架可以直接運(yùn)行商湯科技和曠視Face++的預(yù)先訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。諸如單攝像頭的背景虛化、人臉解鎖、情景識(shí)別檢測(cè)等攝像頭相關(guān)的人工智能應(yīng)用,很多其實(shí)都已經(jīng)被廠商應(yīng)用在量產(chǎn)機(jī)上了。
例如OPPO R15夢(mèng)境版等手機(jī)中提供AI智慧美顏,能根據(jù)人臉特征點(diǎn)、膚色、年齡選擇特定的美顏方案,而小米、vivo、OPPO等廠商能在離線非云端的情況下,進(jìn)行場(chǎng)景和標(biāo)簽識(shí)別,然后配合特定場(chǎng)景自動(dòng)選擇優(yōu)化方案的AI智能場(chǎng)景識(shí)別,相信大家都比較熟悉了。
同樣是起源于AI物體識(shí)別的,現(xiàn)場(chǎng)也展示了2D面部解鎖,和之前在OPPO手機(jī)上使用的前置單攝像頭的AI背景虛化應(yīng)用。
在論壇中宣布和高通合作的網(wǎng)易有道,則展示了非云端的實(shí)景AR翻譯功能。在高通的AI Engine(AIE)人工智能引擎,AR實(shí)景翻譯無(wú)需按下快門(mén),而是直接對(duì)視頻流進(jìn)行動(dòng)態(tài)跟蹤及目標(biāo)識(shí)別,宣稱帶來(lái)了超過(guò)10倍的動(dòng)態(tài)最終范圍提升,減少運(yùn)動(dòng)中70%的無(wú)效識(shí)別,全面提升了識(shí)別準(zhǔn)確度。
騰訊手機(jī)QQ應(yīng)用中的“高能舞室”和曠視Face++的Animoji,等AI和AR交融的應(yīng)用中,則是使用了驍龍人工智能引擎加速幀率,暴力的實(shí)時(shí)非云端視頻流處理,讓用戶可以和畫(huà)面中的虛擬物體進(jìn)行實(shí)時(shí)的交互。另外也有Elliptic Labs的深度人像和超聲波手勢(shì)操控等看起來(lái)很科幻的應(yīng)用。
高通視覺(jué)智能平臺(tái)
在展區(qū)2到展區(qū)4,是使用高通驍龍845工程機(jī)作為樣板的人工智能視覺(jué)展示。人工智能視覺(jué)主要方向很寬,從簡(jiǎn)單到復(fù)雜,囊括了二維碼、手勢(shì)識(shí)別、車(chē)輛檢測(cè)、人臉、人體檢測(cè)等多種應(yīng)用,它們被廣泛地應(yīng)用在監(jiān)控、智能交通、新零售、自然交互等場(chǎng)合。
此前基于深度學(xué)習(xí)的目標(biāo)檢測(cè)技術(shù)運(yùn)算量巨大,無(wú)法在嵌入式設(shè)備中實(shí)際部署。而高通在現(xiàn)場(chǎng)的驍龍845工程機(jī),則使用MobileNet的物體檢測(cè)神經(jīng)網(wǎng)絡(luò)。后者是Google推出的移動(dòng)端本地神經(jīng)網(wǎng)絡(luò),優(yōu)點(diǎn)的輕量化、計(jì)算消耗小、速度快,因此很適合用于手機(jī)或嵌入式視覺(jué)應(yīng)用。
MobileNet的高效模型,其將卷積過(guò)程分為3×3深度方向的卷積和1×1點(diǎn)對(duì)點(diǎn)的卷積,構(gòu)建輕量級(jí)深度神經(jīng)網(wǎng)絡(luò),可以讓移動(dòng)平臺(tái)進(jìn)行實(shí)時(shí)、非云端的物體檢測(cè)。
現(xiàn)場(chǎng)的另外一個(gè)智能視覺(jué)展示,來(lái)自于商湯科技的人臉檢測(cè)和識(shí)別。商湯的主業(yè)是計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí),是中國(guó)最大的人工智能算法供應(yīng)商之一。其智能視覺(jué)用途涵蓋了人臉識(shí)別、圖像識(shí)別、視頻分析、無(wú)人駕駛、醫(yī)療影像識(shí)別等領(lǐng)域。
現(xiàn)場(chǎng)的驍龍845工程機(jī)運(yùn)行的端側(cè)智能視覺(jué)網(wǎng)絡(luò),可以實(shí)時(shí)對(duì)視頻流中的人臉進(jìn)行檢測(cè)和比對(duì)識(shí)別。在現(xiàn)場(chǎng)26幀左右的視頻流中,3人臉出現(xiàn)的動(dòng)態(tài)負(fù)載在50%以下,移動(dòng)端的AI視覺(jué)性能和模型優(yōu)化已經(jīng)達(dá)到了較高的可用度了。
嵌入式自動(dòng)浯音識(shí)別與縱目主泊車(chē)系統(tǒng)
在嵌入式和移動(dòng)端的語(yǔ)音識(shí)別,則是得益于AI的加入而不斷提高精度,在不同的噪音環(huán)境,不再需要特定人聲就能完成精準(zhǔn)識(shí)別。
AI時(shí)代,人機(jī)語(yǔ)音交互依舊需要先把語(yǔ)音轉(zhuǎn)為電腦能理解的文字,隨后就是三角獸等AI語(yǔ)義理解公司的移動(dòng)端語(yǔ)音交互、多輪對(duì)話等人工智能應(yīng)用。
而這個(gè)自動(dòng)語(yǔ)音識(shí)別,被稱為VOICE UI。高通用驍龍845平臺(tái)展示了終端側(cè)的非云端神經(jīng)網(wǎng)絡(luò),對(duì)語(yǔ)音進(jìn)行的實(shí)時(shí)識(shí)別和自動(dòng)語(yǔ)音處理。這個(gè)和Google百度的語(yǔ)音技術(shù)最大的分別是本地性,非云端,在隱私保護(hù)、及時(shí)響應(yīng)和隨時(shí)感知上有巨大的優(yōu)勢(shì)。
在智能駕駛這邊,則是縱目的主泊車(chē)系統(tǒng)。雖然沒(méi)有自動(dòng)駕駛那么兇殘的性能要求,而自動(dòng)泊車(chē)也是低速的自動(dòng)駕駛應(yīng)用,涉及毫米波雷達(dá)、障礙物感知、人體識(shí)別等多個(gè)人工智能領(lǐng)域,當(dāng)中的重點(diǎn)是低能耗和實(shí)時(shí)性的嵌入式開(kāi)發(fā)??v目在上一年末已經(jīng)使用高通驍龍820A平臺(tái),集成了自主泊車(chē)系統(tǒng),宣稱系統(tǒng)功耗已經(jīng)控制在15W以下。而根據(jù)現(xiàn)場(chǎng)介紹,搭載驍龍820A的這套系統(tǒng)甚至可以達(dá)到低速L4自動(dòng)駕駛級(jí)別。
評(píng)論