新聞中心

EEPW首頁(yè) > 消費(fèi)電子 > 業(yè)界動(dòng)態(tài) > 全球麥克風(fēng)與音頻處理器出貨預(yù)測(cè)

全球麥克風(fēng)與音頻處理器出貨預(yù)測(cè)

作者: 時(shí)間:2016-09-06 來(lái)源:eettaiwan 收藏

  在先進(jìn)駕駛輔助系統(tǒng)(ADAS)中,結(jié)合視覺(jué)處理器的CMOS影像感測(cè)器已在協(xié)助汽車辨識(shí)與分類方面發(fā)揮關(guān)鍵作用。至于其“聽(tīng)覺(jué)”呢?

本文引用地址:http://butianyuan.cn/article/201609/296558.htm

  也能扮演像攝影機(jī)般重要的角色,為自動(dòng)駕駛車增添更多“智慧”功能嗎?

  DSP Concepts執(zhí)行長(zhǎng)與創(chuàng)辦人Paul Beckmann表示,在汽車和駕駛?cè)税l(fā)現(xiàn)救護(hù)車接近以前,就已經(jīng)聽(tīng)到它的警報(bào)聲響起了。那么為什么汽車產(chǎn)業(yè)不會(huì)對(duì)音訊感興趣?

  系統(tǒng)OEM廠商(不只是汽車制造商)目前正處于“使用更多以便為人工智慧(AI)產(chǎn)生另一種重要感測(cè)器資料——音訊”的關(guān)鍵時(shí)刻,Beckmann解釋。

  正如他所預(yù)設(shè)的,音訊正“從單純的在娛樂(lè)系統(tǒng)中播放,朝向在情境架構(gòu)中實(shí)現(xiàn)輸入、觸發(fā)與分析。”

  由 所拾取的智慧,也可能用于日常生活的各種系統(tǒng)中,從汽車、數(shù)位虛擬助理到可攜式裝置等。“視覺(jué)與聽(tīng)覺(jué)應(yīng)該并駕齊驅(qū),”DSP Concepts業(yè)務(wù)與行銷執(zhí)行總裁Willard Tu表示。“狗吠聲、嬰兒哭鬧、玻璃碎裂、汽車?yán)?、警?bào)聲與槍聲等等......音訊有助于讓系統(tǒng)更有效地掌握環(huán)境[和情境]。”

  

 

  圖1:音訊“輸入”演算法發(fā)展藍(lán)圖 (來(lái)源:DSP Concepts)

  如今,有兩個(gè)重要的發(fā)展趨勢(shì)推動(dòng)電子產(chǎn)業(yè)突然在音訊領(lǐng)域迅速發(fā)展。

  一 是擁有多顆麥克風(fēng)的智慧型手機(jī)普及;其次則是數(shù)位虛擬助理的流行,如Amazon Echo與Google Home。根據(jù)SAR Insight & Consulting總監(jiān)與首席分析師Peter Cooney的觀察,“一般消費(fèi)裝置中整合虛擬數(shù)位助理的應(yīng)用越來(lái)越多,帶動(dòng)感知與采用語(yǔ)音作為自然的使用者介面,應(yīng)用于許多日常任務(wù)中。”

  但是,麥克風(fēng)能多快超越作為一種自然使用者介面的角色,開(kāi)始變成真正的‘智慧感測(cè)器’?看來(lái)業(yè)界還得等待一些進(jìn)展。

  為了迎接挑戰(zhàn),音訊需要可以拾取更佳音質(zhì)的麥克風(fēng)、善于后處于音訊的處理器、預(yù)處理音訊的有效演算法、易于使用的音訊處理工具、相當(dāng)于繪圖用Open GL的音訊標(biāo)準(zhǔn),以及能以最小功耗維持永不斷線的麥克風(fēng)。

  總之,如同Cooney所指出的,市場(chǎng)需要“始終保持監(jiān)聽(tīng)的技術(shù)、語(yǔ)音增強(qiáng)演算法以及麥克風(fēng)。”

  在ARM處理器上實(shí)現(xiàn)音訊處理

  音訊處理以往是播放系統(tǒng)(如TV、DVD和Hi-Fi音響系統(tǒng)中的等化器)才需要的專業(yè)領(lǐng)域。

  而今在智慧型手機(jī)和其他家用裝置的麥克風(fēng)普及帶動(dòng)下,音訊處理任務(wù)已經(jīng)擴(kuò)展到幾乎無(wú)處不在。專用音訊DSP也并不是系統(tǒng)中處理音訊的唯一晶片了。

  隨著越來(lái)越多的音訊開(kāi)始在ARM處理器上執(zhí)行,Beckmann指出,更多的OEM“熱切地將麥克風(fēng)視為”AI的輸入感測(cè)器。DSP Concepts正處于觀察這一市場(chǎng)過(guò)渡的最佳位置。

  Beckmann看好市場(chǎng)成長(zhǎng)的態(tài)勢(shì),特別是因?yàn)樵摴疽豢罘Q為Audio Weaver在過(guò)去一年來(lái)的成果。如同Beckmann描述的,這是“唯一一款可跨平臺(tái)作業(yè)的繪圖音訊設(shè)計(jì)架構(gòu)。”

  業(yè) 界分析家認(rèn)為,DSP Concepts正占據(jù)音訊市場(chǎng)上的獨(dú)特位置。TECHnalysis Research總裁兼首席分析師Bob O'Donnell認(rèn)為:“我并未看到DSP Concepts或其Audio Weave工具面對(duì)哪幾家競(jìng)爭(zhēng)對(duì)手。許多公司都針對(duì)音樂(lè)與錄音等目的進(jìn)行專業(yè)的音訊剪輯與音訊處理,但這畢竟是不同的領(lǐng)域。”

  庫(kù)尼表示同意。“我不知道任何競(jìng)爭(zhēng)產(chǎn)品音頻織女的。”他補(bǔ)充說(shuō),“DSP概念有其他的產(chǎn)品也是如此,如聲音增強(qiáng)算法(噪音抑制,回聲取消,波束賦形),基準(zhǔn)和參考設(shè)計(jì)。”

  Cooney也同意這一看法。“我還不知道Audio Weaver有任何競(jìng)對(duì)手。”他補(bǔ)充說(shuō),“DSP Concepts也有其他的產(chǎn)品,例如聲音增強(qiáng)演算法(雜訊抑制、回音消除、波木成形等)、基準(zhǔn)與參考設(shè)計(jì)。”

  

 

  圖2:全球麥克風(fēng)與音訊處理器市場(chǎng) (來(lái)源:SAR Insights & Consulting)

  DSP Concepts并未設(shè)計(jì)或銷售DSP。然而,競(jìng)爭(zhēng)對(duì)手一般都是其他的DSP業(yè)者。Audio Weaver的競(jìng)爭(zhēng)產(chǎn)品來(lái)自德州儀器(TI)或Cirrus Logic等DSP供應(yīng)商自行打造的音訊工具。其差異之處在于那些內(nèi)部開(kāi)發(fā)的工具僅用于DSP供應(yīng)商自家的晶片。而采用像Audio Weaver這樣的獨(dú)立平臺(tái)工具,Tu強(qiáng)調(diào),“OEM不必被限制于一種特定的DSP。”

  Cooney說(shuō),DSP Concepts藉由與Cadence/Tensilica等許多公司合作,主要的業(yè)務(wù)在于為其客戶提供音訊設(shè)計(jì)解決方案。

  除 了Audio Weaver工具,DSP Concepts也授權(quán)一些可形成麥克風(fēng)輸入的音訊演算法,包括波束成形、回聲消除、雜訊消除與遠(yuǎn)音場(chǎng)(far-field sound)等演算法。Beckmann指出,在此業(yè)界缺乏深諳音訊處理的工程人才之際,市場(chǎng)亟需易于使用的音訊預(yù)處理演算法,以便能從不需要的環(huán)境雜訊 中區(qū)隔出聲音來(lái)。

  音訊:長(zhǎng)期受冷落的領(lǐng)域

  然而,目前使用音訊進(jìn)行聲學(xué)事件檢測(cè)(和分析)仍然是一種相對(duì)較新的應(yīng)用。

  O’Donnell指出,“理論上,可能會(huì)有更多專用音訊處理器在做AI,但坦白說(shuō),音訊就像是長(zhǎng)期受到視訊的冷落一樣,而且時(shí)至今日也是如此。”

  他補(bǔ)充說(shuō),聲音的另一項(xiàng)重大挑戰(zhàn)是“語(yǔ)言與意義”。他說(shuō),“一張樹(shù)的圖片以任何語(yǔ)言來(lái)說(shuō)是樹(shù),但要瞭解字、詞以及最重要的意義與意圖,就具有語(yǔ)言與文化的獨(dú)特性了。這使得語(yǔ)音辨識(shí)與自然語(yǔ)言的處理變得十分困難。”

  Beckmann坦承,音訊缺乏標(biāo)準(zhǔn),也造成了差距。

  以O(shè)penGL來(lái)看,它是一種針對(duì)圖形渲染的跨語(yǔ)言、跨平臺(tái)API。對(duì)于想要編寫(xiě)程式碼的視訊游戲設(shè)計(jì)人員來(lái)說(shuō),這種API十分重要。像Nvidia等GPU供應(yīng)商在使用這種API后就能最佳化其硬體。

  音訊世界則可以使用硬體抽象層來(lái)實(shí)現(xiàn)跨平臺(tái)的硬體加速渲染,類似于OpenGL所扮演的角色一樣。如果缺乏標(biāo)準(zhǔn),每一家音訊晶片公司都必須最佳化自家硬體以及自給自足。缺乏標(biāo)準(zhǔn)延緩了擴(kuò)展跨平臺(tái)的音訊應(yīng)用所需的創(chuàng)新腳步。

  實(shí)現(xiàn)永不斷電的續(xù)航力

  Amazon Echo或Google Home等流行的數(shù)位虛擬助理下一步要實(shí)現(xiàn)的就是“長(zhǎng)時(shí)傾聽(tīng)”(always-listening)的能力。Amazon正透過(guò)其‘tap-then- speak’的語(yǔ)音啟動(dòng)機(jī)制加速這方面的進(jìn)展。但該裝置還不能稱得上是‘always listening’。

  

 

  圖3:全球語(yǔ)音介面與長(zhǎng)時(shí)傾聽(tīng)技術(shù)市場(chǎng) (來(lái)源:SAR Insights & Consulting)

  具有永不斷線/長(zhǎng)時(shí)傾聽(tīng)能力的裝置一旦走出家門,將開(kāi)始面臨各種挑戰(zhàn)。到了戶外,它的音訊處理能力必須從背景雜訊中區(qū)隔出需要聽(tīng)到的聲音。此外,Beckmann強(qiáng)調(diào),更大的問(wèn)題還在于電池壽命。

  為此,他指出,“位于波士頓的新創(chuàng)公司Vesper開(kāi)發(fā)的靜態(tài)感測(cè)MEMS元件就十分關(guān)鍵。”Vesper專門開(kāi)發(fā)壓電MEMS麥克風(fēng),不久前還發(fā)布了一款新的聲學(xué)感測(cè)器,可利用聲能喚醒完全待機(jī)中的系統(tǒng)。

  Vesper 執(zhí)行長(zhǎng)Matt Crowley表示,這款新的壓電MEMS麥克風(fēng)VM1010可在傾聽(tīng)模式下汲取僅3μA電流,該元件預(yù)計(jì)在今年第四季出樣。Crowley并承 諾,VM1010的新版本將會(huì)配備“鑒頻”(frequency discrimination)功能。這表示系統(tǒng)設(shè)計(jì)者可因應(yīng)槍聲、玻璃粉碎或人聲等特定的雜訊特性編程MEMS麥克風(fēng)。

  汽車內(nèi)部

  回過(guò)頭來(lái)看看汽車內(nèi)部的音訊應(yīng)用。語(yǔ)音為汽車內(nèi)部提供了自然的人機(jī)介面(HMI)。

  為了提高駕駛?cè)耸褂妹獬致?tīng)筒的語(yǔ)音品質(zhì),一線業(yè)者與汽車OEM嚴(yán)重地依賴音訊處理技術(shù)。Beckmann說(shuō),“配備多聲道(從8-32聲道)揚(yáng)聲器的汽車,帶來(lái)了十分復(fù)雜的音訊系統(tǒng)。”

  不 僅如此,隨著電動(dòng)車的出現(xiàn),汽車產(chǎn)業(yè)開(kāi)始使用假引擎噪音——或“電子聲音”。從BMW到福斯(Volkswagen)等越來(lái)越多的汽車制造商開(kāi)始玩各種共 鳴放大器技巧。事實(shí)上,不只是電動(dòng)車,當(dāng)今更省油的引擎聲音更安靜,也較不那么有力了。汽車制造商擔(dān)心所有的平靜可能會(huì)讓潛在買家卻步。

  對(duì)于汽車產(chǎn)業(yè)的許多人來(lái)說(shuō),音訊是熟悉的領(lǐng)域。汽車制造商們知道,音訊可以為其提供差異化。車內(nèi)的聲學(xué)感測(cè)器不僅可以聽(tīng)到外面發(fā)生的事情,未來(lái),車子自己的引擎也能夠針對(duì)診斷應(yīng)用偵測(cè)任何異常情況。



關(guān)鍵詞: 麥克風(fēng) 音頻處理器

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉