Audience為行動裝置賦予多感運(yùn)算處理能力
藉由來自人腦接收與處理刺激訊號的靈感,音訊處理器制造商Audience開發(fā)出以神經(jīng)科學(xué)為基礎(chǔ)的多感運(yùn)算處理器技術(shù),在微晶片中模擬人類聽覺處理流程,并提升自然的語音使用體驗(yàn),實(shí)現(xiàn)永不間斷(Always-On)的語音和動作感應(yīng)。
本文引用地址:http://butianyuan.cn/article/249112.htmAudience是一家將聽覺神經(jīng)科學(xué)商業(yè)化的公司,主要技術(shù)著重于分析人類大腦如何處理訊號的方式,并導(dǎo)入于先進(jìn)的DSP音訊晶片方案中。Audience行銷副總裁Bart DeCanne介紹,從2008年年底推出首款產(chǎn)品至今,市場上已有超過220種行動裝置采用Audience的語音處理器,出貨量累積超過4億顆。
在分析各種感官輸入時,Audience先從聽覺開始瞭解人耳如何接收訊號以及大腦如何進(jìn)行分析與處理。Bart DeCanne表示,“人類大腦在這方面的功能十分強(qiáng)大,例如在一個集會中,當(dāng)有十個人同時交談時,你可以選擇性地只聽到其中一個人的聲音。”
除了處理聽覺以外,人腦也能處理動作感應(yīng)、視覺等多種感官感覺。Audience模擬人類神經(jīng)系統(tǒng)從多重感官接收訊息并作出適當(dāng)動作與回應(yīng)的方式,開發(fā)出最新多感運(yùn)算處理器引擎 eS700 系列與超低功耗動作處理器 MQ100 ,預(yù)計(jì)在今年下半年就可見到采用這些處理器的產(chǎn)品上市。Audience eS700多感運(yùn)算處理器家族包括702、703、704、705、752與754,搭載進(jìn)階語音、不間斷偵測(Always-On) VoiceQ與MotionQ,以及智慧型音訊編解碼器等功能。
VoiceQ是一項(xiàng)低功耗的持續(xù)性語音感應(yīng)技術(shù),能透過一個關(guān)鍵字喚醒后,提供毫無延遲且不間斷的語音偵測與指令。持續(xù)運(yùn)作的VoiceQ處于隨時感知狀態(tài),可讓裝置隨時聆聽周遭環(huán)境,并且對預(yù)先設(shè)定的語音指令做出反應(yīng)。行動裝置也只在需要時被喚醒,并可減少誤判減輕電力消耗,從而實(shí)現(xiàn)<1.5mA電流損耗的超低功耗不間斷語音偵測。
VoiceQ的差異化關(guān)鍵在于提供人聲辨識的能力,而不至于受到背景噪音的影響被錯誤啟動。此外,還可經(jīng)由關(guān)鍵字預(yù)先編程實(shí)現(xiàn)多位使用者驗(yàn)證,讓共用裝置的不同使用者以語音登入取代鍵盤輸入的PIN碼。
進(jìn)階語音技術(shù)讓行動裝置無論如何放置,甚至放在衣服口袋中,都能維持良好的語音品質(zhì);透過先進(jìn)的雜訊(風(fēng)切聲)抑制演算法,即使在風(fēng)大的環(huán)境以及極端嚴(yán)苛的吵雜條件下也能清楚地?fù)艽蚺c接聽電話,大幅改善手機(jī)使用體驗(yàn)。
eS700系列支援兩種擴(kuò)音模式——指向式與360度語音。指向式針對行動裝置最佳位置提供最佳效果;360度語音則不論任何角度都有最佳效果,適合放在桌上進(jìn)行電話會議及放在杯架上。
Audience智慧型音訊編解碼器eS75X可實(shí)現(xiàn)最佳SNR與類比性能,內(nèi)建所有必要的ADC/DAC以滿足業(yè)界對于喇叭、頭戴式耳機(jī)、耳內(nèi)式耳機(jī)等驅(qū)動單元的需求,并內(nèi)含兩條線路輸出,可搭配AP實(shí)現(xiàn)最佳化效能。此外,自動語音辨識(ASR)輔助演算法則可降低雜訊并保留語音。
MotionQ技術(shù)則支援不間斷偵測的環(huán)境感知應(yīng)用程式,如安全監(jiān)控、室內(nèi)導(dǎo)航以及手勢辨識等,同時僅消耗不到5mW的功率,顯著低于其他運(yùn)動處理器架構(gòu)。
此外,Audience并推出超低功耗的MQ100動作感應(yīng)處理器,這是一款專為管理和融合來自終端設(shè)備各種感測器資訊而設(shè)計(jì)的動作處理器。為了確保終端裝置不間斷偵測,目前的動作處理需要感測器與AP之間持續(xù)通訊,使得功耗高達(dá)60-200mW,但Bart DeCanne強(qiáng)調(diào),高電源效率的MQ100功耗還不到5mW,而且還比任何感測器中樞MCU的尺寸更小,從而實(shí)現(xiàn)低成本。
Audience最近并宣布與聯(lián)發(fā)科(MediaTek)合作,為其最新MT6592八核心處理器搭配MT6290 LTE基頻處理器的智慧型手機(jī)平臺,提供具備進(jìn)階語音功能的eS700系列智慧音訊編解碼器。Bart DeCanne表示:“透過Audience預(yù)先整合且經(jīng)測試的音訊編解碼器全功能音訊子系統(tǒng),可滿足聯(lián)發(fā)科客戶對于不同音訊功能選項(xiàng)的需求,協(xié)助其減少研發(fā)作業(yè),實(shí)現(xiàn)最佳化音訊處理。”
Audience的多感運(yùn)算處理器器以運(yùn)算聽覺場景分析(CASA)技術(shù)為基礎(chǔ),為行動裝置實(shí)現(xiàn)增強(qiáng)的語音通訊與雜訊抑制功能。
評論