Audience為行動(dòng)裝置賦予多感運(yùn)算處理能力
藉由來(lái)自人腦接收與處理刺激訊號(hào)的靈感,音訊處理器制造商Audience開(kāi)發(fā)出以神經(jīng)科學(xué)為基礎(chǔ)的多感運(yùn)算處理器技術(shù),在微晶片中模擬人類聽(tīng)覺(jué)處理流程,并提升自然的語(yǔ)音使用體驗(yàn),實(shí)現(xiàn)永不間斷(Always-On)的語(yǔ)音和動(dòng)作感應(yīng)。
本文引用地址:http://butianyuan.cn/article/249112.htmAudience是一家將聽(tīng)覺(jué)神經(jīng)科學(xué)商業(yè)化的公司,主要技術(shù)著重于分析人類大腦如何處理訊號(hào)的方式,并導(dǎo)入于先進(jìn)的DSP音訊晶片方案中。Audience行銷副總裁Bart DeCanne介紹,從2008年年底推出首款產(chǎn)品至今,市場(chǎng)上已有超過(guò)220種行動(dòng)裝置采用Audience的語(yǔ)音處理器,出貨量累積超過(guò)4億顆。
在分析各種感官輸入時(shí),Audience先從聽(tīng)覺(jué)開(kāi)始瞭解人耳如何接收訊號(hào)以及大腦如何進(jìn)行分析與處理。Bart DeCanne表示,“人類大腦在這方面的功能十分強(qiáng)大,例如在一個(gè)集會(huì)中,當(dāng)有十個(gè)人同時(shí)交談時(shí),你可以選擇性地只聽(tīng)到其中一個(gè)人的聲音。”
除了處理聽(tīng)覺(jué)以外,人腦也能處理動(dòng)作感應(yīng)、視覺(jué)等多種感官感覺(jué)。Audience模擬人類神經(jīng)系統(tǒng)從多重感官接收訊息并作出適當(dāng)動(dòng)作與回應(yīng)的方式,開(kāi)發(fā)出最新多感運(yùn)算處理器引擎 eS700 系列與超低功耗動(dòng)作處理器 MQ100 ,預(yù)計(jì)在今年下半年就可見(jiàn)到采用這些處理器的產(chǎn)品上市。Audience eS700多感運(yùn)算處理器家族包括702、703、704、705、752與754,搭載進(jìn)階語(yǔ)音、不間斷偵測(cè)(Always-On) VoiceQ與MotionQ,以及智慧型音訊編解碼器等功能。
VoiceQ是一項(xiàng)低功耗的持續(xù)性語(yǔ)音感應(yīng)技術(shù),能透過(guò)一個(gè)關(guān)鍵字喚醒后,提供毫無(wú)延遲且不間斷的語(yǔ)音偵測(cè)與指令。持續(xù)運(yùn)作的VoiceQ處于隨時(shí)感知狀態(tài),可讓裝置隨時(shí)聆聽(tīng)周遭環(huán)境,并且對(duì)預(yù)先設(shè)定的語(yǔ)音指令做出反應(yīng)。行動(dòng)裝置也只在需要時(shí)被喚醒,并可減少誤判減輕電力消耗,從而實(shí)現(xiàn)<1.5mA電流損耗的超低功耗不間斷語(yǔ)音偵測(cè)。
VoiceQ的差異化關(guān)鍵在于提供人聲辨識(shí)的能力,而不至于受到背景噪音的影響被錯(cuò)誤啟動(dòng)。此外,還可經(jīng)由關(guān)鍵字預(yù)先編程實(shí)現(xiàn)多位使用者驗(yàn)證,讓共用裝置的不同使用者以語(yǔ)音登入取代鍵盤輸入的PIN碼。
進(jìn)階語(yǔ)音技術(shù)讓行動(dòng)裝置無(wú)論如何放置,甚至放在衣服口袋中,都能維持良好的語(yǔ)音品質(zhì);透過(guò)先進(jìn)的雜訊(風(fēng)切聲)抑制演算法,即使在風(fēng)大的環(huán)境以及極端嚴(yán)苛的吵雜條件下也能清楚地?fù)艽蚺c接聽(tīng)電話,大幅改善手機(jī)使用體驗(yàn)。
eS700系列支援兩種擴(kuò)音模式——指向式與360度語(yǔ)音。指向式針對(duì)行動(dòng)裝置最佳位置提供最佳效果;360度語(yǔ)音則不論任何角度都有最佳效果,適合放在桌上進(jìn)行電話會(huì)議及放在杯架上。
Audience智慧型音訊編解碼器eS75X可實(shí)現(xiàn)最佳SNR與類比性能,內(nèi)建所有必要的ADC/DAC以滿足業(yè)界對(duì)于喇叭、頭戴式耳機(jī)、耳內(nèi)式耳機(jī)等驅(qū)動(dòng)單元的需求,并內(nèi)含兩條線路輸出,可搭配AP實(shí)現(xiàn)最佳化效能。此外,自動(dòng)語(yǔ)音辨識(shí)(ASR)輔助演算法則可降低雜訊并保留語(yǔ)音。
MotionQ技術(shù)則支援不間斷偵測(cè)的環(huán)境感知應(yīng)用程式,如安全監(jiān)控、室內(nèi)導(dǎo)航以及手勢(shì)辨識(shí)等,同時(shí)僅消耗不到5mW的功率,顯著低于其他運(yùn)動(dòng)處理器架構(gòu)。
此外,Audience并推出超低功耗的MQ100動(dòng)作感應(yīng)處理器,這是一款專為管理和融合來(lái)自終端設(shè)備各種感測(cè)器資訊而設(shè)計(jì)的動(dòng)作處理器。為了確保終端裝置不間斷偵測(cè),目前的動(dòng)作處理需要感測(cè)器與AP之間持續(xù)通訊,使得功耗高達(dá)60-200mW,但Bart DeCanne強(qiáng)調(diào),高電源效率的MQ100功耗還不到5mW,而且還比任何感測(cè)器中樞MCU的尺寸更小,從而實(shí)現(xiàn)低成本。
Audience最近并宣布與聯(lián)發(fā)科(MediaTek)合作,為其最新MT6592八核心處理器搭配MT6290 LTE基頻處理器的智慧型手機(jī)平臺(tái),提供具備進(jìn)階語(yǔ)音功能的eS700系列智慧音訊編解碼器。Bart DeCanne表示:“透過(guò)Audience預(yù)先整合且經(jīng)測(cè)試的音訊編解碼器全功能音訊子系統(tǒng),可滿足聯(lián)發(fā)科客戶對(duì)于不同音訊功能選項(xiàng)的需求,協(xié)助其減少研發(fā)作業(yè),實(shí)現(xiàn)最佳化音訊處理。”
Audience的多感運(yùn)算處理器器以運(yùn)算聽(tīng)覺(jué)場(chǎng)景分析(CASA)技術(shù)為基礎(chǔ),為行動(dòng)裝置實(shí)現(xiàn)增強(qiáng)的語(yǔ)音通訊與雜訊抑制功能。
評(píng)論