能語音爭奪戰(zhàn)下,意法半導(dǎo)體不止STM32一把利器?
智能語音作為入口已滲透到了很多領(lǐng)域,從智能音箱到智能臺燈,從智能家電到汽車的智能中控、后視鏡,以及工業(yè)或陪伴式機器人,智能語音可在消費、汽車、教育、工業(yè)等各個領(lǐng)域開花結(jié)果。
本文引用地址:http://butianyuan.cn/article/201709/364035.htm所謂的智能語音就是給語音加了“大腦”,讓其理解用戶通過語音表達出來的意圖和需求,并且可以把對應(yīng)的內(nèi)容返回給用戶。
“現(xiàn)階段,智能語音的落地主要受消費電子市場激烈的競爭格局所驅(qū)動,各廠商都期望賦予產(chǎn)品新賣點與新亮點。語音在消費市場尤為火熱,除了蘋果、谷歌、亞馬遜等行業(yè)巨頭紛紛入場之外,還存在眾多跟風(fēng)者。而其它領(lǐng)域,如汽車電子、工業(yè)醫(yī)療等,由于行業(yè)門檻或需求不集中等原因,雖被看好但仍需一定時間才能被市場接受。” 意法半導(dǎo)體模擬、微電機產(chǎn)品部市場經(jīng)理倪明如是說。
意法半導(dǎo)體模擬、微電機產(chǎn)品部市場經(jīng)理倪明
市面上有很多智能語音方案,背后的關(guān)鍵技術(shù)是硬件、算法以及云服務(wù)。
倪明介紹道:“意法半導(dǎo)體在硬件上有自己的特色,能夠提供市場上應(yīng)用很普遍的STM32系列MCU作為主控,再加上2顆或4顆硅麥克風(fēng)組成麥克風(fēng)陣列;在聲學(xué)算法方面,意法半導(dǎo)體可提供Beam Forming (語音指向)、Sound Localization (聲源定位)、Echo Cancelation (回聲消除) 這些聲學(xué)前端算法,后端的聲學(xué)算法如本地、云端的語音識別,將由第三方合作伙伴 (如Sensory、科大訊飛等) 來提供。”
對于近場語音識別,比如智能穿戴、陪伴式機器人,上述意法半導(dǎo)體方案即可滿足需求;對于遠場的語音識別,比如智能音箱,意法半導(dǎo)體將負責(zé)語音前端處理,AP或DSP的第三方算法將負責(zé)后端處理,因此需要與高通等后端AP廠商配合實現(xiàn)。
倪明表示:各廠商的智能語音方案都獨具特色,現(xiàn)有的語音方案在功能上基本滿足了市場的需求,但可擴展性及性能仍有改進空間。比如使用者會經(jīng)常遇到聽不到、聽不清的情況,語音產(chǎn)品易被干擾且存在功耗大等問題。解決這些問題需要系統(tǒng)各方面的共同改進。意法半導(dǎo)體本著開放的態(tài)度與行業(yè)各方合作共贏。
倪明指出理想的應(yīng)用或產(chǎn)品應(yīng)該是“按需分配”:即根據(jù)用戶或市場的需求,系統(tǒng)可以做出適當(dāng)?shù)娜∩崤c調(diào)整。與此同時,倪明介紹了意法半導(dǎo)體在理想化產(chǎn)品道路上做出的努力:
作為系統(tǒng)基礎(chǔ)的硬件,硅麥克風(fēng)至關(guān)重要。意法半導(dǎo)體在提高其本體性能方面,將SNR提高到65~67dB、 AOP提高到135dBSPL,以及在麥克風(fēng)ASIC電路中加入抗干擾的設(shè)計等;
在意法半導(dǎo)體Beamforming算法庫中有4種針對不同應(yīng)用場景的模式供選擇,既有適用于智能穿戴等語音方向較確定的場景下強指向模式 (Strong) ,也有適用于語音方向范圍較寬、環(huán)境噪聲較大場景下的消噪模式 (Cardioid denoise) ;
在功耗方面,意法半導(dǎo)體新發(fā)布的MP23DB01HP數(shù)字硅麥克風(fēng)可以支持低功耗模式,該模式下麥克風(fēng)的功耗還不到正常模式的一半,極大地提高了系統(tǒng)的持續(xù)工作時間。例如手機穿戴產(chǎn)品中需要集成度更高、更加低功耗的方案,意法半導(dǎo)體正在與合作伙伴研發(fā)將麥克風(fēng)與DSP合二為一的芯片“Smart MIC”,該芯片將大大節(jié)約PCB布板空間及系統(tǒng)功耗。
評論