能語音爭奪戰(zhàn)下，意法半導(dǎo)體不止STM32一把利器？

作者：時間：2017-09-08 來源：與非網(wǎng)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

　　智能語音作為入口已滲透到了很多領(lǐng)域，從智能音箱到智能臺燈，從智能家電到汽車的智能中控、后視鏡，以及工業(yè)或陪伴式機器人，智能語音可在消費、汽車、教育、工業(yè)等各個領(lǐng)域開花結(jié)果。

本文引用地址：http://butianyuan.cn/article/201709/364035.htm

　　所謂的智能語音就是給語音加了“大腦”，讓其理解用戶通過語音表達出來的意圖和需求，并且可以把對應(yīng)的內(nèi)容返回給用戶。

　　“現(xiàn)階段，智能語音的落地主要受消費電子市場激烈的競爭格局所驅(qū)動，各廠商都期望賦予產(chǎn)品新賣點與新亮點。語音在消費市場尤為火熱，除了蘋果、谷歌、亞馬遜等行業(yè)巨頭紛紛入場之外，還存在眾多跟風(fēng)者。而其它領(lǐng)域，如汽車電子、工業(yè)醫(yī)療等，由于行業(yè)門檻或需求不集中等原因，雖被看好但仍需一定時間才能被市場接受。” 意法半導(dǎo)體模擬、微電機產(chǎn)品部市場經(jīng)理倪明如是說。

　　意法半導(dǎo)體模擬、微電機產(chǎn)品部市場經(jīng)理倪明

　　市面上有很多智能語音方案，背后的關(guān)鍵技術(shù)是硬件、算法以及云服務(wù)。

　　倪明介紹道：“意法半導(dǎo)體在硬件上有自己的特色，能夠提供市場上應(yīng)用很普遍的STM32系列MCU作為主控，再加上2顆或4顆硅麥克風(fēng)組成麥克風(fēng)陣列;在聲學(xué)算法方面，意法半導(dǎo)體可提供Beam Forming (語音指向)、Sound Localization (聲源定位)、Echo Cancelation (回聲消除) 這些聲學(xué)前端算法，后端的聲學(xué)算法如本地、云端的語音識別，將由第三方合作伙伴 (如Sensory、科大訊飛等) 來提供。”

　　對于近場語音識別，比如智能穿戴、陪伴式機器人，上述意法半導(dǎo)體方案即可滿足需求;對于遠場的語音識別，比如智能音箱，意法半導(dǎo)體將負責(zé)語音前端處理，AP或DSP的第三方算法將負責(zé)后端處理，因此需要與高通等后端AP廠商配合實現(xiàn)。

　　倪明表示：各廠商的智能語音方案都獨具特色，現(xiàn)有的語音方案在功能上基本滿足了市場的需求，但可擴展性及性能仍有改進空間。比如使用者會經(jīng)常遇到聽不到、聽不清的情況，語音產(chǎn)品易被干擾且存在功耗大等問題。解決這些問題需要系統(tǒng)各方面的共同改進。意法半導(dǎo)體本著開放的態(tài)度與行業(yè)各方合作共贏。

　　倪明指出理想的應(yīng)用或產(chǎn)品應(yīng)該是“按需分配”：即根據(jù)用戶或市場的需求，系統(tǒng)可以做出適當(dāng)?shù)娜∩崤c調(diào)整。與此同時，倪明介紹了意法半導(dǎo)體在理想化產(chǎn)品道路上做出的努力：

　　作為系統(tǒng)基礎(chǔ)的硬件，硅麥克風(fēng)至關(guān)重要。意法半導(dǎo)體在提高其本體性能方面，將SNR提高到65～67dB、 AOP提高到135dBSPL，以及在麥克風(fēng)ASIC電路中加入抗干擾的設(shè)計等;

　　在意法半導(dǎo)體Beamforming算法庫中有4種針對不同應(yīng)用場景的模式供選擇，既有適用于智能穿戴等語音方向較確定的場景下強指向模式 (Strong) ，也有適用于語音方向范圍較寬、環(huán)境噪聲較大場景下的消噪模式 (Cardioid denoise) ;

　　在功耗方面，意法半導(dǎo)體新發(fā)布的MP23DB01HP數(shù)字硅麥克風(fēng)可以支持低功耗模式，該模式下麥克風(fēng)的功耗還不到正常模式的一半，極大地提高了系統(tǒng)的持續(xù)工作時間。例如手機穿戴產(chǎn)品中需要集成度更高、更加低功耗的方案，意法半導(dǎo)體正在與合作伙伴研發(fā)將麥克風(fēng)與DSP合二為一的芯片“Smart MIC”，該芯片將大大節(jié)約PCB布板空間及系統(tǒng)功耗。