利用高性能語(yǔ)音捕獲SoC提升語(yǔ)音辨識(shí)度
近年來(lái),智能手機(jī)和筆記本電腦等移動(dòng)/便攜設(shè)備市場(chǎng)持續(xù)快速發(fā)展。這些產(chǎn)品在不斷集成更多新功能以增強(qiáng)用戶體驗(yàn)的同時(shí),在基本語(yǔ)音通信功能的用戶體驗(yàn)方面仍有充足提升空間,特別是在嘈雜環(huán)境下提升語(yǔ)音清晰度,同時(shí)保持語(yǔ)音自然逼真度。例如,用戶在擁擠的商業(yè)街區(qū)行走時(shí),周圍環(huán)境中可能充斥著汽車?yán)取l(fā)動(dòng)機(jī)轟鳴、建筑施工噪聲、嘈雜人群噪聲、腳步聲甚至是風(fēng)噪等,此時(shí)用手機(jī)進(jìn)行語(yǔ)音通話時(shí),傳統(tǒng)技術(shù)難以提供清晰的語(yǔ)音通信效果。此外,制造商也在為新興的平板電腦等增加視頻通話功能。在利用這些移動(dòng)/便攜設(shè)備用于電話會(huì)議時(shí),周圍環(huán)境中同樣可能包括多種噪聲,如辦公室嘈雜人聲、周圍談話聲、電腦噪聲、筆劃噪聲及玻璃器皿碰擊聲等,要提供清晰的通話效果同樣不易。
在這些應(yīng)用中,要降低或?yàn)V除環(huán)境噪聲,提升語(yǔ)音通信效果,可以采用不同的方法,如專門(mén)降噪麥克風(fēng)、模擬電路降噪或數(shù)字電路降噪等(見(jiàn)表1)。這些方法各有其特點(diǎn),相比較而言,采用數(shù)字電路降噪的方法靈活,聲學(xué)設(shè)計(jì)復(fù)雜度較低,且降噪效果優(yōu)越。當(dāng)然,便攜設(shè)備設(shè)計(jì)人員除了要提供良好的降噪效果,還面臨著多種設(shè)計(jì)約束及挑戰(zhàn),如尺寸、能耗、物理聲學(xué)設(shè)計(jì)、音頻保真度及成本等。
表1:不同降噪技術(shù)比較。
先進(jìn)的雙麥克風(fēng)實(shí)時(shí)自適應(yīng)噪聲消減技術(shù)
安森美半導(dǎo)體最新推出了基于數(shù)字電路降噪技術(shù)的BelaSigna R261高性能語(yǔ)音捕獲系統(tǒng)級(jí)芯片(SoC)。該器件采用先進(jìn)的雙麥克風(fēng)噪聲消減技術(shù),能夠幫助設(shè)計(jì)提供優(yōu)異的噪聲消減效果(參見(jiàn)圖1)。這種先進(jìn)的信號(hào)處理技術(shù)接受兩個(gè)麥克風(fēng)的信號(hào),能夠區(qū)分不同類型的信號(hào),提取有效的語(yǔ)音信息并抑制環(huán)境噪聲,從而提升語(yǔ)音辨識(shí)度。
圖1:BelaSigna R261采用先進(jìn)的實(shí)時(shí)自適應(yīng)噪聲消減算法。
BelaSigna R261在其集成的ROM存儲(chǔ)器中內(nèi)置了語(yǔ)音提取算法。這種算法利用一個(gè)或多個(gè)傳感器來(lái)提取波形傳播信號(hào),而不需要預(yù)先知道聲源或傳感器位置。這種方案利用全局優(yōu)化準(zhǔn)則,同時(shí)工作在頻域、時(shí)域和空域,對(duì)聲源的數(shù)量及傳感器的數(shù)量沒(méi)有限制,與信噪比(SNR)無(wú)關(guān),即在低SNR和高SNR環(huán)境下能夠同樣優(yōu)化地工作,非常適合于需要從不同噪聲域中提取有用語(yǔ)音信號(hào)的手機(jī)和便攜計(jì)算機(jī)等應(yīng)用。
這種自適應(yīng)噪聲抑制算法提供25 dB的噪聲抑制能力,能夠?qū)崟r(shí)地分離需要的語(yǔ)音與環(huán)境噪聲,適合于各種語(yǔ)音源和各種位置下的語(yǔ)音,同時(shí)能夠保證音質(zhì)自然(其它方案處理后聲音不自然、不飽滿),可以有效配合各種品質(zhì)的麥克風(fēng)工作。
BelaSigna R261關(guān)鍵特性解析
BelaSigna R261是一款高性能的語(yǔ)音捕獲SoC,集成了數(shù)字信號(hào)處理器(DSP)、穩(wěn)壓器、鎖相環(huán)(PLL)、電平轉(zhuǎn)換器及ROM存儲(chǔ)器,如此高的集成度與其它方案相比,能夠降低物料單(BOM)。如圖2所示,這器件支持雙麥克風(fēng)直接輸入,噪聲消減算法內(nèi)置于集成的ROM存儲(chǔ)器中,基于DSP結(jié)構(gòu)的應(yīng)用控制器提供高性能及超低能耗,提供雙通模擬輸出,并支持?jǐn)?shù)字麥克風(fēng)輸出。此外,內(nèi)置的電源管理模塊支持1.8 V至3.3 V的供電電壓,內(nèi)置的片上PLL提供多種頻率選擇,還提供I2C接口。
圖2:BelaSigna R261 高性能語(yǔ)音捕獲SoC功能架構(gòu)圖。
特別值得一提的是,BelaSigna R261采用的雙麥克風(fēng)實(shí)時(shí)自適應(yīng)噪聲消減算法提供兩種基本的算法模式,分別是遠(yuǎn)距離拾音模式(算法模式0)和近距離拾音模式(算法模式1)。算法模式0針對(duì)遠(yuǎn)距離拾音而優(yōu)化,可以拾取多達(dá)6米遠(yuǎn)的語(yǔ)音,同時(shí)抑制噪聲,并支持360度全方位拾音,適合于筆記本電腦、免提電話/會(huì)議或手機(jī)免提通話模式。在這種模式下,即使用戶沒(méi)有對(duì)準(zhǔn)麥克風(fēng),甚至是遠(yuǎn)離麥克風(fēng),都能提供極佳的語(yǔ)音清晰度,從而增強(qiáng)用戶使用的自由度。算法模式1針對(duì)近距離拾音而優(yōu)化,這時(shí)用戶離麥克風(fēng)極近(距離小于5厘米),即在近距離內(nèi)拾取語(yǔ)音,有效抑制各種環(huán)境噪聲,適用于手機(jī)、學(xué)習(xí)機(jī)、對(duì)講機(jī)等在強(qiáng)噪聲環(huán)境中工作的設(shè)備。
除了這兩種基本算法模式,BelaSigna R261還提供定制算法模式,幫助制造商滿足特定應(yīng)用需求。這種算法模式支持特殊配置,并能夠通過(guò)外部EEPROM或I2C控制接口加載新的算法參數(shù)來(lái)調(diào)整。算法效果能夠根據(jù)特定應(yīng)用、麥克風(fēng)類型、位置及其它系統(tǒng)參數(shù)來(lái)優(yōu)化。
表2:BelaSigna R261支持遠(yuǎn)距離拾音、近距離拾音及定制等不同模式。
如上所述,BelaSigna R261提供高集成度,內(nèi)置自適應(yīng)噪聲消減算法,能夠直接連接至數(shù)字麥克風(fēng)接口或主芯片(基帶處理器)的麥克風(fēng)輸入端。故除了支持多種拾音模式,這器件的另一項(xiàng)重要優(yōu)勢(shì)就是便于集成到設(shè)計(jì)之中,可將設(shè)計(jì)入選(design-in)所須的時(shí)間和工程工作減至最少,因?yàn)樵O(shè)計(jì)團(tuán)隊(duì)不須開(kāi)發(fā)或獲取算法,也不須設(shè)計(jì)復(fù)雜的支援及接口電路。
這器件也使關(guān)注成本的原設(shè)備制造商(OEM)能夠在設(shè)計(jì)中采用便宜的兩個(gè)(不一定匹配的)全向麥克風(fēng),令麥克風(fēng)的布設(shè)更靈活,且生產(chǎn)線上不須調(diào)試麥克風(fēng),進(jìn)一步節(jié)省時(shí)間及成本。這SoC采用極緊湊的5.3 mm2 WLCSP封裝(包括26球和30球兩種版本),占用的電路板空間比其它可選方案小得多,即使空間最受限的便攜消費(fèi)電子產(chǎn)品外形因數(shù)也用得上。此外,這器件在3.3 V電壓時(shí)的電流消耗為15 mA,能耗極低。
BelaSigna R261應(yīng)用設(shè)計(jì)要點(diǎn)
由于BelaSigna R261基于ROM的噪聲消減算法非常靈活,麥克風(fēng)布局(物理聲學(xué)設(shè)計(jì))就存在多種可能的選擇,但默認(rèn)算法只有麥克風(fēng)以下述方式布局時(shí)才能最優(yōu)工作:1)兩個(gè)麥克風(fēng)面向用戶的嘴;2)兩個(gè)麥克風(fēng)的中間點(diǎn)位于距離各個(gè)麥克風(fēng)10至25 mm范圍內(nèi)。當(dāng)然,使用定制模式時(shí)也能使用其它麥克風(fēng)布局配置。
在電路設(shè)計(jì)方面,BelaSigna R261的設(shè)計(jì)針對(duì)的是在單個(gè)系統(tǒng)中同時(shí)支持?jǐn)?shù)字及模擬處理。由于這種混合信號(hào)電路屬性,要維持高音頻保真度,審慎設(shè)計(jì)印制電路板(PCB)布線就至關(guān)重要。為了避免耦合噪聲進(jìn)入音頻信號(hào)路徑,要使數(shù)字信號(hào)走線(trace)遠(yuǎn)離模擬信號(hào)走線。為了避免電氣反饋耦合,還需要將輸入走線與輸出走線隔離。
在接地設(shè)計(jì)方面,接地層應(yīng)該分為兩部分,分別是模擬接地層(VSSA)和數(shù)字接地層(VSSD)。這兩個(gè)接地層應(yīng)當(dāng)通過(guò)單個(gè)點(diǎn)(即星形連接點(diǎn))連接在一起。星形連接點(diǎn)應(yīng)當(dāng)位于電源穩(wěn)壓器輸出端電容的接地端。當(dāng)然,這些只是設(shè)計(jì)人員在應(yīng)用BelaSigna R261設(shè)計(jì)時(shí)需要注意的部分問(wèn)題。詳細(xì)的設(shè)計(jì)要點(diǎn)參見(jiàn)參考資料2。
總結(jié):
便攜設(shè)備音頻系統(tǒng)設(shè)計(jì)人員需要易于集成到其系統(tǒng)中的高性能語(yǔ)音捕獲方案,同時(shí)滿足其對(duì)尺寸、能耗及成本等方面的要求。安森美半導(dǎo)體身為應(yīng)用于高能效電子產(chǎn)品的首要高性能硅方案供應(yīng)商,以BelaSigna R261高性能語(yǔ)音捕獲SoC為設(shè)計(jì)人員提供簡(jiǎn)便的選擇。這器件具備高集成度,內(nèi)置先進(jìn)的自適應(yīng)噪聲消減算法,支持多種語(yǔ)音拾取模式,使智能手機(jī)、對(duì)講機(jī)、筆記本及平板電腦等應(yīng)用都能夠提供清晰舒適的語(yǔ)音通信,具有極高的設(shè)計(jì)靈活度,同時(shí)尺寸小、功耗低,便于選用低成本的麥克風(fēng),使各類便攜消費(fèi)電子產(chǎn)品制造商都能大幅提升語(yǔ)音辨識(shí)度及客戶滿意度,并加快產(chǎn)品上市進(jìn)程。
評(píng)論