采用MEMS麥克風實現(xiàn)復雜環(huán)境下對特定語音的提取與放大
本文采用ADMP421組合麥克風傳感器采集環(huán)境中的語音信號,并使用FPGA構(gòu)建SOPC,進行聲音信號的頻率,相位匹配,并可根據(jù)用戶自定義的方式實現(xiàn)用戶特征音頻和噪聲的分離,在語音識別的需求逐漸增長的背景下,本系統(tǒng)具有極大的市場前景。
1.引 言
人們一直夢想有朝一日可以擺脫鍵盤或遙控設備的束縛,擁有更為友好、親切的人機界面,使得計算機或家用電器可以像人一樣聽懂人的話語,看懂人的動作,執(zhí)行人們所希望的任何任務,而語音數(shù)字信號處理正是其中一項至關(guān)重要的應用技術(shù)。隨著科技的發(fā)展,品種繁多的消費電子產(chǎn)品進入了人們的生活,利用語音技術(shù)對電子產(chǎn)品的控制也將是未來的消費電子的一大趨勢。然而在語音通信的過程中,不可避免地會受到來自周圍環(huán)境中噪聲的干擾,甚至在某些極端場合下(如工地或公交車站),噪聲幾乎會覆蓋掉全部的有用信息。這使得識別的效率急劇下降,嚴重時會直接導致誤操作,所以在噪聲背景下的語音提取及增強有重要意義[1]。
語音增強作為預處理,可以改善這些系統(tǒng)的性能,例如語音識別正在步入實用階段,但目前的識別系統(tǒng)大都是在安靜環(huán)境中工作的,在噪聲環(huán)境中尤其是強噪聲環(huán)境,語音識別系統(tǒng)的識別率將受到嚴重影響,這就需要語音增強技術(shù)進行預處理。所謂語音增強就是對帶噪語音進行處理,改善語音質(zhì)量,減少語音通信過程中噪聲對語音的損害,對收聽人而言主要是減少疲勞,改善語音質(zhì)量,提高語音可懂度,而對語音處理系統(tǒng)而言則主要是提高系統(tǒng)的識別率和抗干擾能力。
目前國內(nèi)外有關(guān)抗噪聲技術(shù)的研究成果大體可分為三類。一類是采用語音增強算法,提高語音識別系統(tǒng)前端預處理的抗噪聲能力,提高輸入信號的信噪比。第二類方法是尋找穩(wěn)健的耐噪聲的語音特征參數(shù)并提出了短時修正的相干系數(shù),作為語音特征參數(shù),該參數(shù)是基于自相關(guān)函數(shù)序列的線性預測技術(shù),實驗證明,該參數(shù)對寬帶語音具有較好效果。但是,目前的補償算法通常只考慮到噪聲環(huán)境是平穩(wěn)的,在低信噪比語音以及非平穩(wěn)噪聲環(huán)境中的效果并不理想。而解決噪聲問題的根本方法是實現(xiàn)噪聲和語音的自動分離,盡管人們很早就有這種愿望,但由于技術(shù)的難度,這方面的研究進展很小。近年來,隨著聲場景分析技術(shù)和盲分離技術(shù)的研究發(fā)展,利用在這些領(lǐng)域的研究成果進行語音和噪聲分離的研究取得了一些進展[2]。
耳機技術(shù)可以說是手機背景噪音抑制技術(shù)的最初解決方案,語音壓擴技術(shù)現(xiàn)在廣泛的應用在通信系統(tǒng)中,麥克風陣列技術(shù)有良好的抗噪性能[3],但是其目前的成本過高,期待著材料技術(shù)的突破。
本文將從硬件和軟件方面綜合設計語音增強的系統(tǒng)。本系統(tǒng)采用SOPC快速設計數(shù)字電路方案,在外圍擴展組合麥克風以及音頻輸出模塊,實現(xiàn)了整個硬件部分。通過分析現(xiàn)有的語音增強方案的缺點,提出了獨特的語音增強方案。本系統(tǒng)可以根據(jù)用戶的特征進行自我定制語音輸出,對環(huán)境中雜亂無章的噪聲采取了更為靈活的過濾方式。
2.系統(tǒng)總體設計
SoC(System on Chip)片上系統(tǒng)是現(xiàn)代電子系統(tǒng)設計的一個發(fā)展方向,它將原先分立的多個芯片集成在一塊芯片上,通過提高芯片的集成度、減少系統(tǒng)芯片的數(shù)量和相互之間的PCB連線、減少PCB面積來降低整個系統(tǒng)的成本,同時使系統(tǒng)的性能、功能和可靠性都有很大的提高。隨著新型的高性能、低成本FPGA的出現(xiàn)和綜合技術(shù)的提高,基于FPGA的SoPC(System on Programmable Chip)可編程片上系統(tǒng)正逐步走向市場?;贔PGA的SoPC與基于ASIC技術(shù)的SoC相比,具有設計周期短、產(chǎn)品上市速度快、設計風險和設計成本低、集成度高、靈活性大、維護和升級方便、硬件缺陷修復和排除簡單等優(yōu)點。因此基于FPGA和包括32位CPU在內(nèi)的各種IP核的系統(tǒng)級應用開發(fā)將是下一代電子系統(tǒng)設計的發(fā)展方向。
順應這個潮流,F(xiàn)PGA器件的方要供應商Altera和Xilinx都推出了各自的SoPC解決方案:Nios系統(tǒng)和MicroBlaze系統(tǒng)。它們功能強大、開發(fā)環(huán)境和配套IP核完善,是工程應用的首選。但是它們只能用在各自廠商的FPGA上,不但配套IP核價格昂貴,而且用戶無法獲得所有源代碼,不利于我國SoPC技術(shù)的發(fā)展[4]。針對這種情況,本系統(tǒng)使用OpenCores組織提供的各種免費、開源的IP核,構(gòu)建了以OpenRISC1200CPU為核心,配以各類外圍IP核的完全開源的SoPC系統(tǒng)。其可以運行μClinux系統(tǒng)。同時本系統(tǒng)采用的所有IP核在源代碼不變的情況下可以使用Xilinx的開發(fā)工具進行綜合、布線,為該系統(tǒng)在其他FPGA平臺上的運行打下了良好的基礎。
評論