采用MEMS麥克風(fēng)實現(xiàn)復(fù)雜環(huán)境下對特定語音的提取與放大

作者：時間：2014-07-02 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

本文引用地址：http://www.butianyuan.cn/article/259098.htm

本文采用ADMP421組合麥克風(fēng)傳感器采集環(huán)境中的語音信號，并使用FPGA構(gòu)建SOPC，進(jìn)行聲音信號的頻率，相位匹配，并可根據(jù)用戶自定義的方式實現(xiàn)用戶特征音頻和噪聲的分離，在語音識別的需求逐漸增長的背景下，本系統(tǒng)具有極大的市場前景。

1.引言

人們一直夢想有朝一日可以擺脫鍵盤或遙控設(shè)備的束縛，擁有更為友好、親切的人機(jī)界面，使得計算機(jī)或家用電器可以像人一樣聽懂人的話語，看懂人的動作，執(zhí)行人們所希望的任何任務(wù)，而語音數(shù)字信號處理正是其中一項至關(guān)重要的應(yīng)用技術(shù)。隨著科技的發(fā)展，品種繁多的消費(fèi)電子產(chǎn)品進(jìn)入了人們的生活，利用語音技術(shù)對電子產(chǎn)品的控制也將是未來的消費(fèi)電子的一大趨勢。然而在語音通信的過程中，不可避免地會受到來自周圍環(huán)境中噪聲的干擾，甚至在某些極端場合下（如工地或公交車站），噪聲幾乎會覆蓋掉全部的有用信息。這使得識別的效率急劇下降，嚴(yán)重時會直接導(dǎo)致誤操作，所以在噪聲背景下的語音提取及增強(qiáng)有重要意義^[1]。

語音增強(qiáng)作為預(yù)處理，可以改善這些系統(tǒng)的性能，例如語音識別正在步入實用階段，但目前的識別系統(tǒng)大都是在安靜環(huán)境中工作的，在噪聲環(huán)境中尤其是強(qiáng)噪聲環(huán)境，語音識別系統(tǒng)的識別率將受到嚴(yán)重影響，這就需要語音增強(qiáng)技術(shù)進(jìn)行預(yù)處理。所謂語音增強(qiáng)就是對帶噪語音進(jìn)行處理，改善語音質(zhì)量，減少語音通信過程中噪聲對語音的損害，對收聽人而言主要是減少疲勞，改善語音質(zhì)量，提高語音可懂度，而對語音處理系統(tǒng)而言則主要是提高系統(tǒng)的識別率和抗干擾能力。

目前國內(nèi)外有關(guān)抗噪聲技術(shù)的研究成果大體可分為三類。一類是采用語音增強(qiáng)算法，提高語音識別系統(tǒng)前端預(yù)處理的抗噪聲能力，提高輸入信號的信噪比。第二類方法是尋找穩(wěn)健的耐噪聲的語音特征參數(shù)并提出了短時修正的相干系數(shù)，作為語音特征參數(shù)，該參數(shù)是基于自相關(guān)函數(shù)序列的線性預(yù)測技術(shù)，實驗證明，該參數(shù)對寬帶語音具有較好效果。但是，目前的補(bǔ)償算法通常只考慮到噪聲環(huán)境是平穩(wěn)的，在低信噪比語音以及非平穩(wěn)噪聲環(huán)境中的效果并不理想。而解決噪聲問題的根本方法是實現(xiàn)噪聲和語音的自動分離，盡管人們很早就有這種愿望，但由于技術(shù)的難度，這方面的研究進(jìn)展很小。近年來，隨著聲場景分析技術(shù)和盲分離技術(shù)的研究發(fā)展，利用在這些領(lǐng)域的研究成果進(jìn)行語音和噪聲分離的研究取得了一些進(jìn)展^[2]。

耳機(jī)技術(shù)可以說是手機(jī)背景噪音抑制技術(shù)的最初解決方案，語音壓擴(kuò)技術(shù)現(xiàn)在廣泛的應(yīng)用在通信系統(tǒng)中，麥克風(fēng)陣列技術(shù)有良好的抗噪性能^[3]，但是其目前的成本過高，期待著材料技術(shù)的突破。

本文將從硬件和軟件方面綜合設(shè)計語音增強(qiáng)的系統(tǒng)。本系統(tǒng)采用SOPC快速設(shè)計數(shù)字電路方案，在外圍擴(kuò)展組合麥克風(fēng)以及音頻輸出模塊，實現(xiàn)了整個硬件部分。通過分析現(xiàn)有的語音增強(qiáng)方案的缺點(diǎn)，提出了獨(dú)特的語音增強(qiáng)方案。本系統(tǒng)可以根據(jù)用戶的特征進(jìn)行自我定制語音輸出，對環(huán)境中雜亂無章的噪聲采取了更為靈活的過濾方式。

2.系統(tǒng)總體設(shè)計

SoC（System on Chip）片上系統(tǒng)是現(xiàn)代電子系統(tǒng)設(shè)計的一個發(fā)展方向，它將原先分立的多個芯片集成在一塊芯片上，通過提高芯片的集成度、減少系統(tǒng)芯片的數(shù)量和相互之間的PCB連線、減少PCB面積來降低整個系統(tǒng)的成本，同時使系統(tǒng)的性能、功能和可靠性都有很大的提高。隨著新型的高性能、低成本FPGA的出現(xiàn)和綜合技術(shù)的提高，基于FPGA的SoPC(System on Programmable Chip)可編程片上系統(tǒng)正逐步走向市場?；贔PGA的SoPC與基于ASIC技術(shù)的SoC相比，具有設(shè)計周期短、產(chǎn)品上市速度快、設(shè)計風(fēng)險和設(shè)計成本低、集成度高、靈活性大、維護(hù)和升級方便、硬件缺陷修復(fù)和排除簡單等優(yōu)點(diǎn)。因此基于FPGA和包括32位CPU在內(nèi)的各種IP核的系統(tǒng)級應(yīng)用開發(fā)將是下一代電子系統(tǒng)設(shè)計的發(fā)展方向。

順應(yīng)這個潮流，F(xiàn)PGA器件的方要供應(yīng)商Altera和Xilinx都推出了各自的SoPC解決方案：Nios系統(tǒng)和MicroBlaze系統(tǒng)。它們功能強(qiáng)大、開發(fā)環(huán)境和配套IP核完善，是工程應(yīng)用的首選。但是它們只能用在各自廠商的FPGA上，不但配套IP核價格昂貴，而且用戶無法獲得所有源代碼，不利于我國SoPC技術(shù)的發(fā)展^[4]。針對這種情況，本系統(tǒng)使用OpenCores組織提供的各種免費(fèi)、開源的IP核，構(gòu)建了以O(shè)penRISC1200CPU為核心，配以各類外圍IP核的完全開源的SoPC系統(tǒng)。其可以運(yùn)行μClinux系統(tǒng)。同時本系統(tǒng)采用的所有IP核在源代碼不變的情況下可以使用Xilinx的開發(fā)工具進(jìn)行綜合、布線，為該系統(tǒng)在其他FPGA平臺上的運(yùn)行打下了良好的基礎(chǔ)。

新聞中心

采用MEMS麥克風(fēng)實現(xiàn)復(fù)雜環(huán)境下對特定語音的提取與放大

評論

相關(guān)推薦

技術(shù)專區(qū)