基于TMS320c55x電子耳蝸語音增強(qiáng)的實(shí)現(xiàn)
耳蝸通過植入電子耳蝸(Electronic Cochlear)為幾乎喪失了所有聽力的人恢復(fù)部分聽力,它模仿人的內(nèi)耳人為地產(chǎn)生電信號(hào)刺激聽覺神經(jīng)。電子耳蝸發(fā)展是令人鼓舞的,有些失聰?shù)娜艘呀?jīng)可以通過電話進(jìn)行交談。電子耳蝸的設(shè)計(jì)者面臨的一個(gè)挑戰(zhàn)就是發(fā)展能夠完整模仿人內(nèi)耳功能的語音信號(hào)處理技術(shù),這其中的研究方向之一就是發(fā)展語音增強(qiáng)技術(shù)來幫助接受耳蝸移植的人在噪聲環(huán)境中更好地溝通。目前的電子耳蝸還沒有很好地實(shí)現(xiàn)人的內(nèi)耳所具有的語音增強(qiáng)功能。因此,我們首先從選擇合適的語音增強(qiáng)算法入手,再用TI的DSP(數(shù)字信號(hào)處理器)實(shí)現(xiàn)增強(qiáng)算法。由于篇幅所限只介紹基于子空間方法的增強(qiáng)算法。
本文引用地址:http://butianyuan.cn/article/2913.htm為了選擇合適的語音增強(qiáng)算法,最終經(jīng)過反復(fù)對(duì)比驗(yàn)證,我們決定使用基于子空間方法的增強(qiáng)算法對(duì)純凈語音信號(hào)進(jìn)行估計(jì),再使用基于人耳聽覺特性的語音增強(qiáng)算法對(duì)語音信號(hào)進(jìn)行增強(qiáng)?;谧涌臻g方法的增強(qiáng)算法主要是利用數(shù)據(jù)協(xié)方差矩陣的特征值分解,利用特征值的大小,將協(xié)方差矩陣的特征子空間分為信號(hào)子空間和噪聲子空間兩部分。數(shù)字信號(hào)處理中的一個(gè)關(guān)鍵問題是特征提取,它指的是數(shù)據(jù)空間變換到特征空間的過程。一般而言,理論上這是一種等維數(shù)的變換過程。而實(shí)際上,我們更樂于使數(shù)據(jù)矢量能夠用更低維數(shù)的“有效”特征表示,但仍然保留了數(shù)據(jù)矢量的內(nèi)在信息。其流程見圖1。
為了便于語音增強(qiáng)算法向DSP上移植,又考慮到目前多數(shù)DSP開發(fā)環(huán)境均提供對(duì)ANSI C的支持,因而首先將算法由仿真用的Matlab程序改寫為C語言。其中主要包括以下兩方面的問題:
1)語音信號(hào)的實(shí)時(shí)分幀處理。由于算法理論上是對(duì)語音信號(hào)以語音幀為單位進(jìn)行處理的,但實(shí)際Matlab仿真程序中在處理每一幀時(shí)都使用了其他所有幀的信息,因而要將算法改寫為適合于分幀處理。
2)算法的運(yùn)行速度和存儲(chǔ)空間占用問題?;谧涌臻g方法的語音增強(qiáng)算法中大量用到矩陣運(yùn)算,將使算法的速度受到很大影響。
針對(duì)以上兩個(gè)問題,我們對(duì)算法進(jìn)行了部分的改進(jìn),使其適應(yīng)實(shí)時(shí)分幀處理,程序調(diào)試過程中進(jìn)行了優(yōu)化,提高運(yùn)行速度、減小存儲(chǔ)空間。其中具體改進(jìn)措施如下:
對(duì)噪聲功率的估計(jì)方法。仿真程序中估計(jì)噪聲的方法為尋找語音信號(hào)中能量最小的幾幀,將其平均能量作為噪聲平均功率。顯然這種方法不適合與實(shí)時(shí)分幀處理。因而改為尋找當(dāng)前幀以前的所有幀(包括當(dāng)前幀)中能量最小者的能量作為對(duì)噪聲功率的估計(jì)。實(shí)踐證明這種方法簡(jiǎn)便易行,效果與仿真結(jié)果相差無幾。
程序中分幀方法的改進(jìn)。具體為在基于子空間的增強(qiáng)算法中使用的幀長(zhǎng)為32。因?yàn)榛谧涌臻g的增強(qiáng)算法其時(shí)間復(fù)雜度與幀長(zhǎng)平方成正比,所以使用的幀長(zhǎng)較短!
CIS(連續(xù)分段采樣)方案是對(duì)人耳聽覺系統(tǒng)的一種模仿。CIS方案按照在人的內(nèi)耳的耳蝸,不同頻率的聲音信號(hào)在不同的位置被“帶通濾波”,傳送到那里的聽覺神經(jīng)上,將頻率分量轉(zhuǎn)換成生物電流,傳輸至大腦,最后形成聽覺這個(gè)原理,選擇了以有限的頻率點(diǎn)為中心頻率的一組帶通濾波器,將聲音信號(hào)分成幾個(gè)通道,經(jīng)過一定的調(diào)制和處理,將輸出信號(hào)傳送到相應(yīng)位置的電極上,刺激耳蝸內(nèi)相應(yīng)位置的聽覺神經(jīng),從而產(chǎn)生聽覺。經(jīng)過測(cè)試選取16通道的CIS方案。每個(gè)通道內(nèi),帶通濾波器的輸出再經(jīng)過波形校正(Rectifier),即用語音增強(qiáng)算法語音處理后,然后經(jīng)過低通濾波再調(diào)制相應(yīng)的正弦波形,得到相應(yīng)電極上的電刺激信號(hào),所有的這些電極信號(hào)合并在一起就是系統(tǒng)的輸出信號(hào)。目前大多數(shù)基于CIS方案的電子耳蝸在安靜環(huán)境下可以使聾人獲得一定語音信息,但是在噪聲環(huán)境下,這種信息傳遞就會(huì)大打折扣。這不是一個(gè)簡(jiǎn)單的干擾問題。正常人在噪聲環(huán)境下仍然能獲得相當(dāng)準(zhǔn)確的語音信息,但是電子耳蝸在噪聲環(huán)境下傳遞給聾人很可能就是不可懂的語音。所以抑制噪聲對(duì)CIS系統(tǒng)的干擾是重要的課題。
TMS320C54系列DSP是TMS320家族的定點(diǎn)DSP。C54x適用于很多方面,滿足了實(shí)時(shí)嵌入應(yīng)用的需要,如電信,無線應(yīng)用、語音處理等等。C54x的CPU通過使用改進(jìn)的哈佛結(jié)構(gòu),實(shí)現(xiàn)了最小化的核心電源消耗和高度的并行運(yùn)算能力。同時(shí),多種尋址模式和完善的指令集提高了整個(gè)系統(tǒng)的性能。
C54x主要有如下特點(diǎn):
1、增強(qiáng)的哈佛結(jié)構(gòu),一條程序總線和三條數(shù)據(jù)總線;
2、高度并行的先進(jìn)CPU設(shè)計(jì),性能更好的面向應(yīng)用的硬件邏輯;
3、為快速算法和高級(jí)語言優(yōu)化設(shè)計(jì)的專用指令集;
4、標(biāo)準(zhǔn)化的模塊結(jié)構(gòu),適于快速開發(fā);
5、先進(jìn)的IC處理技術(shù),提高了性能,降低了電源消耗。
TMS320C55x DSP代表了TI公司最新的一代C5000系列 DSP。C55x是在C54x基礎(chǔ)上發(fā)展起來的,代碼向下兼容于C54x。C55x在電源效率,低系統(tǒng)消耗和并行度方面做了很好的優(yōu)化。
集成開發(fā)環(huán)境采用的是TI TMS320VC5410 Evaluation Module System Kit的一整套硬件,以及TI公司的集成開發(fā)環(huán)境(IDE)Code Composer Studio IDE for C5000軟件。
集成開發(fā)環(huán)境提供從代碼開發(fā)、代碼優(yōu)化、可執(zhí)行代碼生成,軟件仿真,硬件仿真等等豐富的功能,我們的一切工作都是這上面開展的,這也是現(xiàn)代DSP開發(fā)的發(fā)展方向,TI公司大力推廣的Express DSP開發(fā)技術(shù)的就是以集成開發(fā)環(huán)境為中心,配以其他的軟件和硬件實(shí)現(xiàn)快速的DSP代碼開發(fā)。
1、信號(hào)先經(jīng)過一個(gè)預(yù)加重濾波器處理,濾波器截止頻率是2000Hz;
2、上一步的輸出信號(hào)被帶通濾波分為n個(gè)頻帶(n=16),這里使用的帶通濾波器是二階butterworth濾波器;
3、對(duì)上一步的輸出信號(hào)進(jìn)行全波整流。
4、通過低通濾波取出第三步信號(hào)的包絡(luò),所用的濾波器為二階butterworth濾波器,截止頻率為400Hz;
5、產(chǎn)生幅度為包絡(luò)算術(shù)平均值,頻率為帶通濾波器中心頻率的正弦信號(hào)。每個(gè)頻帶的正弦信號(hào)最后被疊加起來得到合成語音信號(hào),合成語音信號(hào)段的電平被調(diào)節(jié)到和原始語音信號(hào)具有相同的算術(shù)平均值。
1、信度限制:為了防止處理過程中的溢出,我們必須限制語音信號(hào)幅度,否則會(huì)有難以預(yù)料的錯(cuò)誤。
2、精確保證:必須使用一些通用目的函數(shù),例如FFT運(yùn)算和正弦運(yùn)算,因?yàn)橛蠺I的DSP定點(diǎn)庫函數(shù),我們直接在程序中調(diào)用這些庫函數(shù),取得了較好的效果。
3、數(shù)據(jù)輸出的模擬實(shí)現(xiàn):借助集成開發(fā)環(huán)境的DATA I/O功能實(shí)現(xiàn)了從文件輸入處理數(shù)據(jù),處理后的數(shù)據(jù)也放到一個(gè)文件中。模擬實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)I/O。
運(yùn)行結(jié)果:我們的試聽結(jié)果證明基于CIS的語音增強(qiáng)算法能提高電子耳蝸在噪聲環(huán)境下的性能,實(shí)驗(yàn)用16個(gè)電極的結(jié)果完全是可以為人接受的。
由于篇幅的限制,具體的代碼就不附在這里?!?/font>
評(píng)論