新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 基于TMS320c55x電子耳蝸語音增強(qiáng)的實(shí)現(xiàn)

基于TMS320c55x電子耳蝸語音增強(qiáng)的實(shí)現(xiàn)

作者: 時(shí)間:2001-11-09 來源: 收藏

耳蝸通過植入電子耳蝸(Electronic Cochlear)為幾乎喪失了所有聽力的人恢復(fù)部分聽力,它模仿人的內(nèi)耳人為地產(chǎn)生電信號(hào)刺激聽覺神經(jīng)。電子耳蝸發(fā)展是令人鼓舞的,有些失聰?shù)娜艘呀?jīng)可以通過電話進(jìn)行交談。電子耳蝸的設(shè)計(jì)者面臨的一個(gè)挑戰(zhàn)就是發(fā)展能夠完整模仿人內(nèi)耳功能的語音信號(hào)處理技術(shù),這其中的研究方向之一就是發(fā)展語音增強(qiáng)技術(shù)來幫助接受耳蝸移植的人在噪聲環(huán)境中更好地溝通。目前的電子耳蝸還沒有很好地實(shí)現(xiàn)人的內(nèi)耳所具有的語音增強(qiáng)功能。因此,我們首先從選擇合適的語音增強(qiáng)算法入手,再用TIDSP(數(shù)字信號(hào)處理器)實(shí)現(xiàn)增強(qiáng)算法。由于篇幅所限只介紹基于子空間方法的增強(qiáng)算法。

本文引用地址:http://butianyuan.cn/article/2913.htm

為了選擇合適的語音增強(qiáng)算法,最終經(jīng)過反復(fù)對(duì)比驗(yàn)證,我們決定使用基于子空間方法的增強(qiáng)算法對(duì)純凈語音信號(hào)進(jìn)行估計(jì),再使用基于人耳聽覺特性的語音增強(qiáng)算法對(duì)語音信號(hào)進(jìn)行增強(qiáng)?;谧涌臻g方法的增強(qiáng)算法主要是利用數(shù)據(jù)協(xié)方差矩陣的特征值分解,利用特征值的大小,將協(xié)方差矩陣的特征子空間分為信號(hào)子空間和噪聲子空間兩部分。數(shù)字信號(hào)處理中的一個(gè)關(guān)鍵問題是特征提取,它指的是數(shù)據(jù)空間變換到特征空間的過程。一般而言,理論上這是一種等維數(shù)的變換過程。而實(shí)際上,我們更樂于使數(shù)據(jù)矢量能夠用更低維數(shù)的有效特征表示,但仍然保留了數(shù)據(jù)矢量的內(nèi)在信息。其流程見圖1。

為了便于語音增強(qiáng)算法向DSP上移植,又考慮到目前多數(shù)DSP開發(fā)環(huán)境均提供對(duì)ANSI C的支持,因而首先將算法由仿真用的Matlab程序改寫為C語言。其中主要包括以下兩方面的問題:

1)語音信號(hào)的實(shí)時(shí)分幀處理。由于算法理論上是對(duì)語音信號(hào)以語音幀為單位進(jìn)行處理的,但實(shí)際Matlab仿真程序中在處理每一幀時(shí)都使用了其他所有幀的信息,因而要將算法改寫為適合于分幀處理。

2)算法的運(yùn)行速度和存儲(chǔ)空間占用問題?;谧涌臻g方法的語音增強(qiáng)算法中大量用到矩陣運(yùn)算,將使算法的速度受到很大影響。

針對(duì)以上兩個(gè)問題,我們對(duì)算法進(jìn)行了部分的改進(jìn),使其適應(yīng)實(shí)時(shí)分幀處理,程序調(diào)試過程中進(jìn)行了優(yōu)化,提高運(yùn)行速度、減小存儲(chǔ)空間。其中具體改進(jìn)措施如下:

對(duì)噪聲功率的估計(jì)方法。仿真程序中估計(jì)噪聲的方法為尋找語音信號(hào)中能量最小的幾幀,將其平均能量作為噪聲平均功率。顯然這種方法不適合與實(shí)時(shí)分幀處理。因而改為尋找當(dāng)前幀以前的所有幀(包括當(dāng)前幀)中能量最小者的能量作為對(duì)噪聲功率的估計(jì)。實(shí)踐證明這種方法簡(jiǎn)便易行,效果與仿真結(jié)果相差無幾。

程序中分幀方法的改進(jìn)。具體為在基于子空間的增強(qiáng)算法中使用的幀長(zhǎng)為32。因?yàn)榛谧涌臻g的增強(qiáng)算法其時(shí)間復(fù)雜度與幀長(zhǎng)平方成正比,所以使用的幀長(zhǎng)較短!

CIS(連續(xù)分段采樣)方案是對(duì)人耳聽覺系統(tǒng)的一種模仿。CIS方案按照在人的內(nèi)耳的耳蝸,不同頻率的聲音信號(hào)在不同的位置被帶通濾波,傳送到那里的聽覺神經(jīng)上,將頻率分量轉(zhuǎn)換成生物電流,傳輸至大腦,最后形成聽覺這個(gè)原理,選擇了以有限的頻率點(diǎn)為中心頻率的一組帶通濾波器,將聲音信號(hào)分成幾個(gè)通道,經(jīng)過一定的調(diào)制和處理,將輸出信號(hào)傳送到相應(yīng)位置的電極上,刺激耳蝸內(nèi)相應(yīng)位置的聽覺神經(jīng),從而產(chǎn)生聽覺。經(jīng)過測(cè)試選取16通道的CIS方案。每個(gè)通道內(nèi),帶通濾波器的輸出再經(jīng)過波形校正(Rectifier),即用語音增強(qiáng)算法語音處理后,然后經(jīng)過低通濾波再調(diào)制相應(yīng)的正弦波形,得到相應(yīng)電極上的電刺激信號(hào),所有的這些電極信號(hào)合并在一起就是系統(tǒng)的輸出信號(hào)。目前大多數(shù)基于CIS方案的電子耳蝸在安靜環(huán)境下可以使聾人獲得一定語音信息,但是在噪聲環(huán)境下,這種信息傳遞就會(huì)大打折扣。這不是一個(gè)簡(jiǎn)單的干擾問題。正常人在噪聲環(huán)境下仍然能獲得相當(dāng)準(zhǔn)確的語音信息,但是電子耳蝸在噪聲環(huán)境下傳遞給聾人很可能就是不可懂的語音。所以抑制噪聲對(duì)CIS系統(tǒng)的干擾是重要的課題。

TMS320C54系列DSPTMS320家族的定點(diǎn)DSP。C54x適用于很多方面,滿足了實(shí)時(shí)嵌入應(yīng)用的需要,如電信,無線應(yīng)用、語音處理等等。C54xCPU通過使用改進(jìn)的哈佛結(jié)構(gòu),實(shí)現(xiàn)了最小化的核心電源消耗和高度的并行運(yùn)算能力。同時(shí),多種尋址模式和完善的指令集提高了整個(gè)系統(tǒng)的性能。

C54x主要有如下特點(diǎn):

1、增強(qiáng)的哈佛結(jié)構(gòu),一條程序總線和三條數(shù)據(jù)總線;

2、高度并行的先進(jìn)CPU設(shè)計(jì),性能更好的面向應(yīng)用的硬件邏輯;

3、為快速算法和高級(jí)語言優(yōu)化設(shè)計(jì)的專用指令集;

4、標(biāo)準(zhǔn)化的模塊結(jié)構(gòu),適于快速開發(fā);

5、先進(jìn)的IC處理技術(shù),提高了性能,降低了電源消耗。

TMS320C55x DSP代表了TI公司最新的一代C5000系列 DSP。C55x是在C54x基礎(chǔ)上發(fā)展起來的,代碼向下兼容于C54x。C55x在電源效率,低系統(tǒng)消耗和并行度方面做了很好的優(yōu)化。

集成開發(fā)環(huán)境采用的是TI TMS320VC5410 Evaluation Module System Kit的一整套硬件,以及TI公司的集成開發(fā)環(huán)境(IDE)Code Composer Studio IDE for C5000軟件。

集成開發(fā)環(huán)境提供從代碼開發(fā)、代碼優(yōu)化、可執(zhí)行代碼生成,軟件仿真,硬件仿真等等豐富的功能,我們的一切工作都是這上面開展的,這也是現(xiàn)代DSP開發(fā)的發(fā)展方向,TI公司大力推廣的Express DSP開發(fā)技術(shù)的就是以集成開發(fā)環(huán)境為中心,配以其他的軟件和硬件實(shí)現(xiàn)快速的DSP代碼開發(fā)。

1、信號(hào)先經(jīng)過一個(gè)預(yù)加重濾波器處理,濾波器截止頻率是2000Hz;

2、上一步的輸出信號(hào)被帶通濾波分為n個(gè)頻帶(n=16),這里使用的帶通濾波器是二階butterworth濾波器;

3、對(duì)上一步的輸出信號(hào)進(jìn)行全波整流。

4、通過低通濾波取出第三步信號(hào)的包絡(luò),所用的濾波器為二階butterworth濾波器,截止頻率為400Hz;

5、產(chǎn)生幅度為包絡(luò)算術(shù)平均值,頻率為帶通濾波器中心頻率的正弦信號(hào)。每個(gè)頻帶的正弦信號(hào)最后被疊加起來得到合成語音信號(hào),合成語音信號(hào)段的電平被調(diào)節(jié)到和原始語音信號(hào)具有相同的算術(shù)平均值。

 

1、信度限制:為了防止處理過程中的溢出,我們必須限制語音信號(hào)幅度,否則會(huì)有難以預(yù)料的錯(cuò)誤。

2、精確保證:必須使用一些通用目的函數(shù),例如FFT運(yùn)算和正弦運(yùn)算,因?yàn)橛蠺I的DSP定點(diǎn)庫函數(shù),我們直接在程序中調(diào)用這些庫函數(shù),取得了較好的效果。

3、數(shù)據(jù)輸出的模擬實(shí)現(xiàn):借助集成開發(fā)環(huán)境的DATA I/O功能實(shí)現(xiàn)了從文件輸入處理數(shù)據(jù),處理后的數(shù)據(jù)也放到一個(gè)文件中。模擬實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)I/O。

運(yùn)行結(jié)果:我們的試聽結(jié)果證明基于CIS的語音增強(qiáng)算法能提高電子耳蝸在噪聲環(huán)境下的性能,實(shí)驗(yàn)用16個(gè)電極的結(jié)果完全是可以為人接受的。

由于篇幅的限制,具體的代碼就不附在這里?!?/font>



關(guān)鍵詞:

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉