基于TMS320c55x電子耳蝸語(yǔ)音增強(qiáng)的實(shí)現(xiàn)

作者：時(shí)間：2001-11-09 來(lái)源：

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢(xún)

耳蝸通過(guò)植入電子耳蝸（Electronic Cochlear)為幾乎喪失了所有聽(tīng)力的人恢復(fù)部分聽(tīng)力，它模仿人的內(nèi)耳人為地產(chǎn)生電信號(hào)刺激聽(tīng)覺(jué)神經(jīng)。電子耳蝸發(fā)展是令人鼓舞的，有些失聰?shù)娜艘呀?jīng)可以通過(guò)電話進(jìn)行交談。電子耳蝸的設(shè)計(jì)者面臨的一個(gè)挑戰(zhàn)就是發(fā)展能夠完整模仿人內(nèi)耳功能的語(yǔ)音信號(hào)處理技術(shù)，這其中的研究方向之一就是發(fā)展語(yǔ)音增強(qiáng)技術(shù)來(lái)幫助接受耳蝸移植的人在噪聲環(huán)境中更好地溝通。目前的電子耳蝸還沒(méi)有很好地實(shí)現(xiàn)人的內(nèi)耳所具有的語(yǔ)音增強(qiáng)功能。因此，我們首先從選擇合適的語(yǔ)音增強(qiáng)算法入手，再用TI的DSP（數(shù)字信號(hào)處理器）實(shí)現(xiàn)增強(qiáng)算法。由于篇幅所限只介紹基于子空間方法的增強(qiáng)算法。

本文引用地址：http://www.butianyuan.cn/article/2913.htm

為了選擇合適的語(yǔ)音增強(qiáng)算法，最終經(jīng)過(guò)反復(fù)對(duì)比驗(yàn)證，我們決定使用基于子空間方法的增強(qiáng)算法對(duì)純凈語(yǔ)音信號(hào)進(jìn)行估計(jì)，再使用基于人耳聽(tīng)覺(jué)特性的語(yǔ)音增強(qiáng)算法對(duì)語(yǔ)音信號(hào)進(jìn)行增強(qiáng)?；谧涌臻g方法的增強(qiáng)算法主要是利用數(shù)據(jù)協(xié)方差矩陣的特征值分解，利用特征值的大小，將協(xié)方差矩陣的特征子空間分為信號(hào)子空間和噪聲子空間兩部分。數(shù)字信號(hào)處理中的一個(gè)關(guān)鍵問(wèn)題是特征提取，它指的是數(shù)據(jù)空間變換到特征空間的過(guò)程。一般而言，理論上這是一種等維數(shù)的變換過(guò)程。而實(shí)際上，我們更樂(lè)于使數(shù)據(jù)矢量能夠用更低維數(shù)的“有效”特征表示，但仍然保留了數(shù)據(jù)矢量的內(nèi)在信息。其流程見(jiàn)圖1。

為了便于語(yǔ)音增強(qiáng)算法向DSP上移植，又考慮到目前多數(shù)DSP開(kāi)發(fā)環(huán)境均提供對(duì)ANSI C的支持，因而首先將算法由仿真用的Matlab程序改寫(xiě)為C語(yǔ)言。其中主要包括以下兩方面的問(wèn)題：

1）語(yǔ)音信號(hào)的實(shí)時(shí)分幀處理。由于算法理論上是對(duì)語(yǔ)音信號(hào)以語(yǔ)音幀為單位進(jìn)行處理的，但實(shí)際Matlab仿真程序中在處理每一幀時(shí)都使用了其他所有幀的信息，因而要將算法改寫(xiě)為適合于分幀處理。

2）算法的運(yùn)行速度和存儲(chǔ)空間占用問(wèn)題?；谧涌臻g方法的語(yǔ)音增強(qiáng)算法中大量用到矩陣運(yùn)算，將使算法的速度受到很大影響。

針對(duì)以上兩個(gè)問(wèn)題，我們對(duì)算法進(jìn)行了部分的改進(jìn)，使其適應(yīng)實(shí)時(shí)分幀處理，程序調(diào)試過(guò)程中進(jìn)行了優(yōu)化，提高運(yùn)行速度、減小存儲(chǔ)空間。其中具體改進(jìn)措施如下：

對(duì)噪聲功率的估計(jì)方法。仿真程序中估計(jì)噪聲的方法為尋找語(yǔ)音信號(hào)中能量最小的幾幀，將其平均能量作為噪聲平均功率。顯然這種方法不適合與實(shí)時(shí)分幀處理。因而改為尋找當(dāng)前幀以前的所有幀（包括當(dāng)前幀）中能量最小者的能量作為對(duì)噪聲功率的估計(jì)。實(shí)踐證明這種方法簡(jiǎn)便易行，效果與仿真結(jié)果相差無(wú)幾。

程序中分幀方法的改進(jìn)。具體為在基于子空間的增強(qiáng)算法中使用的幀長(zhǎng)為32。因?yàn)榛谧涌臻g的增強(qiáng)算法其時(shí)間復(fù)雜度與幀長(zhǎng)平方成正比，所以使用的幀長(zhǎng)較短！

CIS(連續(xù)分段采樣)方案是對(duì)人耳聽(tīng)覺(jué)系統(tǒng)的一種模仿。CIS方案按照在人的內(nèi)耳的耳蝸，不同頻率的聲音信號(hào)在不同的位置被“帶通濾波”，傳送到那里的聽(tīng)覺(jué)神經(jīng)上，將頻率分量轉(zhuǎn)換成生物電流，傳輸至大腦，最后形成聽(tīng)覺(jué)這個(gè)原理，選擇了以有限的頻率點(diǎn)為中心頻率的一組帶通濾波器，將聲音信號(hào)分成幾個(gè)通道，經(jīng)過(guò)一定的調(diào)制和處理，將輸出信號(hào)傳送到相應(yīng)位置的電極上，刺激耳蝸內(nèi)相應(yīng)位置的聽(tīng)覺(jué)神經(jīng)，從而產(chǎn)生聽(tīng)覺(jué)。經(jīng)過(guò)測(cè)試選取16通道的CIS方案。每個(gè)通道內(nèi)，帶通濾波器的輸出再經(jīng)過(guò)波形校正(Rectifier),即用語(yǔ)音增強(qiáng)算法語(yǔ)音處理后，然后經(jīng)過(guò)低通濾波再調(diào)制相應(yīng)的正弦波形，得到相應(yīng)電極上的電刺激信號(hào),所有的這些電極信號(hào)合并在一起就是系統(tǒng)的輸出信號(hào)。目前大多數(shù)基于CIS方案的電子耳蝸在安靜環(huán)境下可以使聾人獲得一定語(yǔ)音信息，但是在噪聲環(huán)境下，這種信息傳遞就會(huì)大打折扣。這不是一個(gè)簡(jiǎn)單的干擾問(wèn)題。正常人在噪聲環(huán)境下仍然能獲得相當(dāng)準(zhǔn)確的語(yǔ)音信息，但是電子耳蝸在噪聲環(huán)境下傳遞給聾人很可能就是不可懂的語(yǔ)音。所以抑制噪聲對(duì)CIS系統(tǒng)的干擾是重要的課題。

TMS320C54系列DSP是TMS320家族的定點(diǎn)DSP。C54x適用于很多方面,滿(mǎn)足了實(shí)時(shí)嵌入應(yīng)用的需要，如電信,無(wú)線應(yīng)用、語(yǔ)音處理等等。C54x的CPU通過(guò)使用改進(jìn)的哈佛結(jié)構(gòu)，實(shí)現(xiàn)了最小化的核心電源消耗和高度的并行運(yùn)算能力。同時(shí)，多種尋址模式和完善的指令集提高了整個(gè)系統(tǒng)的性能。

C54x主要有如下特點(diǎn)：

1、增強(qiáng)的哈佛結(jié)構(gòu)，一條程序總線和三條數(shù)據(jù)總線;

2、高度并行的先進(jìn)CPU設(shè)計(jì)，性能更好的面向應(yīng)用的硬件邏輯;

3、為快速算法和高級(jí)語(yǔ)言?xún)?yōu)化設(shè)計(jì)的專(zhuān)用指令集;

4、標(biāo)準(zhǔn)化的模塊結(jié)構(gòu)，適于快速開(kāi)發(fā);

5、先進(jìn)的IC處理技術(shù)，提高了性能，降低了電源消耗。

TMS320C55x DSP代表了TI公司最新的一代C5000系列 DSP。C55x是在C54x基礎(chǔ)上發(fā)展起來(lái)的，代碼向下兼容于C54x。C55x在電源效率，低系統(tǒng)消耗和并行度方面做了很好的優(yōu)化。

集成開(kāi)發(fā)環(huán)境采用的是TI TMS320VC5410 Evaluation Module System Kit的一整套硬件，以及TI公司的集成開(kāi)發(fā)環(huán)境(IDE)Code Composer Studio IDE for C5000軟件。

集成開(kāi)發(fā)環(huán)境提供從代碼開(kāi)發(fā)、代碼優(yōu)化、可執(zhí)行代碼生成，軟件仿真，硬件仿真等等豐富的功能，我們的一切工作都是這上面開(kāi)展的，這也是現(xiàn)代DSP開(kāi)發(fā)的發(fā)展方向，TI公司大力推廣的Express DSP開(kāi)發(fā)技術(shù)的就是以集成開(kāi)發(fā)環(huán)境為中心，配以其他的軟件和硬件實(shí)現(xiàn)快速的DSP代碼開(kāi)發(fā)。

1、信號(hào)先經(jīng)過(guò)一個(gè)預(yù)加重濾波器處理，濾波器截止頻率是2000Hz；

2、上一步的輸出信號(hào)被帶通濾波分為n個(gè)頻帶(n=16),這里使用的帶通濾波器是二階butterworth濾波器；

3、對(duì)上一步的輸出信號(hào)進(jìn)行全波整流。

4、通過(guò)低通濾波取出第三步信號(hào)的包絡(luò)，所用的濾波器為二階butterworth濾波器，截止頻率為400Hz；

5、產(chǎn)生幅度為包絡(luò)算術(shù)平均值，頻率為帶通濾波器中心頻率的正弦信號(hào)。每個(gè)頻帶的正弦信號(hào)最后被疊加起來(lái)得到合成語(yǔ)音信號(hào)，合成語(yǔ)音信號(hào)段的電平被調(diào)節(jié)到和原始語(yǔ)音信號(hào)具有相同的算術(shù)平均值。

1、信度限制：為了防止處理過(guò)程中的溢出，我們必須限制語(yǔ)音信號(hào)幅度，否則會(huì)有難以預(yù)料的錯(cuò)誤。

2、精確保證：必須使用一些通用目的函數(shù)，例如FFT運(yùn)算和正弦運(yùn)算，因?yàn)橛蠺I的DSP定點(diǎn)庫(kù)函數(shù)，我們直接在程序中調(diào)用這些庫(kù)函數(shù)，取得了較好的效果。

3、數(shù)據(jù)輸出的模擬實(shí)現(xiàn)：借助集成開(kāi)發(fā)環(huán)境的DATA I/O功能實(shí)現(xiàn)了從文件輸入處理數(shù)據(jù)，處理后的數(shù)據(jù)也放到一個(gè)文件中。模擬實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)I/O。

運(yùn)行結(jié)果：我們的試聽(tīng)結(jié)果證明基于CIS的語(yǔ)音增強(qiáng)算法能提高電子耳蝸在噪聲環(huán)境下的性能，實(shí)驗(yàn)用16個(gè)電極的結(jié)果完全是可以為人接受的。

由于篇幅的限制，具體的代碼就不附在這里。■

新聞中心

基于TMS320c55x電子耳蝸語(yǔ)音增強(qiáng)的實(shí)現(xiàn)

評(píng)論

相關(guān)推薦

技術(shù)專(zhuān)區(qū)