一種用于抗噪語(yǔ)音識(shí)別的動(dòng)態(tài)參數(shù)補(bǔ)償新方法

作者：時(shí)間：2009-05-04 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

3．2 協(xié)方差補(bǔ)償
同樣根據(jù)(10)和相關(guān)假設(shè)，可以獲得對(duì)數(shù)譜域的帶噪語(yǔ)音特征的協(xié)方差補(bǔ)償算法。

本文引用地址：http://butianyuan.cn/article/188936.htm

其中

且
附加隨機(jī)變量Zkl的引入以及附加隨機(jī)變量與語(yǔ)音和噪聲的動(dòng)態(tài)特征不相關(guān)假設(shè)的使用降低了動(dòng)態(tài)模型補(bǔ)償問(wèn)題的求解維數(shù)。這種維數(shù)的降低同Gauss-Hermite數(shù)字積分的應(yīng)用，使得新的DPCM成為一種十分有效的動(dòng)態(tài)模型補(bǔ)償方法。

4 算法評(píng)估
算法評(píng)估實(shí)驗(yàn)采用基于孤立字的6狀態(tài)HMM來(lái)做識(shí)別器。每個(gè)狀態(tài)有4個(gè)高斯密度函數(shù)。選取24個(gè)MFCC(12個(gè)靜態(tài)特征，12個(gè)動(dòng)態(tài)特征)作為語(yǔ)音特征。訓(xùn)練階段，用純凈語(yǔ)音訓(xùn)練出純凈語(yǔ)音模型。在識(shí)別階段，使用純凈語(yǔ)音模型作為基本模型來(lái)識(shí)別。
使用TI―digits為算法評(píng)估語(yǔ)音庫(kù)，選用數(shù)據(jù)庫(kù)中有16個(gè)人(8男8女)的5081個(gè)短句，其中包含20個(gè)孤立詞，數(shù)字‘0’到‘9’和10個(gè)附加命令如‘go’、‘help’、‘repeate’等。訓(xùn)練集含有641句，測(cè)試集包括5081句。算法分析窗口的長(zhǎng)度為32ms，幀速率為9．6ms／幀。選取NOISEX-92中的White、Pink和Destoryerengine 3種噪聲作為評(píng)估的環(huán)境噪聲。使用200幀非重疊的噪聲來(lái)估計(jì)噪聲模型。全局信噪比定義為：

其中Pm(k)是第m幀的純凈語(yǔ)音功率普，N(k)是估計(jì)的噪聲能量平均譜，H是每句的語(yǔ)音幀數(shù)，L是FFT的長(zhǎng)度，g是縮放因子讓所加的噪聲符合指定的全局信噪比。帶噪語(yǔ)音由(20)生成。

其中y(i)是帶噪語(yǔ)音，x(i)和n(i)分別是純凈語(yǔ)音和噪聲。對(duì)于文中語(yǔ)音的動(dòng)態(tài)特征參數(shù)是依據(jù)(21)獲得。

為了比較DPCM方法的性能，采用5種識(shí)別方法：失配情況下的識(shí)別，Log―Add PMC，Log―Normal PMC，以及Log-AddPMC與Log―Normal PMC和DPCM相結(jié)合的方法。
圖2給出了White Noise環(huán)境下Gauss―Hermite積分項(xiàng)數(shù)n與識(shí)別率及算法復(fù)雜度關(guān)系。從圖中可以看出隨著積分項(xiàng)n的增加，兩種方法的識(shí)別率都沒(méi)有明顯的變化。但是算法的復(fù)雜度卻隨著n的增加而增加。結(jié)果說(shuō)明n=2的Gauss―Hermite積分可以提供足夠的計(jì)算精度。因此在DPCM 中采用n=2，即

上一頁(yè) 1 2 3 4 下一頁(yè)

新聞中心

一種用于抗噪語(yǔ)音識(shí)別的動(dòng)態(tài)參數(shù)補(bǔ)償新方法

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)