基于DSP的語(yǔ)音識(shí)別計(jì)算器設(shè)計(jì)

作者：時(shí)間：2010-08-05 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

2)將離散譜X(k)通過(guò)M個(gè)Mel頻率濾波器組可得到Mel頻譜并通過(guò)對(duì)數(shù)能量的處理，得到對(duì)數(shù)頻譜S(n)。計(jì)算S(n)通過(guò)每一個(gè)濾波器的輸出，得到M個(gè)h(m)參數(shù)。

3)對(duì)所有濾波器輸出進(jìn)行對(duì)數(shù)運(yùn)算，再進(jìn)一步進(jìn)行離散余弦變換(DCT)，即可得到MFCC參數(shù)。

一般在Mel濾波器的選擇中。Mel濾波器組都選擇三角形的濾波器，但也可以是其他形狀，如正弦形的濾波器組等。
2．4 模板匹配(HMM算法)
本文采用隱馬爾科夫模型(HMM算法)進(jìn)行模式匹配。它將特征矢量作為模板，在語(yǔ)音識(shí)別模式匹配時(shí)，對(duì)輸人的語(yǔ)音與模板庫(kù)中的模板進(jìn)行比較，最后將相似度最高的作為輸出結(jié)果。HMM算法解決由于說(shuō)話人語(yǔ)速不同和連續(xù)說(shuō)話的而帶來(lái)的失真問(wèn)題，還能大大減少運(yùn)算時(shí)間，提高識(shí)別率。
隱馬爾可夫模型是一個(gè)雙重隨機(jī)過(guò)程的統(tǒng)計(jì)模型，其基本隨機(jī)過(guò)程是隱藏起來(lái)觀測(cè)不到的，另一個(gè)隨機(jī)過(guò)程則產(chǎn)生觀測(cè)序列。對(duì)于語(yǔ)音識(shí)別系統(tǒng)，觀測(cè)序列0就是矢量量化后的結(jié)果序列，模型λ就是由訓(xùn)練語(yǔ)音得到的模板。語(yǔ)音的訓(xùn)練過(guò)程就是產(chǎn)生模板λ的過(guò)程，而語(yǔ)音的識(shí)別過(guò)程就是求出在模板λ下，待識(shí)別語(yǔ)音的結(jié)果序列0的條件概率P[O／λ]。
由α(i)和β(i)的定義可直接得到：P[O／λ]=αt(i)βt(i)。而語(yǔ)音的訓(xùn)練算法則較復(fù)雜，目前都采用迭代的方法得到a和b的近似解，其迭代公式如：

在實(shí)際應(yīng)用中，僅對(duì)詞條的少數(shù)次發(fā)音進(jìn)行訓(xùn)練的語(yǔ)音識(shí)別系統(tǒng)。不可能對(duì)各種復(fù)雜語(yǔ)境下的不同發(fā)音都有較高的識(shí)別率。某些較陳舊的識(shí)別算法如動(dòng)態(tài)時(shí)間彎曲法，只能把單詞的多次訓(xùn)練發(fā)音形成多個(gè)模板，造成模板數(shù)量成倍增加，影響系統(tǒng)的實(shí)時(shí)性。而HMM能夠?qū)σ粋€(gè)詞的多個(gè)訓(xùn)練序列進(jìn)行有效的融合而形成一個(gè)模板。當(dāng)訓(xùn)練發(fā)音的數(shù)量增多時(shí)，只會(huì)造成訓(xùn)練過(guò)程的計(jì)算量增大。而不會(huì)使識(shí)別過(guò)程的計(jì)算量有絲毫增加，這對(duì)系統(tǒng)的實(shí)時(shí)性是相當(dāng)有利的。

本文引用地址：http://butianyuan.cn/article/166656.htm

3 系統(tǒng)測(cè)試
針對(duì)計(jì)算器的使用特點(diǎn)和環(huán)境，分別在2個(gè)地點(diǎn)測(cè)試系統(tǒng)的性能。1)封閉的實(shí)驗(yàn)室(地點(diǎn)1)，噪聲較小，采集的信號(hào)較為良好，缺點(diǎn)是有回聲。2)課間休息的教室(地點(diǎn)2)，噪聲及大，干擾很強(qiáng)，信號(hào)的采集質(zhì)量很差。
因?yàn)檎麄€(gè)系統(tǒng)的設(shè)計(jì)是實(shí)現(xiàn)計(jì)算器的計(jì)算功能，因此本次的實(shí)驗(yàn)是在系統(tǒng)識(shí)別數(shù)字和運(yùn)算符號(hào)等語(yǔ)音后在顯示器上顯示數(shù)學(xué)運(yùn)算公式，并在識(shí)別出“等于”或“得出”2個(gè)詞組的語(yǔ)音后顯示出“=”和最后的計(jì)算結(jié)果。
在測(cè)試前預(yù)先采集5男5女共1 000個(gè)語(yǔ)音樣本(內(nèi)容為數(shù)字0到100，加、減、乘、除、等于和十、百、千、萬(wàn)等基本計(jì)算所需要的數(shù)字和運(yùn)算符號(hào)讀音)，并且對(duì)所有樣本進(jìn)行訓(xùn)練。另外找10人(4女，6男)在各實(shí)驗(yàn)地點(diǎn)進(jìn)行實(shí)時(shí)測(cè)試，每人10個(gè)，共100個(gè)未經(jīng)訓(xùn)練的樣本。用這些樣本對(duì)系統(tǒng)進(jìn)行測(cè)試，其測(cè)試結(jié)果如表1所示。

由表l所示，在相同的實(shí)驗(yàn)設(shè)備條件下，在噪聲較小的環(huán)境下的系統(tǒng)識(shí)別率要遠(yuǎn)高于在嘈雜的環(huán)境下。特別是非經(jīng)訓(xùn)練的樣本在嘈雜環(huán)境下的識(shí)別率比較低，主要是因?yàn)榄h(huán)境中的噪聲相當(dāng)復(fù)雜，查看頻譜圖發(fā)現(xiàn)噪聲幾乎與說(shuō)話人語(yǔ)音混雜疊加，算法難以識(shí)別。

4 結(jié)論
本文設(shè)計(jì)的語(yǔ)音識(shí)別計(jì)算器系統(tǒng)，除兼有語(yǔ)音識(shí)別的功能，還能對(duì)識(shí)別的語(yǔ)音信號(hào)做進(jìn)一步處理。由于采用HMM模型對(duì)語(yǔ)音信號(hào)進(jìn)行端點(diǎn)檢測(cè)，大大提高語(yǔ)音信號(hào)起止點(diǎn)判斷準(zhǔn)確性，提高了識(shí)別的準(zhǔn)確率。由于系統(tǒng)運(yùn)算復(fù)雜。計(jì)算量和存儲(chǔ)量都很大，同時(shí)也需要實(shí)時(shí)處理語(yǔ)音信號(hào)與算法，系統(tǒng)所采用的TMS320VC5509，由于其具有0．05 MW／MIPS的功耗，800 MIPS的運(yùn)算能力等優(yōu)越的性能，完全能夠滿足實(shí)時(shí)識(shí)別功能。實(shí)驗(yàn)表明，該計(jì)算器系統(tǒng)處理速度快，運(yùn)行穩(wěn)定，達(dá)到了設(shè)計(jì)要求。

上一頁(yè) 1 2 3 下一頁(yè)

新聞中心

基于DSP的語(yǔ)音識(shí)別計(jì)算器設(shè)計(jì)

評(píng)論

相關(guān)推薦

技術(shù)專(zhuān)區(qū)