一款語(yǔ)音口令識(shí)別系統(tǒng)的設(shè)計(jì)實(shí)現(xiàn)

作者：時(shí)間：2014-03-17 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢(xún)

CDHMM的B不再是一個(gè)矩陣，而是一組觀(guān)察值概率密度函數(shù)，由M個(gè)連續(xù)高斯密度函數(shù)描述：

本文引用地址：http://butianyuan.cn/article/234840.htm

N(o，ujk，∑jk)為多維高斯概率密度函數(shù)，o是觀(guān)察矢量序列，即從語(yǔ)音中提取的特征矢量參數(shù)(o1，o2，…，ot)，t為觀(guān)察矢量序列的時(shí)間長(zhǎng)度。ujk，∑jk分別為高斯分布的均值和方差參數(shù)，Cjk為高斯分布的權(quán)值，滿(mǎn)足約束條件

CDHMM參數(shù)估計(jì)采用“分段K-平均法”。初始模型可以隨機(jī)選取，由

是改進(jìn)后的模型，再將作為初始值，重新估計(jì)。

基于“分段K-平均法”的CDHMM參數(shù)估計(jì)具體過(guò)程為：

(1)設(shè)置模型參數(shù)初始值λ=(π，A，B)。

(2)根據(jù)此λ用Viterbi算法將輸入的訓(xùn)練語(yǔ)音數(shù)據(jù)劃分為最可能的狀態(tài)序列，利用狀態(tài)序列估計(jì)參數(shù)A。

(3)用分段K-平均法對(duì)B進(jìn)行重新估計(jì)，即將第二步得到的每一種狀態(tài)的訓(xùn)練語(yǔ)音數(shù)據(jù)搜集在一起并對(duì)其特征進(jìn)行統(tǒng)計(jì)，從而得到B。

對(duì)于概率密度函數(shù)由若干正態(tài)分布函數(shù)線(xiàn)性相加的CDHMM系統(tǒng)，每個(gè)狀態(tài)θj(1≤j≤N)的概率密度函數(shù)bj(X)由K個(gè)正態(tài)分布函數(shù)線(xiàn)性相加而成，這樣可以把每一狀態(tài)語(yǔ)音幀分成K類(lèi)，然后計(jì)算同一類(lèi)中諸語(yǔ)音幀矢量X的均值矢量，方差矩陣∑jk和混合密度函數(shù)中各概率密度函數(shù)的權(quán)重系數(shù) Cjk。

(4)由(2)和(3)估計(jì)的CDHMM參數(shù)作為初值，利用重估公式對(duì)CDHMM參數(shù)進(jìn)行重估，得到參數(shù)。

(5)利用(4)所得的計(jì)算，并與p(O/λ)相比較。如果差值小于預(yù)定的閾值或迭代次數(shù)超過(guò)預(yù)定的次數(shù)，即說(shuō)明模型參數(shù)已經(jīng)收斂，無(wú)需進(jìn)行重估計(jì)算，可將作為模型參數(shù)輸出。反之，若差值超出閾值或迭代未到預(yù)定的次數(shù)，則將計(jì)算結(jié)果作為新的初值，重復(fù)進(jìn)行下一次迭代。

3 結(jié)束語(yǔ)

論文建立了一種基于嵌入式系統(tǒng)的語(yǔ)音口令識(shí)別系統(tǒng)，并且對(duì)上升、下降等14條口令進(jìn)行測(cè)試，每條語(yǔ)音先切除靜音，預(yù)加重，然后通過(guò) Hamming窗分幀處理，幀長(zhǎng)和幀移分別為20ms和10ms，然后對(duì)每一幀語(yǔ)音信號(hào)提取16MFCC+16AMFCC共32維參數(shù)作為特征矢量。該語(yǔ)音口令識(shí)別系統(tǒng)達(dá)到了實(shí)時(shí)的要求，可以使語(yǔ)音口令識(shí)別系統(tǒng)廣泛應(yīng)用于便攜式設(shè)備中。

新聞中心

一款語(yǔ)音口令識(shí)別系統(tǒng)的設(shè)計(jì)實(shí)現(xiàn)

評(píng)論

相關(guān)推薦

技術(shù)專(zhuān)區(qū)