支持向量機語音識別算法在OMAP5912上的移植
2.4.4 拷貝根文件系統(tǒng)
拷貝根文件系統(tǒng)到/data/rootfs2.6目錄下,這時就可以啟動minicom,作為虛擬終端,可以通過它來操作開發(fā)板。
2.5 修改開發(fā)板啟動項
bootargs參數(shù)設(shè)置Linux系統(tǒng)啟動時掛載在NOR Flash上的JFFS2根文件系統(tǒng)。掛載宿主機上的網(wǎng)絡(luò)文件系統(tǒng),則bootargs參數(shù)應(yīng)設(shè)置
setenv bootargs=console=ttyS0,115200n8 noinitrd rw ip=192.168.0.158 root=/dev/nfs nfsroot=192.168.0.204:/data/rootfs2.6.nolock mem=62M
#sayenv保存設(shè)置后重啟u-boot,之后將順利進入到開發(fā)板,調(diào)試應(yīng)用程序。
3 實驗及結(jié)果分析
基于VC++6.0編程實現(xiàn)一種多類分類SVMs算法,PC機環(huán)境為Ubuntu version 2.6.27,開發(fā)板為Omap5912的ARM926ej-s,其環(huán)境為Lin-ux version 2.6.18;Boot Loader采用u-boot version 1.1.6;交叉編譯工具鏈arm-linux-gcc version3.4.1。
采用16個人分別對50個詞的孤立詞發(fā)音,在不同信噪比下(15、20、25、30 dB和無噪音)得到的語音數(shù)據(jù)作為樣本,采用由MFCC特征提取算法得到的特征參數(shù)作為識別網(wǎng)絡(luò)的輸入。語音信號采樣率為11.025 kHz,幀長N=256點,幀移M=128點。詞匯量分別為10、20、30、40和50個詞。訓(xùn)練樣本由9人每人對每詞在15、20、25、30 dB、無噪音下發(fā)音3次得到.測試樣本由另外7人在相應(yīng)SNR下對每詞發(fā)音3次得到。識別算法采用RBF核函數(shù)的SVM算法,采用交叉驗證和網(wǎng)格搜索法進行核參數(shù)選擇并建立模型,對測試樣本進行分類識別。核函數(shù)參數(shù)取最優(yōu)為(c,y)=(32.0,O.000 122 070 312 5)。實驗結(jié)果見表l所示,識別率均在95%以上。表1中同時列出同樣條件下使用HMM識別網(wǎng)絡(luò)的識別結(jié)果。本文引用地址:http://www.butianyuan.cn/article/166634.htm
HMM模型是典型的語音識別模型,它是目前語音識別效果最好的少數(shù)幾種方法之一。在相同特征參數(shù)下將SVM與HMM模型進行對比,從實驗結(jié)果看出:1)SVM比HMM模型具有更高的識別率;2)比較相同信噪比和詞匯量下的測試精度,可發(fā)現(xiàn)HMM模型的測試精度有明顯下降,而SVM的測試結(jié)果下降較少,說明SVM比HMM模型具有更強推廣性。
4 結(jié)束語
提出一種基于SVM的0MAP5912非特定人嵌入式語音識別系統(tǒng)的實現(xiàn)方法。在搭建的開發(fā)環(huán)境下運用SVM算法巾的“一對一”方法進行語音識別,獲得良好結(jié)果。通過實驗可以得出,對中小詞匯量采用MFCC特征參數(shù),“一對一”SVM作為后端識別方法可以得到較好的識別結(jié)果,比傳統(tǒng)的HMM模型有明顯優(yōu)勢。同時SVM算法作為應(yīng)用程序集成到0MAP5912嵌入式系統(tǒng)里,存儲量需求小,能夠滿足實用要求。
評論