基于嵌入式系統(tǒng)的語音口令識別系統(tǒng)的實現(xiàn)

作者：時間：2010-09-15 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

通過上述IIS總線能夠得到輸入的音頻數(shù)據(jù)信號，而其它的信號如自動增益控制、輸入數(shù)據(jù)格式的選擇和輸入增益的控制等控制信號通過稱為“L3”形式的接口總線傳輸。為了減少引腳數(shù)和保持連線簡單，該接口總線采用串行數(shù)據(jù)傳輸方式，接口總線由3條信號線組成：時分復(fù)用的數(shù)據(jù)通道線L3DATA、模式控制線L3MODE和時鐘信號線L3CLOCK。模式控制線L3MODE為低電平時的傳輸模式為地址傳輸模式；為高電平時的傳輸模式為數(shù)據(jù)傳輸模式。
語音口令識別系統(tǒng)的硬件電路的核心芯片是嵌入式微處理器Samsung S3C2440 AL，主頻為400MHz。三星公司推出的RISC微處理器S3C2440 AL具有低功耗、高性能等特點(diǎn)，可以廣泛應(yīng)用于便攜式設(shè)備中。S3C2440AL具有一個IIS總線音頻編碼／解碼接口，語音口令識別系統(tǒng)的硬件電路如圖2所示。其IIS總線控制器通過5根信號線與UDAl34lTS編解碼芯片相連。這些5根信號線分別是：系統(tǒng)時鐘信號CDCLK：位時鐘信號I2-SSCLK；字選擇控制信號I2SLRCK；串行數(shù)據(jù)輸入信號I2SSDI；串行數(shù)據(jù)輸出信號I2SDO。S3C2440 AL使用L3接口傳輸其他(如自動增益控制、輸入數(shù)據(jù)格式的選擇和輸入增益的控制等)控制信號。為了使系統(tǒng)間能夠更好地同步，S3C2440AL需要向芯片UDAl341TS提供CDCLK，該時鐘信號的頻率可以選擇采樣頻率的256倍、384倍或512倍。

本文引用地址：http://butianyuan.cn/article/151538.htm

2 基于CDHMM的口令識別的軟件設(shè)計
2．1 口令識別的軟件系統(tǒng)框圖
語音口令識別的軟件系統(tǒng)分別由特征參數(shù)提取、語音模型庫和概率輸出評分三大模塊組成，如圖3所示：1)語音口令特征參數(shù)的提取，輸入不同的語音口令，首先要進(jìn)行特征參數(shù)提取，采用Mel頻率參數(shù)作為CDHMM的建模參數(shù)，Mel頻率參數(shù)是根據(jù)人耳的聽覺特性將語音信號的頻譜轉(zhuǎn)化為基于Mel頻率的非線性頻譜，然后轉(zhuǎn)換到倒譜域上。2)在訓(xùn)練階段，對不同的語音口令建立CDHMM模型。3)在口令識別階段，通過概率輸出評分對待測語音口令做出識別。

語音口令首先經(jīng)過預(yù)處理，提取MFCC特征參數(shù)，然后建立此口令的CDHMM模型，把所有語音口令的模型放在模型庫中，在識別階段，通過概率輸出評分，取評分最大的一個作為識別出的口令。

新聞中心

基于嵌入式系統(tǒng)的語音口令識別系統(tǒng)的實現(xiàn)

評論

相關(guān)推薦

技術(shù)專區(qū)