新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > 基于嵌入式系統(tǒng)的語音口令識別系統(tǒng)的實現(xiàn)

基于嵌入式系統(tǒng)的語音口令識別系統(tǒng)的實現(xiàn)

作者: 時間:2010-09-15 來源:網(wǎng)絡(luò) 收藏

通過上述IIS總線能夠得到輸入的音頻數(shù)據(jù)信號,而其它的信號如自動增益控制、輸入數(shù)據(jù)格式的選擇和輸入增益的控制等控制信號通過稱為“L3”形式的接口總線傳輸。為了減少引腳數(shù)和保持連線簡單,該接口總線采用串行數(shù)據(jù)傳輸方式,接口總線由3條信號線組成:時分復(fù)用的數(shù)據(jù)通道線L3DATA、模式控制線L3MODE和時鐘信號線L3CLOCK。模式控制線L3MODE為低電平時的傳輸模式為地址傳輸模式;為高電平時的傳輸模式為數(shù)據(jù)傳輸模式。
語音口令識別系統(tǒng)的硬件電路的核心芯片是嵌入式微處理器Samsung S3C2440 AL,主頻為400MHz。三星公司推出的RISC微處理器S3C2440 AL具有低功耗、高性能等特點(diǎn),可以廣泛應(yīng)用于便攜式設(shè)備中。S3C2440AL具有一個IIS總線音頻編碼/解碼接口,語音口令識別系統(tǒng)的硬件電路如圖2所示。其IIS總線控制器通過5根信號線與UDAl34lTS編解碼芯片相連。這些5根信號線分別是:系統(tǒng)時鐘信號CDCLK:位時鐘信號I2-SSCLK;字選擇控制信號I2SLRCK;串行數(shù)據(jù)輸入信號I2SSDI;串行數(shù)據(jù)輸出信號I2SDO。S3C2440 AL使用L3接口傳輸其他(如自動增益控制、輸入數(shù)據(jù)格式的選擇和輸入增益的控制等)控制信號。為了使系統(tǒng)間能夠更好地同步,S3C2440AL需要向芯片UDAl341TS提供CDCLK,該時鐘信號的頻率可以選擇采樣頻率的256倍、384倍或512倍。

本文引用地址:http://butianyuan.cn/article/151538.htm

1b.JPG

2 基于CDHMM的口令識別的軟件設(shè)計
2.1 口令識別的軟件系統(tǒng)框圖
語音口令識別的軟件系統(tǒng)分別由特征參數(shù)提取、語音模型庫和概率輸出評分三大模塊組成,如圖3所示:1)語音口令特征參數(shù)的提取,輸入不同的語音口令,首先要進(jìn)行特征參數(shù)提取,采用Mel頻率參數(shù)作為CDHMM的建模參數(shù),Mel頻率參數(shù)是根據(jù)人耳的聽覺特性將語音信號的頻譜轉(zhuǎn)化為基于Mel頻率的非線性頻譜,然后轉(zhuǎn)換到倒譜域上。2)在訓(xùn)練階段,對不同的語音口令建立CDHMM模型。3)在口令識別階段,通過概率輸出評分對待測語音口令做出識別。

1c.JPG


語音口令首先經(jīng)過預(yù)處理,提取MFCC特征參數(shù),然后建立此口令的CDHMM模型,把所有語音口令的模型放在模型庫中,在識別階段,通過概率輸出評分,取評分最大的一個作為識別出的口令。



關(guān)鍵詞: 電源

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉