基于非特定人車載音響語音控制系統(tǒng)的設(shè)計與實現(xiàn)
對于語音處理而言,因Q的變化,P(Q,O|λ)取值范圍很大,而P(Q,O|λ)的最大值占了全部P(Q,O|λ)的很大的成分,所以可以用Viterbi算法來計算P(O|λ)。
2.2 控制模塊
控制模塊的主要功能是:在AT89S51查詢到語音詞條信號后,查表獲得詞條編碼,根據(jù)編碼判斷對應(yīng)按鍵是長按或短按,分別進(jìn)入相應(yīng)的子程序處理。在子程序中,輸出語音命令所對應(yīng)的I/O控制信號驅(qū)動繼電器吸合模擬按鍵或編碼開關(guān)動作,并及時復(fù)位I/O口??刂颇K還具有完全兼容手動控制的功能,在語音控制操作的同時也可以進(jìn)行手動操作,手動的優(yōu)先級高于語音命令,這樣可以避免語音控制和手動控制之間發(fā)生沖突。
控制模塊部分程序代碼如下:
3 系統(tǒng)實測結(jié)果
本系統(tǒng)在江淮同悅SL1102C1型車載音響上進(jìn)行了非特定人語音識別率和模擬開關(guān)動作準(zhǔn)確率測試。由于汽車音響的語音詞條為2到4個字,語音識別率實驗內(nèi)容為車載音響常用2字詞條指令18條、3字詞條指令12條、4字詞條指令10條,實驗對象為6人(4男、2女,普通話和方言),實驗環(huán)境為實驗室環(huán)境。為了提高系統(tǒng)的識別率,系統(tǒng)采用奧林巴斯ME52定向麥克,提高了麥克接收范圍,系統(tǒng)測試結(jié)果如表1所示。本文引用地址:http://butianyuan.cn/article/197388.htm
由表1可知,系統(tǒng)的識別率與語音指令詞條字?jǐn)?shù)、麥克接收距離、說話人方言有關(guān)。男聲和女聲的識別率接近。
在系統(tǒng)控制電路實驗中,模擬開關(guān)動作達(dá)到了較高的準(zhǔn)確率,測試結(jié)果為98%以上,只要控制程序運行正常,各路繼電器就能按照程序安排執(zhí)行閉合和斷開模擬手動開關(guān)操作。
實現(xiàn)汽車電器的語音控制是未來車載電器的發(fā)展趨勢,越來越多的解決方案被提出和驗證。本文設(shè)計在SL1102C1型車載音響上使用SDA80D51芯片,實現(xiàn)了車載音響非特定人的語音識別與控制。由于該芯片集成度高,需要外圍模塊少,所以設(shè)計的硬件電路簡單,便于調(diào)試檢測。該設(shè)計得到的樣機,有較高的識別率,工作穩(wěn)定、可擴(kuò)展性強,達(dá)到預(yù)期的設(shè)計目標(biāo),整個設(shè)計方案和實現(xiàn)方法是可行的。由于語音識別率隨著環(huán)境、說話人不同而變化,雖然HMM算法在噪聲很小的環(huán)境下可以獲得很高的識別率,但當(dāng)測試語音或者環(huán)境中含有不同程度的噪聲污染時,語音識別系統(tǒng)的性能會有所下降。提高系統(tǒng)的抗噪性和魯棒性是語音識別系統(tǒng)走向?qū)嵱没年P(guān)鍵之一。
參考文獻(xiàn)
[1] 楊行峻,遲惠生.語音信號數(shù)字處理[M].北京:電子工業(yè)出版社,1995.
[2] Inifneon. UniSpeech2V2.0 Functional Specification [Z]. Infineon Technologies AG, 2002.
[3] 韓紀(jì)慶,張磊,鄭鐵然.語音信號處理[M].北京:清華大學(xué)出版社,2004.
[4] 王海青.基于CDHMM的口令式語音識別系統(tǒng)及其DSP實現(xiàn)[D]. 合肥:中國科學(xué)技術(shù)大學(xué),2003.
[5] BURCHARD B, ROMER R, FOX O. A single chip phoneme based HMM speech recognition system for consumer applications[J]. Consumer Electronics, IEEE Transactions on, 2000, 46(3): 914-919.
[6] Masao Namiki, Takayuki Hamamoto, Seiichiro Hangai.Spoken word recognition with digital cochlea using 32 DSP-boards, IEEE Trans. on Acoust, Speech, Signal Processing, 2001,2:969-972.
評論