基于DSP的語音識(shí)別計(jì)算器設(shè)計(jì)
摘要:為解決特殊群體使用計(jì)算器困難的問題,設(shè)計(jì)了一種基于TMS320VC5509 DSP的可語音識(shí)別的計(jì)算器系統(tǒng)。該計(jì)算器系統(tǒng)的核心是采用HMM算法建立語音識(shí)別模型。通過對(duì)實(shí)時(shí)語音信號(hào)(數(shù)字、運(yùn)算符號(hào)等語音)進(jìn)行處理,將得到的參數(shù)與模板庫參數(shù)進(jìn)行匹配并加以識(shí)別,利用TMS320VC5509 DSP自帶的計(jì)算模塊實(shí)現(xiàn)語音信號(hào)整數(shù)100以內(nèi)的加、減、乘、除等計(jì)算功能。實(shí)驗(yàn)結(jié)果表明,該計(jì)算器系統(tǒng)在低噪聲場(chǎng)合和高噪聲場(chǎng)合下識(shí)別率分別達(dá)到94.73%和76.55%。
關(guān)鍵詞:語音識(shí)別;DSP;HMM;計(jì)算器;TMS320VC5509
隨著電子技術(shù)的高速發(fā)展,現(xiàn)代普通民用計(jì)算器在保留基本的加減乘除等運(yùn)算外,加入了大量如三角函數(shù)、冪函數(shù)等比較復(fù)雜的運(yùn)算。但是其基本的操作沒有發(fā)生變化,依然是運(yùn)用手指操作,對(duì)于需要進(jìn)行實(shí)時(shí)數(shù)字計(jì)算的一些特殊人群(殘疾人士)或是在一些特殊場(chǎng)合在無法手動(dòng)操作計(jì)算器的情況下,用加入了語音識(shí)別模塊的計(jì)算器來進(jìn)行實(shí)時(shí)數(shù)字計(jì)算就有相當(dāng)?shù)谋匾?br /> 語音識(shí)別技術(shù)是人機(jī)最自然、最簡(jiǎn)潔的交流方式,它就是讓機(jī)器能夠自動(dòng)識(shí)別并理解說話人要表達(dá)的意思,將語音信號(hào)轉(zhuǎn)變?yōu)檎_的文本或者命令的高科技技術(shù)。根據(jù)實(shí)際的應(yīng)用,語音識(shí)別可以分為:特定人與非特定人的識(shí)別、孤立詞與連續(xù)詞的識(shí)別、中小詞匯量與無限詞匯量的識(shí)別。
考慮到成本及使用范圍因素,本文中應(yīng)用的是基于TMS320VC5509 DSP的非特定人、孤立詞、小詞匯量的語音識(shí)別系統(tǒng)。通過實(shí)際測(cè)試,使用該DSP的語音識(shí)別系統(tǒng)有著較高的實(shí)時(shí)性、識(shí)別率,基于該系統(tǒng)的計(jì)算器對(duì)實(shí)時(shí)數(shù)字計(jì)算有較高準(zhǔn)確性,基本能解決特殊群體和特殊地點(diǎn)使用計(jì)算器困難的情況。
1 系統(tǒng)硬件設(shè)計(jì)
1.1 語音識(shí)別系統(tǒng)
語音識(shí)別的基本原理框圖如圖l所示。語音識(shí)別過程主要包括語音信號(hào)前處理、特征提取、模式匹配等部分。語音信號(hào)輸入之后,預(yù)處理和數(shù)字化是進(jìn)行語音識(shí)別的前提條件。特征提取是進(jìn)行語音信號(hào)訓(xùn)練和識(shí)別必不可少的步驟,本文采用的是提取每幀的Mel系數(shù)的倒譜參數(shù)作為語音信號(hào)的特征值。模板匹配算法目前有DTW算法、HMM隱馬爾科夫模型、ANN人工神經(jīng)網(wǎng)絡(luò)等。本文采用HMM隱馬爾科夫模型的方法,提取出的特征值存入?yún)⒖寄J綆熘?,用來匹配待識(shí)別語音信號(hào)的特征值。匹配計(jì)算是進(jìn)行語音識(shí)別的核心部分,由待識(shí)別人的語音經(jīng)過特征提取后,與系統(tǒng)訓(xùn)練時(shí)產(chǎn)生的模板進(jìn)行匹配,在說話人辨認(rèn)中,取與待識(shí)別語音相似度最大的模型所對(duì)應(yīng)的語音作為識(shí)別結(jié)果。
1.2 系統(tǒng)硬件結(jié)構(gòu)
圖2為系統(tǒng)硬件結(jié)構(gòu)框圖。此系統(tǒng)的核心器件是TI公司的TMS320VC5509定點(diǎn)DSP。在本系統(tǒng)中,它不僅是語音識(shí)別的核心,還負(fù)責(zé)計(jì)算器的運(yùn)算部分。TMS320VC5509是系統(tǒng)的運(yùn)算處理單元,具有2個(gè)乘法器(MAC),4個(gè)累加器(ACC);40位、16位的算術(shù)邏輯單元(ALU)各一個(gè),這大大增強(qiáng)了DSP的運(yùn)算能力;指令字長不只單一的16位,可擴(kuò)展到最高48位,數(shù)據(jù)字長16位;可通過USB接口對(duì)TMS320VC5509燒寫程序而不必借助仿真器。正是基于這些優(yōu)點(diǎn),選擇該器件可節(jié)省開發(fā)資金,減小電路板面積。DSP與TLV320AIC23的接口電路如圖3所示。
評(píng)論