新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > 基于FPGA的語音端點(diǎn)檢測

基于FPGA的語音端點(diǎn)檢測

作者: 時間:2011-03-21 來源:網(wǎng)絡(luò) 收藏
設(shè)計中,狀態(tài)機(jī)的設(shè)計方法是最廣泛的設(shè)計方法之一,F(xiàn)SM(有限狀態(tài)機(jī))及其設(shè)計技術(shù)是實(shí)用數(shù)字系統(tǒng)設(shè)計的重要組成部分,是高效率、高可靠邏輯控制的重要途徑。而改進(jìn)后的算法可以把整個端點(diǎn)判斷過程分為三個狀態(tài),可以利用狀態(tài)機(jī)來完成的設(shè)計。狀態(tài)轉(zhuǎn)換圖如圖1所示。S0、S1、S2是三個狀態(tài);E為幀能量;T1、T2分別是低門限和高門限;C1是在狀態(tài)S1中T2>E≥T1的幀數(shù);C2是在狀態(tài)S1中T2≤E的幀數(shù);C3是在狀態(tài)S2中T1>E的幀數(shù)。

本文引用地址:http://butianyuan.cn/article/150937.htm

  

  具體判斷過程為:(1)在S0狀態(tài)下,E

  2 實(shí)驗(yàn)結(jié)果

  實(shí)驗(yàn)時的聲音樣本采用電腦聲卡采集(16 kHz,8 bit)的“wav“文件, 并對常用的詞語進(jìn)行實(shí)驗(yàn)。圖2是詞“長沙”在Matlab上的端點(diǎn)仿真結(jié)果圖,其中橫坐標(biāo)代表幀號、縱坐標(biāo)代表幀能量。兩個字的段分別是64~82幀和95~120幀。圖3是詞“長沙”在QuartusⅡ上仿真的結(jié)果圖,其中num代表每幀的幀號,start代表開始的幀號,end代表結(jié)束的幀號。從圖1、圖2可以看出詞“長沙”的端點(diǎn)檢查仿真結(jié)果在Quartus Ⅱ上的和Matlab上是一致的,從圖中可以看出改進(jìn)后的端點(diǎn)方法效果非常好。

  

  本文在加窗的過程中合理地運(yùn)用了DSP Builder工具,簡化了硬件的設(shè)計,同時也加快了處理速度,是一種很值得借鑒的加窗方法。在端點(diǎn)判斷的算法上,用改進(jìn)的Lawrence Rabiner端點(diǎn)檢測法,對算法門限的計算和起止點(diǎn)判斷做了改進(jìn),并用有限狀態(tài)機(jī)實(shí)現(xiàn)了FPGA的設(shè)計,實(shí)驗(yàn)證明該算法在低信噪比的情況下能準(zhǔn)確地找到語音信號的起止點(diǎn)。與其他一些端點(diǎn)檢測方法相比,該算法更加簡單、穩(wěn)定,所需的存儲空間小,是一種理想的硬件端點(diǎn)檢查方法,對語音識別系統(tǒng)的開發(fā)和設(shè)計有一定的參考價值。


上一頁 1 2 下一頁

關(guān)鍵詞: 檢測 語音 FPGA 基于

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉