基于MATLAB的皮膚聽聲器系統(tǒng)的研究
3 系統(tǒng)設(shè)計
在MATLAB主窗口中,選擇File菜單中的New菜單項,再選擇其中的GUI命令,就會顯示圖形用戶界面的設(shè)計模板。本文系統(tǒng)主要包含3個功能:語音采集、語音處理和和語音辨析。
3.1 采集模塊
系統(tǒng)將通過電腦麥克風(fēng)進(jìn)行錄音。MATLAB中用y=wavrecord(n,fs,ch,dtype)來完成錄音,式中n為采樣的點數(shù)。決定了錄音長度;fs為采樣頻率,默認(rèn)值為11 025 Hz,還可根據(jù)要求自己選擇合適的采樣率;ch為聲道數(shù),默認(rèn)值為1,表示單聲道,如果指定為2,則采樣為雙聲道立體聲數(shù)據(jù);dtype為采樣數(shù)據(jù)的存儲格式,用字符串指定,可以是‘double’、‘single’、‘int16’、‘int8’,指定存儲格式的同時也就規(guī)定了每個采樣值量化的精度,int8對應(yīng)8位精度采樣,其他都是16位采樣精度。
錄音完成后,系統(tǒng)將把上面錄制的語音信號保存成WAVE文件。在此用函數(shù)wavwrite來完成。
最后將播放前面的語音WAVE文件,并生成其波形圖和語譜圖,為后續(xù)處理提高依據(jù)。
3.2 處理模塊
系統(tǒng)將對前面錄制的語音信號進(jìn)行預(yù)處理工作,包括:對語音信號去噪、預(yù)加重和端點檢測處理。去除噪聲就是盡量去除語音信號中無用信息(噪聲),而保留其中的有用信息(語音)。預(yù)加重的目的是提升高頻部分,使信號的頻譜變得平坦,以便于進(jìn)行頻譜分析或聲道參數(shù)分析。語音的端點檢測就是確定語音的起點和終點,從語音信號中排除無聲段,為后續(xù)處理工作提供操作對象。
然后,對信號進(jìn)行濾波處理。濾波器是對輸入信號的頻率具有選擇性的一個二端口網(wǎng)絡(luò),它允許某些頻率次(通常是某個頻率范圍)的信號通過,而其他頻率的信號幅值均要受到衰減,從而將不同的頻率的語音信號分離開,使得皮膚能夠更好的感應(yīng)語音信號。小波包變換將頻帶進(jìn)行多層次劃分,并能夠根據(jù)被分析信號的特征自適應(yīng)地選擇相應(yīng)的頻帶,使之與信號頻譜相匹配,從而提高了時一頻分辨率。利用小波包的此特點,本文將語音信號用濾波器分成16個頻率段,每個頻率段為一個語音通道,每個通道連接一個電極片分別與皮膚接觸。語音頻率范圍劃分如表1所示。
最后,點擊“特征提取”按鈕提取語音信號的特征參數(shù)。計算上面每個頻率段的信號能量值,再將16個能量值作為分向量結(jié)合在一起構(gòu)成一個特征向量,將其作為語音信號的特征參數(shù)。能量值反映每個頻率段內(nèi)語音信號所攜帶的語音能量,能夠表征該段語音,因此可以作為特征參數(shù)。并且,每個語音信號的特征參數(shù)將在最下面的窗口中輸出來。
3.3 辨析模塊
首先,建立一個數(shù)據(jù)庫。該數(shù)據(jù)庫存儲語音信號的特征參數(shù),以SOL Server2003來建庫。
然后,進(jìn)行模式匹配。建好數(shù)據(jù)庫后,對新的語音信號提取特征參數(shù)后,將其特征參數(shù)與庫中數(shù)據(jù)進(jìn)行匹配,如果找到相似度最接近的模板,則該模板就是待辨析的語音,并在下面窗口中輸出語音信號;否則,將新信號的特征參數(shù)存入數(shù)據(jù)庫,以豐富庫中數(shù)據(jù),并輸出“庫中無此語音!”。
最后,輸出辨析結(jié)果。本文引用地址:http://butianyuan.cn/article/194737.htm
4 特點分析
本系統(tǒng)的目的就是通過皮膚聽聲器使耳聾患者能夠辨析簡單語音。它通過兩個方面來完成:1)在系統(tǒng)濾波后,語音信號經(jīng)一組(本文用16個)電極片傳遞到皮膚。由于每個頻率段的語音信號能量不同,那么對皮膚的電刺激也將不同,用戶會感受到不同頻率、不同程度的刺激,在一定程度上將能分辨不同的語音。2)信號經(jīng)濾波后,進(jìn)行特征提取,然后按照一定算法用軟件辨析語音,最后輸出辨析結(jié)果。本文利用
小波包變換高分辨率的特點,先對語音信號進(jìn)行分解,然后通過濾波器濾波,在此基礎(chǔ)上提取特征參數(shù),然后利用特征參數(shù)進(jìn)行語音辨析。
這就是從皮膚感觸和視覺效果兩個方面來辨析語音,勢必將提升皮膚聽聲器辨析語音的能力。
5 結(jié)束語
本文首先介紹了皮膚聽聲技術(shù)與皮膚聽聲器;然后,說明了系統(tǒng)的主要功能和模塊劃分,以及每個模塊使用方法和核心技術(shù);最后,總結(jié)了本系統(tǒng)的特點,即從皮膚感觸和視覺效果兩個方面來辨析語音,將在一定程度上提高皮膚聽聲器辨析語音的能力。
當(dāng)然,本系統(tǒng)有不太完善的地方,如特征參數(shù)能否更詳細(xì)、更有特點?能否辨析比較復(fù)雜的語音?這些都是亟待解決的問題,也是今后研究工作的重點。
評論