基于USB存儲技術(shù)的電子語音記錄系統(tǒng)的設(shè)計(jì)方案
語音識別技術(shù)與嵌入式USB主機(jī)系統(tǒng)是目前電子設(shè)計(jì)領(lǐng)域的新興技術(shù),其應(yīng)用十分廣泛。本系統(tǒng)結(jié)合該兩項(xiàng)技術(shù),實(shí)現(xiàn)了一個(gè)嵌入式USB主機(jī)結(jié)構(gòu)的電子語音記錄系統(tǒng)。該系統(tǒng)充分利用了凌陽單片機(jī)強(qiáng)大的語音識別功能。并通過嵌入式USB主、從控制芯片SL811HS和相應(yīng)的軟件設(shè)計(jì),實(shí)現(xiàn)了語音信號的智能識別,并以嵌入式主機(jī)方式保存到USB存儲器。該系統(tǒng)在保證了嵌入式系統(tǒng)的小型化特點(diǎn)的同時(shí)又實(shí)現(xiàn)了文字的錄入功能。它即可以作為一個(gè)可靈活更換存儲媒體的電子語音記事本,也可以作為一個(gè)語音錄入器,將記錄在USB存儲器中的文本文件方便的轉(zhuǎn)移到PC機(jī)等其他文字處理設(shè)備進(jìn)行再處理,具有極高的功能可擴(kuò)展性。
1系統(tǒng)結(jié)構(gòu)與原理
圖1是系統(tǒng)的硬件結(jié)構(gòu)框圖。系統(tǒng)主要包括語音采集模塊、凌陽單16位片機(jī)SPCE061A、液晶顯示模塊、USB主機(jī)接口控制器和USB存儲器等幾個(gè)部分。
該系統(tǒng)的功能是通過語音樣品采集訓(xùn)練、語音識別和USB存儲等三個(gè)環(huán)節(jié)來實(shí)現(xiàn)的。語音樣品采集時(shí),通過語音數(shù)據(jù)采集模塊內(nèi)的駐極話筒來采集語音。采集到的語音數(shù)據(jù)通過SPCE061A的MIC-IN端輸入,再經(jīng)過SPCE061A內(nèi)部A/D轉(zhuǎn)換器將其轉(zhuǎn)換成數(shù)字信號,并調(diào)用訓(xùn)練API函數(shù)對其進(jìn)行特征提取,并以樣品模板庫要求的格式保存到SPCE061A的FLASH中。音樣品采集訓(xùn)練時(shí)的提示信息和訓(xùn)練結(jié)果會在LCD上顯示。
語音識別時(shí),采集到的語音數(shù)據(jù)通過A/D轉(zhuǎn)換后,由語音識別API函數(shù)對其進(jìn)行特征提取,再與樣品模板庫中的語音樣品進(jìn)行特征匹配。匹配后的結(jié)果在LCD上顯示的同時(shí),交給USB主機(jī)接口控制器,進(jìn)入下一步的信息保存環(huán)節(jié)。
在USB主機(jī)接口控制器模塊和與之配合的USB協(xié)議和FAT文件系統(tǒng)的支持下,系統(tǒng)完成對USB設(shè)備的枚舉。并以文本文件的格式將上一環(huán)節(jié)所識別出來的信息保存到USB存儲器中,最終實(shí)現(xiàn)系統(tǒng)的全部功能。
2語音識別
語音識別屬于模式識別,它主要包括語音信號預(yù)處理、特征提取、語音模板庫、測度估計(jì)和識別決策等幾個(gè)模塊。與人的認(rèn)知過程很相似, 語音識別分為訓(xùn)練和識別兩個(gè)階段。在訓(xùn)練階段, 語音識別系統(tǒng)對語音樣本進(jìn)行學(xué)習(xí)。學(xué)習(xí)結(jié)束后,把學(xué)習(xí)的內(nèi)容存儲到模板庫中。在識別階段,把當(dāng)前輸入的語音在模板庫中查找最相近的結(jié)果,并進(jìn)行相應(yīng)的處理。語音識別的基本原理框圖如圖2所示[1]
凌陽SPCE061A單片機(jī)具有上述的語音識別技術(shù)要求的硬件和軟件的全部功能。硬件方面,SPCE061A內(nèi)部有一個(gè)A/D轉(zhuǎn)換的輸入通道和自動增益控制電路AGC,能隨時(shí)跟蹤、監(jiān)視前置放大器輸出的音頻信號電平,使進(jìn)入A/D的信號保持在最佳電平。
評論