基于STM32的嵌入式語音識別模塊設計
3.3 對話管理單元設計
為了方便進行對話的管理,本文中設計了一個對話管理單元,用于對等待識別的語句和等待執(zhí)行的命令進行存儲,在主控制器中通過定義二維數組來實現(xiàn)。LD3320每次識別最多可以設置50項候選識別句,每個識別句可以是單字、詞組或短句,長度為不超過10個漢字或者79個字節(jié)的拼音串。基于上述原因,本文設計的對話管理數組如表3所列。本文引用地址:http://www.butianyuan.cn/article/150932.htm
行為數組中存儲要執(zhí)行的行為編號,對應于50條語音識別語句,共有50組指令,每組指令中可以最多包含6個行為,并行的行為可以歸為一步,通過多個行為的組合,就可以完成更復雜的任務。
4 性能測試與應用
為了保證設計的語音識別模塊的語音識別率、穩(wěn)定性和響應時間,本文對所描述的語音識別模塊做了相應的測試,測試環(huán)境分別為安靜的家庭環(huán)境和嘈雜的醫(yī)院環(huán)境,共8條語音指令,對每條語音指令分別進行10次測試,每個環(huán)境下對每個特定人的總實驗次數為80次,記錄成功識別的次數。測試結果如表4所列。
測試中的3個非特定人中,非特定人1為女性,非特定人2和非特定人3為男性。由表中數據可以看出,家庭環(huán)境下對非特定人的語音識別率可達到90%以上,嘈雜的醫(yī)院環(huán)境下的語音識別率也可達82.5%以上。識別率方面,在嘈雜環(huán)境下比在安靜環(huán)境下的語音識別率有所降低;穩(wěn)定性方面,在安靜環(huán)境下系統(tǒng)的穩(wěn)定性較好,語音說1遍,最多說2遍模塊就可以做出正確的響應;在噪聲環(huán)境下,系統(tǒng)的穩(wěn)定性有所下降,個別語音命令需要說3遍甚至3遍以上才能被模塊準確識別;實時性方面,在安靜環(huán)境下的語音能保證系統(tǒng)響應的實時性,響應時間一般不超過1 s,在噪聲環(huán)境下的響應時間相對長一些。
結語
本文討論了基于STM32的嵌入式語音識別模塊的設計和實現(xiàn),對模塊各個組成單元的硬件電路及軟件實現(xiàn)進行了詳細的介紹。大量實驗及實際應用表明,本文設計的語音識別模塊具有穩(wěn)定性好、語音識別率高、抗噪聲干擾能力強、結構簡單和使用方便等特點。該模塊實用性
強,可廣泛應用于服務機器人智能空間、智能家居和消費電子產品等多個領域。
評論