新聞中心

EEPW首頁(yè) > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 基于STM32的嵌入式語(yǔ)音識(shí)別模塊設(shè)計(jì)

基于STM32的嵌入式語(yǔ)音識(shí)別模塊設(shè)計(jì)

作者: 時(shí)間:2011-03-23 來(lái)源:網(wǎng)絡(luò) 收藏

摘要:介紹了一種以ARM為核心的與實(shí)現(xiàn)。的核心處理單元選用ST公司的ARM Cortex-M3內(nèi)核的32位處理器F103C8T6。本以對(duì)話管理單元為中心,通過(guò)以LD3320芯片為核心的硬件單元實(shí)現(xiàn)功能,采用操作系統(tǒng)μC/OS-II來(lái)實(shí)現(xiàn)統(tǒng)一的任務(wù)調(diào)度和外圍設(shè)備管理。經(jīng)過(guò)大量的實(shí)驗(yàn)數(shù)據(jù)驗(yàn)證,本文模塊具有高實(shí)時(shí)性、高識(shí)別率、高穩(wěn)定性的優(yōu)點(diǎn)。
關(guān)鍵詞:ARM;語(yǔ)音識(shí)別;對(duì)話管理;LD3320;μC/OS-II

引言
服務(wù)機(jī)器人以服務(wù)為目的,因此人們需要一種更方便、更自然、更加人性化的方式與機(jī)器人交互,而不再滿足于復(fù)雜的鍵盤(pán)和按鈕操作。聽(tīng)覺(jué)的人機(jī)交互是該領(lǐng)域的一個(gè)重要發(fā)展方向。目前主流的語(yǔ)音識(shí)別技術(shù)是統(tǒng)計(jì)模式。然而,由于統(tǒng)計(jì)模型訓(xùn)練算法復(fù)雜,運(yùn)算量大,一般由工控機(jī)、PC機(jī)或筆記本來(lái)完成,這無(wú)疑限制了它的運(yùn)用。語(yǔ)音交互已成為目前研究的熱門(mén)課題。
嵌入式語(yǔ)音識(shí)別系統(tǒng)和PC機(jī)的語(yǔ)音識(shí)別系統(tǒng)相比,雖然其運(yùn)算速度和內(nèi)存容量有一定限制,但它具有體積小、功耗低、可靠性高、投入小、安裝靈活等優(yōu)點(diǎn),特別適用于智能家居、機(jī)器人及消費(fèi)電子等領(lǐng)域。

1 模塊整體方案及架構(gòu)
語(yǔ)音識(shí)別的基本原理如圖1所示。語(yǔ)音識(shí)別包括兩個(gè)階段:訓(xùn)練和識(shí)別。不管是訓(xùn)練還是識(shí)別,都必須對(duì)輸入語(yǔ)音預(yù)處理和特征提取。訓(xùn)練階段所做的具體工作是通過(guò)用戶輸入若干次訓(xùn)練語(yǔ)音,經(jīng)過(guò)預(yù)處理和特征提取后得到特征矢量參數(shù),最后通過(guò)特征建模達(dá)到建立訓(xùn)練語(yǔ)
音的參考模型庫(kù)的目的。而識(shí)別階段所做的主要工作是將輸入語(yǔ)音的特征矢量參數(shù)和參考模型庫(kù)中的參考模型進(jìn)行相似性度量比較,然后把相似性最高的輸入特征矢量作為識(shí)別結(jié)果輸出。這樣,最終就達(dá)到了語(yǔ)音識(shí)別的目的。

本文引用地址:http://www.butianyuan.cn/article/150932.htm

a.jpg


現(xiàn)有的語(yǔ)音識(shí)別技術(shù)按照識(shí)別對(duì)象可以分為特定人識(shí)別和非特定人識(shí)別。特定人識(shí)別是指識(shí)別對(duì)象為專門(mén)的人,非特定人識(shí)別是指識(shí)別對(duì)象是針對(duì)大多數(shù)用戶,一般需要采集多個(gè)人的語(yǔ)音進(jìn)行錄音和訓(xùn)練,經(jīng)過(guò)學(xué)習(xí),達(dá)到較高的識(shí)別率。
基于現(xiàn)有技術(shù)開(kāi)發(fā)嵌入式語(yǔ)音交互系統(tǒng),目前主要有兩種方式:一種是直接在嵌入式處理器中調(diào)用語(yǔ)音開(kāi)發(fā)包;另一種是嵌入式處理器外圍擴(kuò)展語(yǔ)音芯片。第一種方法程序量大,計(jì)算復(fù)雜,需要占用大量的處理器資源,開(kāi)發(fā)周期長(zhǎng);第二種方法相對(duì)簡(jiǎn)單,只需要關(guān)注語(yǔ)音芯片的接口部分與微處理器相連,結(jié)構(gòu)簡(jiǎn)單,搭建方便,微處理器的計(jì)算負(fù)擔(dān)大大降低,增強(qiáng)了可靠性,縮短了開(kāi)發(fā)周期。
語(yǔ)音識(shí)別技術(shù)在國(guó)內(nèi)外的發(fā)展十分迅速。目前國(guó)內(nèi)在PC應(yīng)用領(lǐng)域,具有代表性的有:科大訊飛的InterReco2.0、中科模式識(shí)別的Pattek ASR3.0、捷通華聲的jASRv5.5;在嵌入式應(yīng)用領(lǐng)域,具有代表性的有:凌陽(yáng)的SPCE061A、ICRoute的LD332X、上海華鎮(zhèn)電子的WS-117。
本文的語(yǔ)音識(shí)別方案是以嵌入式微處理器為核心,外圍加非特定人語(yǔ)音識(shí)別芯片及相關(guān)電路構(gòu)成。語(yǔ)音識(shí)別芯片選用ICRoute公司的LD33 20芯片。

linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)

上一頁(yè) 1 2 3 4 下一頁(yè)

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉