新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 基于ARM的非特定人語音識(shí)別系統(tǒng)電路設(shè)計(jì)

基于ARM的非特定人語音識(shí)別系統(tǒng)電路設(shè)計(jì)

作者: 時(shí)間:2017-10-31 來源:網(wǎng)絡(luò) 收藏

  非特定人語音識(shí)別技術(shù)研究的最終目的是讓計(jì)算機(jī)等設(shè)備能夠“聽懂”人類語音,提取出語音中所包含的特定信息,成為人機(jī)通信和交互最便捷的手段。由于語音信號(hào)本身具有不確定性、動(dòng)態(tài)性和連續(xù)性,這就為準(zhǔn)確量化和處理該信號(hào)帶來非常大的困難,每個(gè)人的語音要建立不同的語音樣本也為識(shí)別的普及帶來瓶頸約束。目前的語音識(shí)別是先建立特征庫然后將待識(shí)別的信號(hào)經(jīng)處理與特征庫比對(duì)得到相似結(jié)果判定輸出。從本質(zhì)上屬于基于統(tǒng)計(jì)模式的基本理論,分語言模型訓(xùn)練、識(shí)別分析兩個(gè)大階段構(gòu)成和實(shí)現(xiàn)。

本文引用地址:http://www.butianyuan.cn/article/201710/369566.htm

  系統(tǒng)設(shè)計(jì)的整體結(jié)構(gòu)

  系統(tǒng)以STM32F103C8T6 微控制器為控制核心,搭配微控制器最小核心電路、LD3320語音識(shí)別電路、SD卡電路、電源電路、用戶按鍵輸入電路、串口數(shù)據(jù)輸出電路、狀態(tài)指示電路等綜合組成。該系統(tǒng)體積小巧,可以作為嵌入式組件單元融入用戶電路或者板卡中,上電后STM32F108C8T6內(nèi)部程序進(jìn)行程序初始化、SD 卡文件系統(tǒng)初始化、LD3320初始化、隨后等待識(shí)別音頻接收,識(shí)別完成后輸出響應(yīng)信息或者解碼音頻,系統(tǒng)整體結(jié)構(gòu)如圖2所示,最終實(shí)現(xiàn)積木式功能組件的全部功能。

  微控制核心電路

  系統(tǒng)采用 Cortex M3內(nèi)核ST公司的32位高性能單片機(jī)STM32F103C8T6 為控制核心,該芯片可以達(dá)到72 MHz的工作頻率,內(nèi)置高速存儲(chǔ)器(64 KB的閃存和20 KB的SRAM),擁有豐富的I/O口資源和鏈接到兩條APB 總線的外設(shè)。包括了12 b 的ADC、通用16 b 的定時(shí)器、還包括I2C、SPI、USART、USB、CAN等總線或串行通信接口,片內(nèi)資源和擴(kuò)展接口都十分豐富,該微控制核心是專門設(shè)計(jì)于滿足高穩(wěn)定性、低功耗、實(shí)時(shí)性、高性價(jià)比的嵌入式產(chǎn)品應(yīng)用。該內(nèi)核芯片可以滿足非特定人語音識(shí)別的功能要求,利用相關(guān)電路構(gòu)成STM32F103C8T6 的最小系統(tǒng),在硬件PCB 中還集成了功能引針輸出接口、SD卡接口、USB下載調(diào)試電路,用戶按鍵、電源電路等,核心系統(tǒng)電路圖如圖3所示,配合其他外圍擴(kuò)展達(dá)到功能要求。

  

  非特定人語音識(shí)別電路

  本系統(tǒng)中選用IC Route公司生產(chǎn)的LD3320非特定人語音識(shí)別芯片,該芯片是非特定人語音識(shí)別的專用芯片,內(nèi)部已經(jīng)集成了語音識(shí)別處理器和一些信號(hào)調(diào)制電路,擁有高性能的A/D轉(zhuǎn)換器、D/A轉(zhuǎn)換器、麥克風(fēng)音頻信號(hào)輸入接口、音頻解碼輸出接口等,用戶只需要用軟件編輯好待識(shí)別的關(guān)鍵詞列表,LD3320最大可以支持 50 條關(guān)鍵詞句,把這些列別以字符的形式傳送到芯片中,就可以對(duì)待識(shí)別的語音信號(hào)進(jìn)行近似度分析,識(shí)別后輸出結(jié)果。

  

  LD3320 整體工作電路如圖4 所示,總體上可以把電路圖分為8個(gè)部分,分別是LD3320基礎(chǔ)外圍電路、電源電路、外部晶體振蕩器電路、麥克風(fēng)信號(hào)處理電路、去耦合濾波電路、解碼音頻去直流成分電路、功能引針輸出電路、狀態(tài)信號(hào)指示電路。語音識(shí)別單元對(duì)于電源供電電路的要求較高,電路中注重對(duì)供電純凈度的要求,由系統(tǒng)中的LDO芯片 LM1117-3.3 V為語音識(shí)別系統(tǒng)供電,加上電感、電容為供電進(jìn)行濾波,RSTB為L(zhǎng)D3320復(fù)位引腳,連接到主控制器進(jìn)行復(fù)位控制。LD3320支持并行數(shù)據(jù)通信和串行數(shù)據(jù)通信,在本系統(tǒng)設(shè)計(jì)中考慮對(duì)主控I/O 資源的占用問題,故而選用串行通信方式對(duì)LD3320 進(jìn)行數(shù)據(jù)傳送和控制,LD3320 的MD 引腳通過上拉電阻鉗位為高電平。SPI總線的SDI、SDO、SDCK和SCS引腳連接到主控芯片對(duì)應(yīng)引腳。INTB為中斷信號(hào)引腳,遇到識(shí)別結(jié)果輸出或者是內(nèi)部音頻文件解碼完成等狀態(tài),該引腳會(huì)對(duì)應(yīng)輸出電平狀態(tài)通知主控。MBS引腳作為麥克風(fēng)偏置電壓輸入,連接了RC電路,保證產(chǎn)生一個(gè)浮動(dòng)電壓供給麥克風(fēng)信號(hào)。


電子發(fā)燒友網(wǎng)技術(shù)編輯點(diǎn)評(píng)分析:

  普及語音識(shí)別技術(shù)是當(dāng)前研究和發(fā)展的新趨勢(shì),特別是對(duì)于非特定人的語音識(shí)別是語音信號(hào)領(lǐng)域處理的熱點(diǎn)和難點(diǎn),利用了STM32F103C8T6與 LD3320結(jié)合,配合各種外圍電路完成了非特定人語音識(shí)別的嵌入式平臺(tái),在平臺(tái)中通過硬件構(gòu)建,在不更改主控制芯片程序的前提下,用戶可以通過更改 SD 卡內(nèi)配置文件的方法隨意設(shè)定識(shí)別關(guān)鍵語句,經(jīng)過不同發(fā)音人和環(huán)境的實(shí)測(cè),該系統(tǒng)在嘈雜環(huán)境中的識(shí)別準(zhǔn)確率可達(dá)81%,在安靜環(huán)境中的識(shí)別準(zhǔn)確率可達(dá)90% 以上,可以方便的嵌入用戶系統(tǒng)或者板卡中,積木式搭建靈活實(shí)用,因而具有廣泛的市場(chǎng)需求和應(yīng)用前景。

大家如有問題,歡迎在評(píng)論處討論。

——電子發(fā)燒友網(wǎng)整理,轉(zhuǎn)載請(qǐng)注明出處!



關(guān)鍵詞: 生物識(shí)別 智能硬件 ARM

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉