關(guān) 閉

新聞中心

EEPW首頁(yè) > 工控自動(dòng)化 > 設(shè)計(jì)應(yīng)用 > 基于Julius的機(jī)器人語(yǔ)音識(shí)別系統(tǒng)構(gòu)建

基于Julius的機(jī)器人語(yǔ)音識(shí)別系統(tǒng)構(gòu)建

作者: 時(shí)間:2011-08-19 來(lái)源:網(wǎng)絡(luò) 收藏

2 框架
2.1 硬件結(jié)構(gòu)
的機(jī)器狗控制中Atom Z510為訓(xùn)練學(xué)習(xí)機(jī)大腦(1.1 GHz主頻的Intel Atom Z510嵌入式控制平臺(tái)),它主要完成的功能。PXA270控制器(Intel公司于2003年底推出的性能強(qiáng)勁的PXA27x系列嵌入式處理器,ARMv5E的XScale內(nèi)核,最高頻率可達(dá)624MHz)作為機(jī)器狗本體上的核心智能控制器,接收Atom Z510后的結(jié)果,發(fā)出控制命令。ATmega128控制器(Atmel公司的8位系列單片機(jī)中的一種,運(yùn)行頻率16 MHz)完成串行總線的數(shù)字舵機(jī)控制,完成對(duì)機(jī)器狗的前后腿以及尾巴等關(guān)節(jié)控制。機(jī)器狗硬件結(jié)構(gòu)平臺(tái)如圖2所示。

本文引用地址:http://butianyuan.cn/article/161552.htm

b.jpg


2.2 軟件結(jié)構(gòu)
整個(gè)包括3個(gè)模塊:識(shí)別模塊、GUI人機(jī)界面、控制模塊。將識(shí)別的語(yǔ)音命令提交給GUI模塊,并在GUI上顯示;同時(shí)GUI將語(yǔ)音命令轉(zhuǎn)化為動(dòng)作控制命令并發(fā)給控制模塊;GUI還可以控制的啟動(dòng)和停止。其中機(jī)器人控制模塊主要在PXA270上,而語(yǔ)音識(shí)別和GUI是在Atom Z510上。系統(tǒng)軟件模型如圖3所示。

c.jpg



3 語(yǔ)音識(shí)別系統(tǒng)
一個(gè)完整的語(yǔ)音識(shí)別系統(tǒng)一般包括3部分:聲學(xué)模型、語(yǔ)言模型和識(shí)別器。在本系統(tǒng)中只建立控制命令(動(dòng)詞)的識(shí)別語(yǔ)法,其他詞忽略,因此沒(méi)有語(yǔ)言模型;識(shí)別器采用Julius開(kāi)源平臺(tái),此部分只用配置參數(shù)和相關(guān)文件。本文主要工作是聲學(xué)模型訓(xùn)練和語(yǔ)音識(shí)別系統(tǒng)。
3.1 聲學(xué)模型訓(xùn)練
聲學(xué)模型是識(shí)別系統(tǒng)的底層模型,是語(yǔ)音識(shí)別系統(tǒng)中最關(guān)鍵的一部分,它是每個(gè)聲學(xué)單元的聲學(xué)模型參數(shù)集合。本系統(tǒng)的聲學(xué)模型是使用HTK對(duì)采集的語(yǔ)音庫(kù)進(jìn)行多次迭代訓(xùn)練后提取的,基于詞的聲學(xué)特征向量集。HTK(HMM Tools Kit)是由英國(guó)劍橋大學(xué)工程系的語(yǔ)音視覺(jué)和機(jī)器人技術(shù)工作組(Speech Vision and Robotics Group)開(kāi)發(fā),專門用于建立和處理HMM的實(shí)驗(yàn)工具包,主要應(yīng)用于語(yǔ)音識(shí)別領(lǐng)域,也可用于語(yǔ)音模型的測(cè)試和分析。其具體訓(xùn)練步驟如下:
(1)數(shù)據(jù)準(zhǔn)備
收集漢語(yǔ)標(biāo)準(zhǔn)普通話的語(yǔ)料庫(kù),并將語(yǔ)料庫(kù)中的語(yǔ)音標(biāo)記,創(chuàng)建語(yǔ)音識(shí)別單元元素列表文件。
(2)特征提取
本系統(tǒng)采用MFCC進(jìn)行語(yǔ)音的特征參數(shù)提取,訓(xùn)練中將每一個(gè)語(yǔ)音文件用工具HCopy轉(zhuǎn)換成MFCC格式。
(3)HMM定義
在訓(xùn)練HMM模型時(shí)要給出模型的初始框架,本系統(tǒng)中的HMM模型選擇同一個(gè)結(jié)構(gòu),如圖4所示。該模型包含4個(gè)活動(dòng)狀態(tài){S2,S3,S4,S5),開(kāi)始和結(jié)束(這里是S1.S6),是非發(fā)散狀態(tài)。觀察函數(shù)bi是帶對(duì)角矩陣的高斯分布,狀態(tài)的可能轉(zhuǎn)換由aij表示。



評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉