關(guān) 閉

新聞中心

EEPW首頁(yè) > 工控自動(dòng)化 > 設(shè)計(jì)應(yīng)用 > 語(yǔ)意識(shí)別與智能機(jī)器人設(shè)計(jì)

語(yǔ)意識(shí)別與智能機(jī)器人設(shè)計(jì)

作者: 時(shí)間:2006-02-16 來(lái)源:網(wǎng)絡(luò) 收藏

摘要:語(yǔ)音技術(shù)在智能方面的應(yīng)用廣泛。AP7003型IC是一款性能優(yōu)良和價(jià)格低廉的語(yǔ)音電路,文中介紹它的基本電路及其在機(jī)中的一些應(yīng)用友及主意系統(tǒng)的基本原理,為提供了一種思路。

關(guān)鍵詞:AP7003 語(yǔ)音識(shí)別 目標(biāo)詞

語(yǔ)音識(shí)別技術(shù)以語(yǔ)言為研究對(duì)象,涉及生理學(xué)、語(yǔ)言學(xué)、計(jì)算機(jī)及信號(hào)處理等多個(gè)領(lǐng)域,是語(yǔ)言信號(hào)處理的一個(gè)重要研究方向,在智能控制、多媒體、人機(jī)對(duì)話等方面有著極其廣泛的應(yīng)用前景。

1 語(yǔ)音識(shí)別技術(shù)

語(yǔ)音識(shí)別技術(shù)首先要提取語(yǔ)音特征參量,也就是從語(yǔ)言信號(hào)中提取語(yǔ)音識(shí)別的有用信息。語(yǔ)音特征參量的提取要考慮單詞選定位置的基音、鼻輔音的頻譜、元音的頻譜、擦音的頻譜等要素。語(yǔ)音識(shí)別技術(shù)也必須有模式匹配及模型訓(xùn)練技術(shù),其中主要包括動(dòng)態(tài)時(shí)間規(guī)整技術(shù)、HMM模型和人工神經(jīng)網(wǎng)絡(luò)。時(shí)間規(guī)整是把一個(gè)單詞內(nèi)的時(shí)變特征變?yōu)橐恢碌倪^(guò)程,在時(shí)間規(guī)整過(guò)程中,作為單詞的時(shí)間軸要不均勻的扭曲或彎曲,使其行征為模型特征對(duì)正,該技術(shù)是一種有力的矯正措施,對(duì)提高系統(tǒng)的識(shí)別精度極為有效。人工神經(jīng)網(wǎng)絡(luò)是一個(gè)自適應(yīng)非線性動(dòng)力學(xué)系統(tǒng),模擬人體大腦活動(dòng)的基本原理,具有學(xué)習(xí)、技藝、判斷、對(duì)比和概括等能力。另外,語(yǔ)音識(shí)別單元的選取也是語(yǔ)音識(shí)別的重要一步,語(yǔ)言識(shí)別單元有單詞、音節(jié)和音素。對(duì)于漢語(yǔ)而言,主要選取音節(jié)單元,因?yàn)闈h語(yǔ)是單音節(jié)結(jié)構(gòu)的語(yǔ)言,而英語(yǔ)是多音節(jié)的語(yǔ)言,漢語(yǔ)約有400個(gè)音節(jié),數(shù)量相對(duì)較少,便于識(shí)別。

2 AP7003型語(yǔ)音識(shí)別電路

AP7003是一款低成本語(yǔ)音識(shí)別專用集成電路,內(nèi)置麥克風(fēng)放大器、A/D轉(zhuǎn)換器、語(yǔ)音處理器和I/O控制器,經(jīng)預(yù)處理后可識(shí)別12組不同的字詞,每組1.5s時(shí)長(zhǎng),可連詞或單詞識(shí)別??蓮V泛應(yīng)用于玩具、識(shí)別轉(zhuǎn)控和自動(dòng)答錄等領(lǐng)域。

AP7003的功能框圖如圖1所示。表1給出AP7003的引腳功能。

表1 AP7003的引腳功能

引腳名稱功 能
GNDD數(shù)字地
LED1低電平存放LED驅(qū)動(dòng)腳,能設(shè)計(jì)成語(yǔ)音輸入指示,適合于標(biāo)準(zhǔn)應(yīng)用
DLED2低電平存放LED驅(qū)動(dòng)腳,在標(biāo)準(zhǔn)應(yīng)用線路中設(shè)計(jì)成語(yǔ)音輸入驗(yàn)證結(jié)果的標(biāo)志
DPOB1-POB4輸出口,作為鍵盤(pán)掃描用,標(biāo)準(zhǔn)應(yīng)用
DPIT1-PIT4低電平有效輸入口,內(nèi)部有上拉電阻器,能設(shè)計(jì)成輸入口或鍵盤(pán)的輸入標(biāo)準(zhǔn)應(yīng)用
DVDDD數(shù)字電源VDD
DCAPV去耦電容器,電容器必須接在此引腳到地之間,用于內(nèi)部的電壓基準(zhǔn)
DOSCI頻率振蕩器控制腳,接一個(gè)56k電阻器到地
DPIM1PIM2普通輸入腳,能設(shè)計(jì)成模式控制輸入,用于標(biāo)準(zhǔn)電路
DTEST測(cè)試引腳,用于生產(chǎn)測(cè)試
DPOSL輸出模式選擇,用于輸出A口,若ProtA是高電平有效,則以POSL接高電平;若低電平有效則接地
GNDA模擬地
TREF語(yǔ)音輸入閥電壓控制
A2OUT輸出第二放大器
AIIN第一(前級(jí))放大器反相輸入
A1OUT前級(jí)放大輸出
MICP麥克風(fēng)的正電源腳
VDDA模擬電路正電源
POA-POA12輸出口
PORES高電平有效輸入,清除輸出口A狀態(tài)

AP7003的主要特征如下:

內(nèi)置麥克風(fēng)放大器

內(nèi)置A/D轉(zhuǎn)換器

采用DIP40雙列直插式封裝

能識(shí)別12組1.5s時(shí)長(zhǎng)字詞

I/O:2個(gè)普通輸入,4個(gè)觸發(fā)輸入,2個(gè)輸出口分別有4個(gè)、12個(gè)輸出,2個(gè)LED驅(qū)動(dòng)

AP7003具有二種工作模式,即錄音模式和識(shí)別模式,在進(jìn)入識(shí)別模式之前,應(yīng)先將目標(biāo)詞錄入電路內(nèi)。在AP7003內(nèi)有12個(gè)存貯體用于存貯12組不同的字句,每個(gè)存貯體可存貯1.5s時(shí)長(zhǎng)的字句,可通過(guò)鍵盤(pán)或按程序編制的順序選擇存貯體來(lái)錄入及存放目標(biāo)詞。語(yǔ)音可通過(guò)外部麥克風(fēng)或其他媒體錄入電路內(nèi),經(jīng)內(nèi)部處理后以不同的數(shù)字特征信號(hào)保存在存貯體中。

圖2

目標(biāo)詞錄入電路內(nèi)后即可將工作模式轉(zhuǎn)換到識(shí)別模式,工作時(shí)電路將當(dāng)前語(yǔ)音與事先錄入存貯體的目標(biāo)詞語(yǔ)音相比較,如果語(yǔ)音特征相匹配,則在電路的相應(yīng)輸出端輸出高電平或低電平。

3 聲控機(jī)器人設(shè)計(jì)

語(yǔ)音識(shí)別電路廣泛應(yīng)用在智能控制中,把這種電路應(yīng)用在器人設(shè)計(jì)中,使機(jī)器人初步具有與人對(duì)話的能力,且機(jī)器人的操作具有普遍性,極大地提高了操作者的興趣,圖2是機(jī)器人電路的主要原理框圖。

圖2中按鍵的定義如表2所示。上電后12個(gè)存貯器在錄入目標(biāo)詞之前必須清空,開(kāi)始錄入目標(biāo)詞時(shí)使LED1有效,錄入后電路將進(jìn)入識(shí)別模式。

表2 按鍵的定義

Key NO.12Key (PIM1=1)
1Store Word1
2Store Word2
3Stroe Word3
4Store Word4
5Store Word5
6Store Word6
7Sotre Word7
8Store Word8
9Set R_Leve1
10Set Level2
11Clear Output
12Shut Down
PIT4Clesr Word

如果由麥克風(fēng)錄入的單詞與存儲(chǔ)器原有單詞相匹配,對(duì)應(yīng)的POA輸出口有效,并驅(qū)動(dòng)斷電器器,電機(jī)運(yùn)動(dòng)。在本設(shè)計(jì)中,機(jī)器人主要有“前進(jìn)”(J1)、“后退”(J2)、“左轉(zhuǎn)”(J3)、“右轉(zhuǎn)”(J4)、“舉起”(J5)、“放下”(J6)、“停止”等幾種動(dòng)作。其中,“停止”定義為clearOutput,其他依次定義為POA3、POA4、POA5、POA6、POA7和POA8。以“前進(jìn)”(J1)和“后退”(J2)為例,如圖3所示。

當(dāng)“停止”時(shí),清除POA所有狀態(tài),機(jī)器人停止。

當(dāng)然,語(yǔ)音識(shí)別電路對(duì)外部麥克風(fēng)(MIC)的分貝值有一定的要求,經(jīng)驗(yàn)表明在本語(yǔ)音識(shí)別電路中選用56dB的麥克風(fēng)較好。另外,AP7003的工作電壓為2.4~4.5V,如果您的應(yīng)用系統(tǒng)是5V工作電壓,那么,通過(guò)一個(gè)二極管給AP7003供電,可以保證系統(tǒng)能長(zhǎng)期穩(wěn)定、可靠的工作,也有利于降低系統(tǒng)功耗。

4 結(jié)束語(yǔ)

在實(shí)際應(yīng)用的過(guò)程中,麥克風(fēng)的分貝值、Set R_Level匹配度的設(shè)置對(duì)于語(yǔ)音識(shí)別的效果影響較大。如果這二個(gè)參數(shù)設(shè)置合理,該電路可具有較高的識(shí)別率,一般可達(dá)80%以上,不失為一種效好的語(yǔ)音識(shí)別電路。



評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉