新聞中心

EEPW首頁 > EDA/PCB > 設(shè)計(jì)應(yīng)用 > 新型語音識(shí)別電路AP7003及其應(yīng)用

新型語音識(shí)別電路AP7003及其應(yīng)用

作者: 時(shí)間:2006-05-07 來源:網(wǎng)絡(luò) 收藏

摘要:介紹了新型、低成本語音識(shí)別電路AP7003的性能、引腳、指令等內(nèi)容,并給出了應(yīng)用電路原理圖及詳細(xì)的應(yīng)用方法。

本文引用地址:http://butianyuan.cn/article/226453.htm

關(guān)鍵詞:語音識(shí)別 鍵盤控制 CPU控制 存儲(chǔ)體

1 AP7003簡(jiǎn)介

AP7003是一款新型、低成本語音識(shí)別專用集成電路,內(nèi)置有麥克風(fēng)放大器、A/D轉(zhuǎn)換器、語音處理器和I/O控制器,經(jīng)預(yù)處理后可識(shí)別12組不同的字詞,每組1.5秒時(shí)長,可連詞或單詞識(shí)別。AP7003包括AP7003-01(由CPU串行控制)和AP7003-02(由按鍵直接控制)兩種型號(hào),且最有高度的I/O可編程性,使用簡(jiǎn)單方便,可廣泛應(yīng)用于玩具、識(shí)別轉(zhuǎn)控、自動(dòng)答錄等領(lǐng)域。

AP7003的功能框圖如圖1所示。其主要特性如下:

·內(nèi)置麥克風(fēng)放大器;

·內(nèi)置A/D轉(zhuǎn)換器;

·DIP40雙列直插式封裝;

·識(shí)別12組1.5秒時(shí)長字詞;

·I/O口具有2個(gè)普通輸入、4個(gè)觸發(fā)輸入、2個(gè)輸出口(分別有4個(gè)和12個(gè)輸出)、2個(gè)LED驅(qū)動(dòng);

·指令優(yōu)化以方便用戶使用;

·2.4V-4.5V工作電壓,且具備低功耗模式。

2 AP7003功能說明

AP7003具有兩種工作模式,即錄音模式和識(shí)別模式。在使用識(shí)別模式之前,應(yīng)先將目標(biāo)錄入芯片內(nèi)。AP7003內(nèi)有12狐假虎威存儲(chǔ)體用于存儲(chǔ)12組不同的字句,每個(gè)存儲(chǔ)體可存儲(chǔ)1.5秒時(shí)長的字詞,可通過鍵盤或按程序編制的順序選擇存儲(chǔ)體錄入及存放目標(biāo)詞。語音可通過外部麥克風(fēng)或其它媒體錄入芯片內(nèi),經(jīng)內(nèi)部處理后以不同的數(shù)字持片信號(hào)保存于存儲(chǔ)體中。

目標(biāo)詞錄入芯片內(nèi)后即可將工作模式轉(zhuǎn)換到識(shí)別模式,工作時(shí)芯片將當(dāng)前語音與事先已錄入存儲(chǔ)體的目標(biāo)詞語音相比較,如果有語音特征相匹配,則在芯片的相應(yīng)輸出端口輸出高電平或低電平。需要時(shí)間以將芯片編程為省電模式以節(jié)省電能,當(dāng)有按鍵信號(hào)時(shí)芯片將被喚醒。

AP7003采用DIP40封裝,引腳功能如表1所示,其典型應(yīng)用電路如圖2所示。

表1 AP7003引腳功能說明

引腳號(hào) 引腳名稱 功能說明
1
2
3
4
8~5
12~9
13
14
15
17、18


19
20
21
22
23
24
26
27
28
29~40
16、25
PORES
GNDD
LED1
LED2
POB1~POB4
PIT1~PIT4
VDDD
CAPV
OSC1
PIM1、PIM2


TEST
POSL
GNDA
TREF
A2OUT
A1IN
A1OUT
MICP
VDDA
POA1~POA12
NC
清除A輸出口(POA)輸出狀態(tài),高有效)
數(shù)字地
驅(qū)動(dòng)LED,低有效,可編程用于指示語音錄音的狀態(tài)
驅(qū)動(dòng)LED,低有效,可編程用于指示語音識(shí)別的結(jié)果
B輸出口,可編程用于鍵盤驅(qū)動(dòng)
低脈沖觸發(fā)輸入,內(nèi)部有上拉電阻,可編程用于鍵盤輸入
數(shù)字電源
通過電容接地,對(duì)內(nèi)部電壓進(jìn)行濾波
振蕩頻率控制,通過56kΩ電阻接地
普通輸入引腳,可編程用于芯片工作模式控制:PIM1=1時(shí),芯片具有識(shí)別功能;PIM2=1時(shí),A端口可以輸出。反之不能進(jìn)行識(shí)別或A端口不能輸出
測(cè)試端,芯片出廠時(shí)測(cè)試用
對(duì)A輸出口有效電平進(jìn)行選擇:高時(shí)A口高有效;低時(shí)A口低有效
模擬地
語音輸入門限控制端
第二級(jí)放大器輸出端
第一級(jí)放大器負(fù)輸入端
第一級(jí)放大器輸出端
電子麥克風(fēng)電源供應(yīng)端
模擬電源
A輸出口,可編程用于語音錄入/語音識(shí)別對(duì)的存儲(chǔ)體指示
未用引腳

3 AP7003-01的應(yīng)用

AP7003-01可通過串行口與微控制器連接,應(yīng)用圖如圖3所示。AP7003-01共有22個(gè)輸入指令和15個(gè)輸出指令,如表2所示。AP7003-01工作時(shí)序及時(shí)間定義如圖4所示。

表2 AP70001指令與代碼

輸 入 輸 出
指令 代碼 指令 代碼 指令 代碼 指令 代碼
Store Word1
Store Word2
Store Word3
Store Word4
Store Word5
Store Word6
Store Word7
Store Word8
Store Word9
Store Word10
Store Word11

01H
02H
03H
04H
05H
06H
07H
08H
09H
0AH
0BH

Store Word12
Store Flag
Clear Word
Set R_Level 1
Set R_Level 2
Set R_Level 3
Set R_Level 4
Set R_Mode 1
Set R_Mode 2
Clear Outputs
Shut Down

0CH
0DH
0H
11H
12H
13H
14H
15H
16H
17H
18H

Match Word1
Match Word2
Match Word3
Match Word4
Match Word5
Match Word6
Match Word7
Match Word8
Match Word9
Match Word10
Match Word11

01H
02H
03H
04H
05H
06H
07H
08H
09H
0AH
0BH

Match Word12
Done
No Match Word
Data In Error






0CH
11H
12H
13H






系統(tǒng)上電后必須先給AP7003-01發(fā)清除指令Clear Word以清除12個(gè)存儲(chǔ)體內(nèi)的內(nèi)容,然后發(fā)出一個(gè)存儲(chǔ)指令(Store Word1~Store Word12之一)將目標(biāo)詞錄入芯片相應(yīng)的存儲(chǔ)體內(nèi)。當(dāng)LED1有效時(shí),表示芯片準(zhǔn)備好錄入目標(biāo)詞。通過指令Set R_Mode1或Set R_Mode2可選擇兩種識(shí)別模式:Set R_Mode1為單詞識(shí)別模式,該模式下識(shí)別操作完成后,芯片進(jìn)入省電狀態(tài)以等待表的指令;Set R_Mode2為連詞識(shí)別模式,該模式下識(shí)別操作完成后芯片返回語音錄入狀態(tài)。

進(jìn)入語音識(shí)別狀態(tài)前必須通過指令Set R_Level1~Set R_Level4設(shè)置識(shí)別時(shí)要示訴匹配度,Set R_Level4要求匹配程序最高,而Set R_Level1最低,可以根據(jù)經(jīng)驗(yàn)設(shè)定為中間某一個(gè)值。跟在一個(gè)Store Word1~12指令之后的Store Flag指令將前面錄入的語音存入指定的存儲(chǔ)體以作為目標(biāo)詞。Clear Outputs指令用于清除A端口輸出狀態(tài)(POA1~POA12).Shut Down指令將芯片轉(zhuǎn)入關(guān)閉模式以節(jié)省電能。

當(dāng)數(shù)據(jù)格式或時(shí)序出現(xiàn)在串行數(shù)據(jù)(SERIAL DATA)輸入口PIT3、PIT2、PIT1時(shí),芯片將發(fā)送錯(cuò)誤代碼到串行數(shù)據(jù)輸出口POB4,同時(shí)將數(shù)據(jù)、時(shí)鐘發(fā)送到串行數(shù)據(jù)輸出口POB2、POB3。

指令Stroe Word1~12、Store Flag、Clear Word、Set R_Level1~4和Clear Outputs執(zhí)行完成后,芯片將輸出一個(gè)Done代碼。芯片每次執(zhí)行完語音識(shí)別后,輸出一個(gè)匹配指示代碼(Match Word1~Match Word12或NO Match)。當(dāng)有一個(gè)語音匹配時(shí),LED2有效,如果PIM2被拉高(端口A使能),則端口相應(yīng)的引腳變?yōu)橛行?。如果PIM1引腳被拉底,芯片的語音識(shí)別功能被禁止。

4 AP7003-02的應(yīng)用

AP7..3-02可以單獨(dú)使用,無需控制器,適合于用鍵盤直接控制。芯片有8鍵控制和12鍵控制兩種鍵盤操作模式,如圖5所示。各鍵及其功能見表3(a)、(b)。

上電后POB1~POB4均被置成低電平。當(dāng)有鍵按下后,芯片按POB1→POB2→POB3→POB4的順序依次發(fā)出鍵盤掃描信號(hào),掃描信號(hào)為16ms低脈沖加64ms間隔,且循環(huán)進(jìn)行,按鍵信號(hào)從PIT1~PIT4輸入芯片。鍵盤陣列如表3(c)所示。

在識(shí)別模式初始狀態(tài),只有LED1是有效的。識(shí)別完成后,如果沒有詞相匹配,LED1閃爍3秒鐘后回到識(shí)別模式初始狀態(tài);如果有詞相匹配,LED2有效,與匹配詞所在存儲(chǔ)體相對(duì)應(yīng)的POA輸出端口也有效。如果芯片被設(shè)置成自動(dòng)模式(PIM2=0),則LED2及POA的輸出將在3分鐘后被清除,之后回到識(shí)別模式初始狀態(tài)。當(dāng)PIM2=0時(shí),如果連接8分鐘沒有語音輸入芯片,將自動(dòng)進(jìn)入省電模式。

5 應(yīng)注意的問題

(1)語音識(shí)別電路對(duì)外部麥克風(fēng)(MIC)的分貝值有一定的要求。使用經(jīng)驗(yàn)表明,本語音識(shí)別電路中選用56dB的麥克風(fēng)可達(dá)到最佳效果。

(2)語音識(shí)別前設(shè)置的匹配度是一個(gè)影響識(shí)別率高低的重要因素,在實(shí)驗(yàn)過程中需要根據(jù)使用環(huán)境、使用要求等情況多次實(shí)驗(yàn)才能確定最佳值。

(3)AP7003的工作電壓為2.4V~4.5V。對(duì)于3V的應(yīng)用系統(tǒng),可直接使用;如果您的應(yīng)用系統(tǒng)是5V工作電壓,建議通過一個(gè)二極管給AP7003供電,以保證系統(tǒng)長期穩(wěn)定可靠地工作,也有利于降低系統(tǒng)功耗。

表3(a)AP7003-02鍵盤模式

Mode
Key NO.
8Key(PIM1=0) 12Key(PIM1=1)

1
2
3
4
5
6
7
8
9
10
11
12
PIT3
PIT4

Store Word
Word Up
Word Down
Set R_Level 1
Set R_Level 2
Set R_Level 3
Clear Output
Shut Down
N.A.
N.A.
N.A.
N.A.
Store Word
Clear Word
Store Word1
Store Word2
Store Word3
Store Word4
Store Word5
Store Word6
Store Word7
Store Word8
Set R_Level 1
Set R_Level 2
Clear Output
Shut Down
N.A.
Clear Word

表3(b)AP7003-02按鍵功能

鍵 名 功 能 說 明
Clear Word
Store Word
Store Word1~8
Word Up
Word Down
Set R_Level1~3
Clear Output
Shut Down
清除12個(gè)存儲(chǔ)體內(nèi)容,之后進(jìn)入存儲(chǔ)目標(biāo)詞1(Store SWord1)狀態(tài)
選擇當(dāng)前存儲(chǔ)體存儲(chǔ)錄入的語音
選擇12個(gè)存儲(chǔ)體中的一個(gè)以存儲(chǔ)錄入的語音
選擇后個(gè)存儲(chǔ)體以存儲(chǔ)錄入的語音;存儲(chǔ)體12的“后一個(gè)”是存儲(chǔ)體1
選擇前一個(gè)存儲(chǔ)體以存儲(chǔ)錄入的語音;存儲(chǔ)體1的“前一個(gè)”仍是存儲(chǔ)1
設(shè)置語音識(shí)別的匹配度,之后進(jìn)入語音識(shí)別初始狀態(tài)
清除POA1~POA12和LED2狀態(tài),之后進(jìn)入語音識(shí)別初始狀態(tài)
將芯片轉(zhuǎn)入省電模式

表3(c) AP7003-02鍵盤陣列

  POB1 POB2 POB3 POB4
PIT1 KEY1 KEY2 KEY3 KEY4
PIT2 KEY5 KEY6 KEY7 KEY8
PIT3 KEY9 KEY10 KEY11 KEY12

應(yīng)用表明,AP7003使用簡(jiǎn)單方便,具有較高的識(shí)別率,一般可達(dá)80%以上,是一款較好的語音識(shí)別芯片。



評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉