新型語音識(shí)別電路AP7003及其應(yīng)用
摘要:介紹了新型、低成本語音識(shí)別電路AP7003的性能、引腳、指令等內(nèi)容,并給出了應(yīng)用電路原理圖及詳細(xì)的應(yīng)用方法。
本文引用地址:http://butianyuan.cn/article/226453.htm關(guān)鍵詞:語音識(shí)別 鍵盤控制 CPU控制 存儲(chǔ)體
1 AP7003簡(jiǎn)介
AP7003是一款新型、低成本語音識(shí)別專用集成電路,內(nèi)置有麥克風(fēng)放大器、A/D轉(zhuǎn)換器、語音處理器和I/O控制器,經(jīng)預(yù)處理后可識(shí)別12組不同的字詞,每組1.5秒時(shí)長,可連詞或單詞識(shí)別。AP7003包括AP7003-01(由CPU串行控制)和AP7003-02(由按鍵直接控制)兩種型號(hào),且最有高度的I/O可編程性,使用簡(jiǎn)單方便,可廣泛應(yīng)用于玩具、識(shí)別轉(zhuǎn)控、自動(dòng)答錄等領(lǐng)域。
AP7003的功能框圖如圖1所示。其主要特性如下:
·內(nèi)置麥克風(fēng)放大器;
·內(nèi)置A/D轉(zhuǎn)換器;
·DIP40雙列直插式封裝;
·識(shí)別12組1.5秒時(shí)長字詞;
·I/O口具有2個(gè)普通輸入、4個(gè)觸發(fā)輸入、2個(gè)輸出口(分別有4個(gè)和12個(gè)輸出)、2個(gè)LED驅(qū)動(dòng);
·指令優(yōu)化以方便用戶使用;
·2.4V-4.5V工作電壓,且具備低功耗模式。
2 AP7003功能說明
AP7003具有兩種工作模式,即錄音模式和識(shí)別模式。在使用識(shí)別模式之前,應(yīng)先將目標(biāo)錄入芯片內(nèi)。AP7003內(nèi)有12狐假虎威存儲(chǔ)體用于存儲(chǔ)12組不同的字句,每個(gè)存儲(chǔ)體可存儲(chǔ)1.5秒時(shí)長的字詞,可通過鍵盤或按程序編制的順序選擇存儲(chǔ)體錄入及存放目標(biāo)詞。語音可通過外部麥克風(fēng)或其它媒體錄入芯片內(nèi),經(jīng)內(nèi)部處理后以不同的數(shù)字持片信號(hào)保存于存儲(chǔ)體中。
目標(biāo)詞錄入芯片內(nèi)后即可將工作模式轉(zhuǎn)換到識(shí)別模式,工作時(shí)芯片將當(dāng)前語音與事先已錄入存儲(chǔ)體的目標(biāo)詞語音相比較,如果有語音特征相匹配,則在芯片的相應(yīng)輸出端口輸出高電平或低電平。需要時(shí)間以將芯片編程為省電模式以節(jié)省電能,當(dāng)有按鍵信號(hào)時(shí)芯片將被喚醒。
AP7003采用DIP40封裝,引腳功能如表1所示,其典型應(yīng)用電路如圖2所示。
表1 AP7003引腳功能說明
引腳號(hào) | 引腳名稱 | 功能說明 |
1 2 3 4 8~5 12~9 13 14 15 17、18 19 20 21 22 23 24 26 27 28 29~40 16、25 | PORES GNDD LED1 LED2 POB1~POB4 PIT1~PIT4 VDDD CAPV OSC1 PIM1、PIM2 TEST POSL GNDA TREF A2OUT A1IN A1OUT MICP VDDA POA1~POA12 NC | 清除A輸出口(POA)輸出狀態(tài),高有效) 數(shù)字地 驅(qū)動(dòng)LED,低有效,可編程用于指示語音錄音的狀態(tài) 驅(qū)動(dòng)LED,低有效,可編程用于指示語音識(shí)別的結(jié)果 B輸出口,可編程用于鍵盤驅(qū)動(dòng) 低脈沖觸發(fā)輸入,內(nèi)部有上拉電阻,可編程用于鍵盤輸入 數(shù)字電源 通過電容接地,對(duì)內(nèi)部電壓進(jìn)行濾波 振蕩頻率控制,通過56kΩ電阻接地 普通輸入引腳,可編程用于芯片工作模式控制:PIM1=1時(shí),芯片具有識(shí)別功能;PIM2=1時(shí),A端口可以輸出。反之不能進(jìn)行識(shí)別或A端口不能輸出 測(cè)試端,芯片出廠時(shí)測(cè)試用 對(duì)A輸出口有效電平進(jìn)行選擇:高時(shí)A口高有效;低時(shí)A口低有效 模擬地 語音輸入門限控制端 第二級(jí)放大器輸出端 第一級(jí)放大器負(fù)輸入端 第一級(jí)放大器輸出端 電子麥克風(fēng)電源供應(yīng)端 模擬電源 A輸出口,可編程用于語音錄入/語音識(shí)別對(duì)的存儲(chǔ)體指示 未用引腳 |
3 AP7003-01的應(yīng)用
AP7003-01可通過串行口與微控制器連接,應(yīng)用圖如圖3所示。AP7003-01共有22個(gè)輸入指令和15個(gè)輸出指令,如表2所示。AP7003-01工作時(shí)序及時(shí)間定義如圖4所示。
表2 AP70001指令與代碼
輸 入 | 輸 出 | ||||||
指令 | 代碼 | 指令 | 代碼 | 指令 | 代碼 | 指令 | 代碼 |
Store Word1 Store Word2 Store Word3 Store Word4 Store Word5 Store Word6 Store Word7 Store Word8 Store Word9 Store Word10 Store Word11 | 01H | Store Word12 Store Flag Clear Word Set R_Level 1 Set R_Level 2 Set R_Level 3 Set R_Level 4 Set R_Mode 1 Set R_Mode 2 Clear Outputs Shut Down | 0CH | Match Word1 Match Word2 Match Word3 Match Word4 Match Word5 Match Word6 Match Word7 Match Word8 Match Word9 Match Word10 Match Word11 | 01H | Match Word12 Done No Match Word Data In Error | 0CH |
系統(tǒng)上電后必須先給AP7003-01發(fā)清除指令Clear Word以清除12個(gè)存儲(chǔ)體內(nèi)的內(nèi)容,然后發(fā)出一個(gè)存儲(chǔ)指令(Store Word1~Store Word12之一)將目標(biāo)詞錄入芯片相應(yīng)的存儲(chǔ)體內(nèi)。當(dāng)LED1有效時(shí),表示芯片準(zhǔn)備好錄入目標(biāo)詞。通過指令Set R_Mode1或Set R_Mode2可選擇兩種識(shí)別模式:Set R_Mode1為單詞識(shí)別模式,該模式下識(shí)別操作完成后,芯片進(jìn)入省電狀態(tài)以等待表的指令;Set R_Mode2為連詞識(shí)別模式,該模式下識(shí)別操作完成后芯片返回語音錄入狀態(tài)。
進(jìn)入語音識(shí)別狀態(tài)前必須通過指令Set R_Level1~Set R_Level4設(shè)置識(shí)別時(shí)要示訴匹配度,Set R_Level4要求匹配程序最高,而Set R_Level1最低,可以根據(jù)經(jīng)驗(yàn)設(shè)定為中間某一個(gè)值。跟在一個(gè)Store Word1~12指令之后的Store Flag指令將前面錄入的語音存入指定的存儲(chǔ)體以作為目標(biāo)詞。Clear Outputs指令用于清除A端口輸出狀態(tài)(POA1~POA12).Shut Down指令將芯片轉(zhuǎn)入關(guān)閉模式以節(jié)省電能。
當(dāng)數(shù)據(jù)格式或時(shí)序出現(xiàn)在串行數(shù)據(jù)(SERIAL DATA)輸入口PIT3、PIT2、PIT1時(shí),芯片將發(fā)送錯(cuò)誤代碼到串行數(shù)據(jù)輸出口POB4,同時(shí)將數(shù)據(jù)、時(shí)鐘發(fā)送到串行數(shù)據(jù)輸出口POB2、POB3。
指令Stroe Word1~12、Store Flag、Clear Word、Set R_Level1~4和Clear Outputs執(zhí)行完成后,芯片將輸出一個(gè)Done代碼。芯片每次執(zhí)行完語音識(shí)別后,輸出一個(gè)匹配指示代碼(Match Word1~Match Word12或NO Match)。當(dāng)有一個(gè)語音匹配時(shí),LED2有效,如果PIM2被拉高(端口A使能),則端口相應(yīng)的引腳變?yōu)橛行?。如果PIM1引腳被拉底,芯片的語音識(shí)別功能被禁止。
4 AP7003-02的應(yīng)用
AP7..3-02可以單獨(dú)使用,無需控制器,適合于用鍵盤直接控制。芯片有8鍵控制和12鍵控制兩種鍵盤操作模式,如圖5所示。各鍵及其功能見表3(a)、(b)。
上電后POB1~POB4均被置成低電平。當(dāng)有鍵按下后,芯片按POB1→POB2→POB3→POB4的順序依次發(fā)出鍵盤掃描信號(hào),掃描信號(hào)為16ms低脈沖加64ms間隔,且循環(huán)進(jìn)行,按鍵信號(hào)從PIT1~PIT4輸入芯片。鍵盤陣列如表3(c)所示。
在識(shí)別模式初始狀態(tài),只有LED1是有效的。識(shí)別完成后,如果沒有詞相匹配,LED1閃爍3秒鐘后回到識(shí)別模式初始狀態(tài);如果有詞相匹配,LED2有效,與匹配詞所在存儲(chǔ)體相對(duì)應(yīng)的POA輸出端口也有效。如果芯片被設(shè)置成自動(dòng)模式(PIM2=0),則LED2及POA的輸出將在3分鐘后被清除,之后回到識(shí)別模式初始狀態(tài)。當(dāng)PIM2=0時(shí),如果連接8分鐘沒有語音輸入芯片,將自動(dòng)進(jìn)入省電模式。
5 應(yīng)注意的問題
(1)語音識(shí)別電路對(duì)外部麥克風(fēng)(MIC)的分貝值有一定的要求。使用經(jīng)驗(yàn)表明,本語音識(shí)別電路中選用56dB的麥克風(fēng)可達(dá)到最佳效果。
(2)語音識(shí)別前設(shè)置的匹配度是一個(gè)影響識(shí)別率高低的重要因素,在實(shí)驗(yàn)過程中需要根據(jù)使用環(huán)境、使用要求等情況多次實(shí)驗(yàn)才能確定最佳值。
(3)AP7003的工作電壓為2.4V~4.5V。對(duì)于3V的應(yīng)用系統(tǒng),可直接使用;如果您的應(yīng)用系統(tǒng)是5V工作電壓,建議通過一個(gè)二極管給AP7003供電,以保證系統(tǒng)長期穩(wěn)定可靠地工作,也有利于降低系統(tǒng)功耗。
表3(a)AP7003-02鍵盤模式
Mode Key NO. | 8Key(PIM1=0) | 12Key(PIM1=1) |
1 | Store Word Word Up Word Down Set R_Level 1 Set R_Level 2 Set R_Level 3 Clear Output Shut Down N.A. N.A. N.A. N.A. Store Word Clear Word | Store Word1 Store Word2 Store Word3 Store Word4 Store Word5 Store Word6 Store Word7 Store Word8 Set R_Level 1 Set R_Level 2 Clear Output Shut Down N.A. Clear Word |
表3(b)AP7003-02按鍵功能
鍵 名 | 功 能 說 明 |
Clear Word Store Word Store Word1~8 Word Up Word Down Set R_Level1~3 Clear Output Shut Down | 清除12個(gè)存儲(chǔ)體內(nèi)容,之后進(jìn)入存儲(chǔ)目標(biāo)詞1(Store SWord1)狀態(tài) 選擇當(dāng)前存儲(chǔ)體存儲(chǔ)錄入的語音 選擇12個(gè)存儲(chǔ)體中的一個(gè)以存儲(chǔ)錄入的語音 選擇后個(gè)存儲(chǔ)體以存儲(chǔ)錄入的語音;存儲(chǔ)體12的“后一個(gè)”是存儲(chǔ)體1 選擇前一個(gè)存儲(chǔ)體以存儲(chǔ)錄入的語音;存儲(chǔ)體1的“前一個(gè)”仍是存儲(chǔ)1 設(shè)置語音識(shí)別的匹配度,之后進(jìn)入語音識(shí)別初始狀態(tài) 清除POA1~POA12和LED2狀態(tài),之后進(jìn)入語音識(shí)別初始狀態(tài) 將芯片轉(zhuǎn)入省電模式 |
表3(c) AP7003-02鍵盤陣列
POB1 | POB2 | POB3 | POB4 | |
PIT1 | KEY1 | KEY2 | KEY3 | KEY4 |
PIT2 | KEY5 | KEY6 | KEY7 | KEY8 |
PIT3 | KEY9 | KEY10 | KEY11 | KEY12 |
應(yīng)用表明,AP7003使用簡(jiǎn)單方便,具有較高的識(shí)別率,一般可達(dá)80%以上,是一款較好的語音識(shí)別芯片。
評(píng)論