嵌入式語音識別處理ISD-SR3000的特性及應用
摘要:ISD-SR3000是Winbond公司推出的新型嵌入式語音識別處理器,它由語音識別引擎、語音壓縮引擎和錄間功能組成。并帶有最優(yōu)指令系統(tǒng)為核心的PISC/PSP、靈活的CODEC接口和串行主控制器接口,文中介紹了ISD-SR3000的特點、引腳排列和功能。給出了一個用SR3000組成的語音識別系統(tǒng)電路。
本文引用地址:http://butianyuan.cn/article/241597.htm關(guān)鍵詞:語音識別 微處理器 CODEC SR3000
1 概述
ISD-SR3000是Winbond公司推出的新型嵌入式語音識別處理器,它由語音識別引擎、語音壓縮引擎和錄音功能部分組成。芯片內(nèi)包含一個以最優(yōu)指令系統(tǒng)為核心的并行PISC/DSP、靈活的CODEC接口和一個串行主控制器接口。
ISD-SR3000中的語音識別引擎使用成熟的Hidden Markov模型(HMMS),因而能夠識別連續(xù)的語音信號,并可與數(shù)字信號相連。同時可以由用戶選擇單語音用戶命令、連接數(shù)字信號命令和定義說話者命令。
定義說話者命令允許用戶分類和辨識聲音標簽。聲音標簽可作為用戶命令進行姓名目錄管理。單用戶命令、語音提示符和被定義的說話者的聲音標簽可儲存在外部存儲器中。
該芯片可支持單語音用戶連續(xù)輸入語音,并支持用戶定義的語音標簽,還可為特性抽取實時音質(zhì)模型查找提供最優(yōu)化的識別引擎。該芯片提供有μ律、A律或線形CODEC接口以及到主控制器的串行接口。在3.3~5V供電時,其語音識別的電流為40mA,而在低功耗模式時僅為12mA。SR3000語音識別處理器可廣泛應用在可存儲的儀器儀表、自動化控制系統(tǒng)、無線電話、蜂窩電話、家庭網(wǎng)絡、英特網(wǎng)設備等系統(tǒng)。
2 ISD-SR3000的引腳功能
ISD-SR3000采用100引腳QFP封裝,其引腳分布如圖1所示,各引腳功能如表1所列。
表1 ISD-SR3000引腳信號排列說明
引腳名稱 | 信號名稱 | 信號類型 | 說 明 |
A(0:15) | A(0:16) | 輸出 | 0到16的地址位 |
CCLK | CCLK | 輸入/輸出 | CODEC主從時鐘接口 |
BMCS | BMCS | 輸出 | 基存儲器芯片選擇 |
BMCS/ENV1 | BMCS | 輸入/輸出 | 基存儲器芯片選擇或環(huán)境選擇 |
CDIN | CDIN | 輸入 | 從CODEC數(shù)據(jù)輸入 |
CDOUT | CDOUT | 輸出 | 從CODEC數(shù)據(jù)輸出 |
CFS0 | CFS0 | 輸入/輸出 | CODEC0幀同步 |
CFS1 | CFS1 | 輸出 | CODEC1幀同步 |
D(0:7) | D(0:7) | 輸入/輸出 | 0到7的數(shù)據(jù)位 |
EMCS/ENV0 | EMCS | 輸出 | 擴充存儲器芯片選擇 |
EMCS/ENV0 | ENV0 | 輸入 | 環(huán)境選擇 |
MWCLK | MWCLK | 輸入 | 與微處理器連接的時鐘 |
MWCS | MWCS | 輸入 | 與微處理器連接的芯片選擇 |
MWDIN | MWDIN | 輸入 | 與微處理器連接的數(shù)據(jù)輸入 |
MWDOUT | MWDOUT | 輸出 | 與微處理器連接的數(shù)據(jù)輸出 |
MWRDY | MWRDY | 輸出 | 微處理器準備信號 |
MWRQST | MWRQST | 輸出 | 微處理器請求信號 |
RESET | RESET | 輸入 | 復位 |
TST | TST | 輸入 | 測試腳 |
Vcc | Vcc | 電源 | 3.3V電源引腳 |
VccA | VccA | 電源 | 3.3V模擬電源引腳 |
VccHI | VccHI | 電源 | 5V電源引腳 |
Vss | Vss | 電源 | 片內(nèi)邏輯和輸出驅(qū)動器地 |
VssA | VssA | 電源 | 片內(nèi)模擬電路地 |
X1 | X1 | 振蕩器 | 晶振接口 |
X2/CLKIN | X2 | 振蕩器 | 晶振接口 |
3 基于SR3000的語音識別系統(tǒng)
由ISD-SR3000構(gòu)成的語音識別系統(tǒng)由電路如圖2所示。以下分別介紹電路中各部分的功能。
3.1 復位
RESET端為芯片復位端。加電時RESET必須保持在低電平,時間至少應持續(xù)30ms。TST端必須利用上拉電阻以便其處于高電平狀態(tài)。MWRDY端的值在復位期間沒有定義。但在復位100ms后,微處理器將首先等待這個信號或者在這期間此信號被拉高。
在復位時,電路將對ENV0和ENV1的輸入端進行采樣以決定操作環(huán)境。而EMCS/ENV0和BMCS/ENV1端則在復位時用來決定ENV0和ENV1輸入信號。利用芯片內(nèi)的上拉電阻可將ENV0和ENV1置1。而利用一個連接于Vss端上的5.1kΩ的外接電阻則可對ENV0和ENV1置0。
3.2 時鐘
SR3000內(nèi)含片內(nèi)振蕩器,但應用時也可通過X1和X2/CLKIN端的外接晶振或外部時鐘源來產(chǎn)生時鐘信號。外部時鐘源信號應通過X2/CLKIN端輸入。要注意的是,外部時鐘源電平與CLKIN的輸入電平要相符(3.3V或5V)。
3.3 電源
ISD-SR3000可工作在3.3V±10%和5V±10%兩種電壓,不同電壓的接線方式不同。圖3是采用3.3V電源時的接線圖,圖4為采用5V電源時的接線圖。
ISD-SR3000具有低功耗模式,在低功耗模式時的電流消耗僅12mA,此時芯片中的一些功能模塊處于未激活狀態(tài),因而不能進行語音識別。低功耗模式時的引腳CS0和CS1必須置1,這時,MWCLK、MWDIN信號將保持在Vss+0.5V,而RESET、MWCS信號則將保持在Vcc-0.5V。
表2 ISD-SR3000擴展地址線接口信號
信號名稱 | 類 型 | 信號單元 | 說 明 |
D[7:0] | 輸入/輸出 | ISD-SR3000 | 數(shù)據(jù)總線 |
A[7:1] | 輸入 | ISD-SR3000 | 地址總線 |
IOCS | 輸入 | ISD-SR3000 | I/O擴展芯片選擇,訪問I/O寄存器 |
EMCS | 輸入 | ISD-SR3000 | 擴展存儲器選擇 |
DDIN/A16 | 輸入 | ISD-SR3000 | I/O操作方向或16位地址總線 |
A15 | 輸入 | ISD-SR3000 | 地址線 |
WR[0:1] | 輸入 | ISD-SR3000 | 外部存儲器的寫信號 |
AF[4:0] | 輸出 | 到外部擴展存儲器 | 擴展地址總線 |
CEFN | 輸出 | 到外部擴展存儲器 | 外存片遷,用于Flash片選 |
CREN | 輸出 | 到外部擴展存儲器 | 外存片選,用于ROM片選 |
CSEN | 輸出 | 到外部擴展存儲器 | 外存片選,用于RAM片選 |
EMWR | 輸出 | 到外部擴展存儲器 | 外部SRAM寫信號 |
CSINTROM | 輸出 | 到內(nèi)部的ROM | 內(nèi)部ROM片選 |
表2 SR3000支持的典型的CODEC器件
生產(chǎn)商 | CODEC設備名稱 | 特 征 | 工作電壓 | 轉(zhuǎn)換類型 |
National Semiconductor | TP3054 | 單CODEC | 5V | μ律 |
OKI | MSM7533V | 雙CODEC | 5V | μ律,A律 |
Macronix | MX93002FC | 雙CODEC | 5V | μ律 |
Lucent | T7503 | 雙CODEC | 5V | μ律 |
Motorola | MC145481 | 單CODEC | 3V | μ律 |
3.4 存儲器接口
ISD-SR3000利用擴展的Flash(閃存)和RO來存儲聲音標簽、詞匯、提示符和音質(zhì)模型。建議選用16M以上存儲容量的擴展Flash存儲器,如Am29LA160D等。外接64kB的SRAM可實現(xiàn)HMM算法。表2給出了擴展地址線的接口信號。
ISD-SR3000可為模擬和數(shù)字電話提供一個支持主和從CODEC接口模式的CODEC接口,該接口具有8位和16位的信道寬度,能支持可變和固定格式的通信協(xié)議。在主模式下,可利用SR3000來控制CODEC的運行以滿足模擬電話和獨立標準的應用;在從模式下,CODEC接口由外接信號控制,此模式可用于數(shù)字電話,如ISDN或DECT線等。CODEC接口使用的5個信號分別為CDIN、CODUT、CCLK、CFS0和CSF1。其中CDIN、CDOUT、CCLK和CFS0被連接到第一個CODEC。CDIN、CDOUT、CCLK和CFS1被連接到第二個CODEC接口。數(shù)據(jù)通過CDOUT輸出端傳送給CODEC接口,并通過CDIN輸入端從CODEC讀出。CCLK和CFS0端在主模式下為輸出狀態(tài),而在從模式下為輸入狀態(tài)。CFS1是一個輸出端。SR3000支持的典型CODEC器件見表3所列。
linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)
評論