新聞中心

EEPW首頁(yè) > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 基于DSP嵌入式說話人識(shí)別系統(tǒng)的設(shè)計(jì)

基于DSP嵌入式說話人識(shí)別系統(tǒng)的設(shè)計(jì)

作者: 時(shí)間:2012-03-21 來源:網(wǎng)絡(luò) 收藏

0 引 言

本文引用地址:http://www.butianyuan.cn/article/257627.htm

說話人身份識(shí)別屬于生物認(rèn)證技術(shù)的一種,是一項(xiàng)根據(jù)語音中反映說話人生理和行為特征的語音參數(shù)來自動(dòng)識(shí)別說話人身份的技術(shù)。近年來,說話人身份識(shí)別以其獨(dú)特的方便性、經(jīng)濟(jì)性和準(zhǔn)確性等優(yōu)勢(shì)受到矚目,在信息安全等領(lǐng)域的應(yīng)用逐漸增大,并成為人們?nèi)粘I詈凸ぷ髦兄匾移占暗陌踩?yàn)證方式。目前,說話人身份識(shí)別在理論上和實(shí)驗(yàn)室條件下已經(jīng)達(dá)到了比較高的識(shí)別精度,并開始走向?qū)嶋H應(yīng)用階段。ATT、歐洲電信聯(lián)盟、ITT、Keyware、T-NETIX,Motorola和Vi-sa等公司相繼開展了相關(guān)實(shí)用化研究,國(guó)內(nèi)這方面研究主要在中科聲學(xué)所,中科院自動(dòng)化所,清華大學(xué)等研究所和大學(xué)中進(jìn)行。

基于的說話人身份具有高精度,適時(shí)性好,低功耗,低費(fèi)用,體積小等優(yōu)勢(shì),逐漸成為說話人身份識(shí)別面向?qū)嶋H應(yīng)用的新熱點(diǎn)。而隨著新技術(shù)的發(fā)展,芯片無論在處理速度、精度、功耗或者體積等方面都取得了突破性的進(jìn)展。也越來越多的應(yīng)用于說話人身份識(shí)別。但目前這方面研究主要局限于小數(shù)據(jù)量、與PC機(jī)配套使用上,沒有太大的實(shí)用價(jià)值。在此介紹一種基于TMS320C6713 DSP芯片設(shè)計(jì)的,10個(gè)人范圍的說話人身份。該系統(tǒng)可以自舉運(yùn)行,并可靈活的選擇訓(xùn)練、識(shí)別或者更換訓(xùn)練者、識(shí)別者,識(shí)別率達(dá)98%以上。

1 系統(tǒng)的架構(gòu)及硬件構(gòu)成

系統(tǒng)總體實(shí)現(xiàn)流程如圖1所示。系統(tǒng)主要分為訓(xùn)練和識(shí)別兩部分,系統(tǒng)初始化后由操作者控制訓(xùn)練或識(shí)別。訓(xùn)練目的是提取說話人模型參數(shù)并將其存儲(chǔ)在FLASH ROM中。識(shí)別目的是讀取待識(shí)別者語音信息并將獲得的模型參數(shù)與訓(xùn)練的模型參數(shù)比較,從而獲得識(shí)別結(jié)果。

1.1 系統(tǒng)的主要硬件構(gòu)成

系統(tǒng)硬件構(gòu)成如圖2所示,主要包含語音采集模塊、數(shù)據(jù)處理模塊(DSP)、程序數(shù)據(jù)存儲(chǔ)及自舉FLASH模塊、數(shù)據(jù)存儲(chǔ)器RAM模塊、系統(tǒng)時(shí)序邏輯控制CPLD模塊、JTAG接口模塊。

語音采集模塊主要由TLV320AIC23音頻編解碼器來完成,該芯片是TI公司的一款高性能的立體聲音頻Codec芯片,內(nèi)置放大器,輸入/輸出增益可編程設(shè)置。模數(shù),數(shù)/模轉(zhuǎn)換集成在一塊芯片中。采樣率8~96 kHz可編程實(shí)現(xiàn)。另外還具有低功耗,連接電路簡(jiǎn)單,性價(jià)比高的特點(diǎn)。

語音處理DSP采用TI公司的TMS320C6713芯片,該芯片實(shí)現(xiàn)浮點(diǎn)運(yùn)算,最高時(shí)鐘頻率225 MHz,使用該芯片外部存儲(chǔ)器接口可實(shí)現(xiàn)對(duì)外部存儲(chǔ)器(SDRAM)數(shù)據(jù)傳輸和程序存儲(chǔ)器(FLASH ROM)進(jìn)行程序讀寫;依靠JTAG接口電路通過仿真器進(jìn)行仿真調(diào)試,實(shí)現(xiàn)與主機(jī)數(shù)據(jù)交換;通過片內(nèi)外設(shè)McBSP完成串行數(shù)據(jù)的接收和發(fā)送,實(shí)現(xiàn)對(duì)音頻處理模塊的控制等工作。

FLASH ROM最大可提供512 KB空間,通常為前256 KB可用。SDRAM最大容量為16 MB,為該系統(tǒng)提供較大的數(shù)據(jù)存儲(chǔ)空間。CPLD為存儲(chǔ)器的擴(kuò)展實(shí)現(xiàn)邏輯編碼。電源為TPS54310芯片,可為系統(tǒng)提供3.3 V和1.26 V兩種電壓。

linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)

上一頁(yè) 1 2 3 4 5 下一頁(yè)

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉