基于DSP的G.729語音編解碼算法的優(yōu)化和實現(xiàn)
2.3 內(nèi)聯(lián)指令的應(yīng)用和C程序中嵌入?yún)R編語句
由于語音編碼的特點,編解碼函數(shù)都是由一些基本的加減乘除簡單函數(shù)組織而成,這些函數(shù)定義在BASIC OP.C和OPER_32B.C兩個文件中,如果能夠?qū)@些簡單函數(shù)進行內(nèi)聯(lián)指令(intrinsic)的優(yōu)化,就能達到事半功倍的效果。內(nèi)聯(lián)指令是匯編指令的直接映射,具有很高的效率。例如:
#define muh_ r(varl,var2) _mpylir(varl,var2)
#define L_ add(L_var1,L_var2) _sadd(L_var1,L_var2)
#define L_ muh(var1,var2) _smpy(var1,var2)
(1)不要破壞C環(huán)境,因為C編譯器并不檢查和分析嵌入的匯編語句。
(2)匯編語句不要改變C程序中變量的值,不要在匯編語句中加入?yún)R編器而改變匯編環(huán)境。
在簡化算法的基礎(chǔ)上,使用CCS提供的C優(yōu)化器進行C語言優(yōu)化,同時還使用內(nèi)聯(lián)函數(shù)和匯編優(yōu)化。
3 G.729在TMS320C5416上的實現(xiàn)
3.1 TMS320C5416的體系結(jié)構(gòu)和應(yīng)用
TMS320C5416(以下簡稱C5416)是TI公司最近推出的一款高性價比的通用l6位定點DSP芯片,它的內(nèi)核CPU基本組成與TMS320C54X系列一樣。C5416的單指令周期為6.25 RS,每秒執(zhí)行的指令數(shù)為160×106,指令系統(tǒng)豐富并具有很多多功能指令,使用了6級指令流水線結(jié)構(gòu),這些都很適合實現(xiàn)低時延的G.729聲碼器。采用一個40bit ALU、128K×16bit片內(nèi)RAM(包括64KB的片內(nèi)DARAM和64KB的片內(nèi)SARAM)、3個獨立的l6bit數(shù)據(jù)內(nèi)存總線、1個程序內(nèi)存總線、3個MCBSP、6信道DMA控制器、1個8/l6位并行增強主機端口接口及2個l6bit計時器。
在TMS320C5416中通過PCM3002進行語音信號的A/D和D/A轉(zhuǎn)換,PCM3002使用兩個串行通道,一個用于控制內(nèi)部寄存器,另外一個用于數(shù)據(jù)傳輸。在系統(tǒng)板TMS320C5416中默認的語音信號的抽樣率是48kHz,通過修改PCM3002的內(nèi)部控制寄存器,設(shè)定PCM3002信號的抽樣率。為了滿足G.729編碼的要求,PCM3002信號的抽樣率為8 000Hz。為了充分利用DSP進行信號處理,通過使用MCBSP和DMA把抽樣的數(shù)據(jù)送入DMA的緩沖區(qū)中,當(dāng)緩沖區(qū)滿時產(chǎn)生一次中斷,DSP把DMA的緩沖區(qū)中的數(shù)據(jù)讀入DSP中進行處理,然后把處理過的數(shù)據(jù)送入DMA發(fā)送緩沖區(qū)。
3.2 G.729在TMS320C5416的實現(xiàn)
系統(tǒng)運行主要分為四個過程:語音存儲,數(shù)據(jù)編碼壓縮,數(shù)據(jù)解壓縮,語音回放。將輸入的語音數(shù)據(jù)首先進行抗疊濾波,然后進行模數(shù)轉(zhuǎn)換,經(jīng)DSP采集并存入RAM存儲器中,即是語音存儲過程;接著運行編碼程序,將前面存儲的信息進行壓縮并存儲,這是編碼過程;然后進行解碼,并將數(shù)據(jù)存回原來的位置;最后DSP執(zhí)行輸出指令,將解碼后的數(shù)據(jù)送到數(shù)模轉(zhuǎn)換器中,實現(xiàn)模擬輸出。
評論