基于DSP的G.729語音編解碼算法的優(yōu)化和實(shí)現(xiàn)
隨著多媒體信息技術(shù)和網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,信息量快速增長,使信道資源顯得越來越寶貴。為了在有限的信道資源下傳輸盡可能多的信息,語音壓縮成為必要手段。ITU組織(國際電信聯(lián)盟)在l996年制定了G.729協(xié)議,即共軛結(jié)構(gòu)碼激勵(lì)線性預(yù)測(cè)編碼算法(CS-ACELP)。其編碼速率為8kb/s,可以滿足網(wǎng)絡(luò)通信的要求,具有良好的語音質(zhì)量,對(duì)不同的應(yīng)用環(huán)境有較強(qiáng)的適應(yīng)性,是一種性能較好的語音壓縮國際標(biāo)準(zhǔn),被廣泛應(yīng)用在個(gè)人移動(dòng)通信、衛(wèi)星通信等各個(gè)領(lǐng)域。
1 G.729編解碼算法的原理
語音信號(hào)的波形編碼力圖使重建語音波形保持原始語音信號(hào)的波形形狀。這類編碼器通常將語音信號(hào)作為一般的波形信號(hào)來處理,它具有適應(yīng)能力強(qiáng)、語音質(zhì)量好等優(yōu)點(diǎn),但所需用的編碼速率高。參數(shù)編碼通過對(duì)語音信號(hào)特征參數(shù)的提取及編碼來降低編碼速率,力圖使重建語音信號(hào)盡可能保持原語音的語意,而重建信號(hào)的波形同原語音信號(hào)的波形可能會(huì)有相當(dāng)大的差別。二十世紀(jì)70年代中期,特別是80年代以來,語音編碼技術(shù)有了突破性的進(jìn)展,提出了一些非常有效的處理方法,如混合編碼。這種算法克服了原有波形編碼器與聲碼器的弱點(diǎn),而結(jié)合了它們各自的長處,在4kb/s~16kb/s速率上能夠得到高質(zhì)量合成語音,而在本質(zhì)上也具有波形編碼的優(yōu)點(diǎn)。G.729所描述的CS-ACELP(Conjugate-Structure Al2gebraic-Coder-Excited Linear Prediction)聲碼器采用的CELP聲碼器就屬于這類編碼器。
2 算法優(yōu)化和DSP應(yīng)用改進(jìn)
2.1 算法的優(yōu)化改進(jìn)
首先在算法上進(jìn)行改進(jìn),如圖1所示,采用一種結(jié)合WD-LSP(Weighted Delta-LSP)[1]函數(shù)并結(jié)合次最優(yōu)部分碼本快速搜索的CS-ACELP語音編碼算法,同時(shí)采用基于聲學(xué)心理模型的知覺加權(quán)濾波器,使語音編碼在不降低語音質(zhì)量的情況下降低計(jì)算復(fù)雜度。WD-LSP函數(shù)主要用于區(qū)分UV-V(unvoice-voice)/S-V(silence-voice)的邊界。其原理是:如果函數(shù)值大于給定的極限值η,則開環(huán)基音延遲Top重新估計(jì),否則,開環(huán)基音延遲Top用前一幀自適應(yīng)碼本延遲來更新。在第i幀F(xiàn)i的WD-LSP函數(shù)和用于確定開環(huán)基音延遲Top的算法如下:
其中LSPi(k)是在第i幀中的k階LSP系數(shù);wk是加權(quán)系數(shù),它用于增強(qiáng)UV-V/S-V邊界的WD-LSP函數(shù)。為了獲取wk,一個(gè)包含23 014個(gè)UV-V邊界和9 519個(gè)S-V邊界的大型數(shù)據(jù)庫用于估計(jì)delta-LSP在UV-V/S-V邊界的平方根值(RMS)。因此,WD-LSP用于檢測(cè)VU-V/S-V邊界非常敏感。η是一個(gè)設(shè)為0.01的極限值。整個(gè)計(jì)算可節(jié)省21%的計(jì)算量,經(jīng)過這種算法前后語音信號(hào)如圖2所示。
L_32=hi_word16+lo_word1
Hi_word=L_32>>16
Lo_word=L_32-hi_word>>1
當(dāng)累加器中的數(shù)值超過一定范圍時(shí)將會(huì)產(chǎn)生溢出。在G.729算法標(biāo)準(zhǔn)中, 累加器的值被限定在80000000~7FFFFFFF之內(nèi)——即最小負(fù)數(shù)和最大正數(shù)。不過在TMS320C5416中,如果將PMST寄存器中的OVM置位,則溢出會(huì)得到自動(dòng)處理。
評(píng)論