線性預測及其Matlab實現(xiàn)
線性預測分析是現(xiàn)代語音信號處理中最核心的技術之一,為現(xiàn)代語音信號處理的飛速發(fā)展立下了赫赫功勞,在語音分析、合成、編碼、識別等方面都有著廣泛的應用,至今仍是最有效的語音分析技術之一。如VoIP和H.323網(wǎng)上多媒體通信系統(tǒng)中所使用的G.729 CS-ACELP語音編碼算法就是一種以共軛代數(shù)碼本激勵線性預測為基礎的高質量的語音編碼標準。
1線性預測的基本原理
在語音信號處理中最常用的模型是全極點模型。線性預測所包含的基本概念是,通過使實際語音抽樣和線性預測抽樣之間差值的平方和達到最小值,即進行最小均方誤差的逼近,能夠決定惟一的一組預測器系數(shù)。如果一個隨機過程用一個p階全極點系統(tǒng)受白噪聲激勵產(chǎn)生的輸出來模擬,設這個系統(tǒng)的傳遞函數(shù)為:
其中:p是預測器階數(shù);G是聲道濾波器增益。由此,語音抽樣s(n)和激勵信號e(n)之間的關系可用下列差分方程來表示:
即語音樣點間有相關性,可以用過去的樣點值預測未來樣點值。對于濁音,激勵e(n)是以基音周期重復的單位沖激;對于清音e(n)是平穩(wěn)白噪聲。
在模型參數(shù)估計過程中,把如下系統(tǒng)稱為線性預測器:
式中:ai稱為線性預測系數(shù)。從而,p階線性預測器的系統(tǒng)函數(shù)具有如下形式:
在式(1)中的A(z)稱作逆濾波器,基傳輸函數(shù)為:
而線性預測方程可以按如下方法得到:把某一幀內的短時平均預測誤差定義為:
由此可計算出預測系數(shù)。
由于語音信號的短時平穩(wěn)性,要分幀處理(10~30 ms),對于一幀從n時刻開窗選取的N個樣點的語音段s(n),記為Φn(j,i):
2 G.729中線性預測分析的基本原理
用10階線性預測(LP)作短時分析,LP合成濾波器定義為:
評論