圖像壓縮編碼和解碼原理
本節(jié)介紹圖像壓縮編碼的基本原理,圖像數(shù)據(jù)壓縮和解壓縮電路的基本結(jié)構(gòu)。它們是看影碟機(jī)電路圖的基礎(chǔ)知識(shí)。
一、圖像壓縮的基本途徑
圖像的數(shù)據(jù)量極大,必須對(duì)其數(shù)據(jù)總量大大壓縮,才能夠存儲(chǔ)在直徑12cm的光盤上。在實(shí)用技術(shù)上,可通過以下途徑來壓縮圖像數(shù)據(jù)的總量。
1、采用亮度(Y)、色度(C)取樣方式
實(shí)用彩色電視技術(shù)沒有傳輸、處理紅、藍(lán)、綠三基色信號(hào),而傳輸、處理亮度信號(hào)Y和色度信號(hào)C。這種處理方法有利于實(shí)現(xiàn)彩色電視和黑白電視的兼容,也利于限制彩色電視信號(hào)的頻帶寬度。在數(shù)字圖像處理技術(shù)中,仍然采用傳輸、處理亮度信號(hào)Y和色度信號(hào)C的方法。由于人眼晴對(duì)亮度信息敏感,對(duì)彩色信息不夠敏感,因而對(duì)Y信號(hào)以較高清晰度傳送,對(duì)C信號(hào)以較低清晰度傳送。實(shí)際作法是這樣的:對(duì)每個(gè)亮度Y像素都進(jìn)行傳送;而將色度C分解為U、V兩個(gè)色差信號(hào)(或?qū)憺镃b、Cr、B-Y、R-Y),分別進(jìn)行傳送;對(duì)亮度Y實(shí)行逐點(diǎn)取樣,而對(duì)色度C則取樣較少。即對(duì)應(yīng)于4個(gè)亮度取樣點(diǎn),僅對(duì)色度信號(hào)取樣1個(gè)點(diǎn),即對(duì)U、V像素的取樣較低,各取1個(gè)取樣點(diǎn),這種取樣格式稱為YUV411格式。
采用YUV411取樣格式后,它的數(shù)據(jù)總量將比三基色取樣量格式時(shí)減少一半。若采用三種基色取樣方式時(shí),各基色應(yīng)與亮度信號(hào)取樣方式一樣,即對(duì)每個(gè)紅、綠、藍(lán)色采取逐點(diǎn)取樣的方法。采用Y、C傳輸方式時(shí),取樣次數(shù)減少一半,傳輸數(shù)碼也減少一半。人眼睛對(duì)色度的敏感程度較低,利用人眼睛這一生理視覺特性,人們?cè)谥饔^感覺上并沒有感到圖像清晰度下降。顯然,這是壓縮圖像數(shù)據(jù)碼率的一個(gè)得力措施。
2、將整幅圖像分割為小區(qū)域進(jìn)行分割處理
對(duì)圖像進(jìn)行數(shù)據(jù)處理時(shí),對(duì)每幀圖像進(jìn)行分割處理。首先圖像橫向切成若干條,每一條稱為一片,將每一片再縱向切成若干塊,稱宏塊,宏塊是圖像壓縮的基本單位。每個(gè)宏塊的彩色圖像可用1個(gè)亮度信號(hào)Y和兩個(gè)色差信號(hào)Cb、Cr(即U、V)來表示,或者說,每個(gè)宏塊分為三層,一層亮度Y,兩層色度(各為Cb、Cr),統(tǒng)稱為一個(gè)宏塊。
由于人眼睛對(duì)亮度、色度的主觀敏感程度不同,通常把亮度宏塊再平均分成4塊,每一小塊稱為像塊或區(qū)塊,詳見示意圖2.2.1。每個(gè)區(qū)塊可以進(jìn)一步分割,稱為像素或像點(diǎn),像素是構(gòu)成圖像的最小單位。對(duì)于數(shù)字圖像來說,每一個(gè)像素作為一個(gè)取樣點(diǎn),有一個(gè)對(duì)應(yīng)的取樣數(shù)值??梢钥闯觯瑘D像分割越細(xì),像素?cái)?shù)越多,取樣點(diǎn)越多,圖像清晰度越高;反之,像素?cái)?shù)越少,圖像清晰度越低。實(shí)際上,對(duì)圖像壓縮處理,就是對(duì)圖像區(qū)塊的數(shù)據(jù)、像素的數(shù)據(jù)進(jìn)行壓縮處理。
彩電制式不同,分割圖像的具體數(shù)據(jù)將有所變化。例如PAL制,大多數(shù)為625行掃描標(biāo)準(zhǔn),那么每幀圖像被切為18片,每片再切成22個(gè)宏塊,即每幀圖像分成396個(gè)宏塊;而525行的NTSC制,每幀圖像被切為15片,每片再切成22個(gè)宏塊,即每幀圖像分成330個(gè)宏塊。對(duì)亮度信號(hào)來說,每個(gè)宏塊又分為4個(gè)區(qū)塊,每個(gè)區(qū)塊含有8×8=64個(gè)像素,則每個(gè)宏塊含有256個(gè)像素。但對(duì)兩個(gè)色差信號(hào)來說,宏塊像素?cái)?shù)等于區(qū)塊像素?cái)?shù),即像素?cái)?shù)是8×8=64個(gè),是亮度像素的1/4。盡管兩色差信號(hào)的像素較少,清晰度低,但不影響人眼睛的主觀感覺。在進(jìn)行數(shù)字圖像處理時(shí),按照?qǐng)D中各個(gè)8×8方塊( 共64塊) 編成次序,再按照編號(hào)順序依次處理。也就是說,以8×8像素的方塊作基本操作單元,依次處理每個(gè)像素(即取樣點(diǎn))的取樣數(shù)值。
3、采用幀間和幀內(nèi)數(shù)據(jù)壓縮技術(shù)。
實(shí)用電視每秒鐘傳送25-30幀畫面,使畫面變化具有連續(xù)感,電視活動(dòng)圖像是由各幀畫面差別很小的一系列畫面組成的。各幀畫面的微小變化主要表現(xiàn)于畫面主體部分,畫面的背景差別很小。圖像是由亮度、色度信息來描述的,在各相鄰幀圖像內(nèi),若分別比較同一相對(duì)位置的亮度、色度信號(hào),通常其差別較小。經(jīng)大量統(tǒng)計(jì)發(fā)現(xiàn),在各個(gè)像素當(dāng)中僅有10%以下的像素點(diǎn)的亮度差值變化超過去時(shí)2%,而色度差值變化在0.1%以下。在各幀圖像中具有大量重復(fù)內(nèi)容,這些重復(fù)內(nèi)容的數(shù)據(jù)屬于多余(冗余)信息,于是,可以通過減少時(shí)域冗余信息的方法,即運(yùn)作幀間數(shù)據(jù)壓縮技術(shù),來減少圖像傳輸?shù)臄?shù)碼率。
經(jīng)分析發(fā)現(xiàn),在同一幀畫面內(nèi)也存在相當(dāng)多的冗余信息。對(duì)圖像主體部分和眼睛最敏感的部分,應(yīng)當(dāng)準(zhǔn)確、詳細(xì)地處理,需要對(duì)每個(gè)像素點(diǎn)進(jìn)行精細(xì)傳輸;但對(duì)于圖像非主體部分和眼睛不敏感的部分,則可以進(jìn)行粗略地處理,即進(jìn)行信息數(shù)據(jù)的壓縮處理。于是,可以根據(jù)一幀圖像內(nèi)容的具體分布情況,對(duì)不同位置可采用不同的數(shù)據(jù)量來傳送,減少傳送圖像的數(shù)據(jù)量,使圖像數(shù)據(jù)得到壓縮。這種壓縮數(shù)據(jù)的方法,是在同一幀圖像的不同空間部位進(jìn)行數(shù)據(jù)壓縮,稱為空間域冗余壓縮。例如,有一幅人像畫面,其面部和頭部的線條清晰度可以不相同,尤其是眼睛、嘴唇部位表情豐富,線條比較精細(xì)復(fù)雜,是觀眾最注意的部位,應(yīng)當(dāng)用高清晰度傳送;而頭頂部位和面頰側(cè)面,輪廓變化較少,灰度層次變化較小,觀眾不太注意這些部位。顯然,圖像的主要部位,灰度層次變化較大的部位,人眼睛敏感的部位,應(yīng)當(dāng)以較大數(shù)據(jù)量進(jìn)行精細(xì)傳送;而那些圖像的次要部位,灰度層次變化較小的部位,人眼睛不注意的部位,則可用較少數(shù)據(jù)量進(jìn)行粗略傳送,甚至于僅僅傳送它們的平均亮度信息。
以下具體討論數(shù)字圖像的數(shù)據(jù)壓縮原理。先討論靜止圖像的數(shù)據(jù)壓縮技術(shù),即幀內(nèi)數(shù)據(jù)壓縮技術(shù);然后討論活動(dòng)圖像的數(shù)據(jù)壓縮技術(shù),即幀間數(shù)據(jù)壓縮技術(shù)。
二、幀內(nèi)數(shù)據(jù)壓縮技術(shù)
首先對(duì)整幅圖像進(jìn)行分割處理,經(jīng)分割取得最小操作單元。下面按8×8=64個(gè)像素組成的區(qū)塊來計(jì)論。每一個(gè)像素值都可以按一定規(guī)律取樣,例如可對(duì)亮度各個(gè)像素的亮度值取樣,若每個(gè)像素按8bit量化,則每個(gè)區(qū)塊的總數(shù)據(jù)量為8bit×64(像素點(diǎn)),即512bit??梢姡瑢?duì)全畫面各像素量化處理后數(shù)據(jù)量十分龐大,需要進(jìn)行數(shù)據(jù)壓縮。通常,經(jīng)過離散余弦變換,Z字型掃描,可變長(zhǎng)度編碼等處理過程,可將數(shù)據(jù)總量進(jìn)行大量壓縮。
1、離散余弦變換(DCT)編碼
(1) 功能簡(jiǎn)述
離散余弦變換簡(jiǎn)稱為DCT(是英Discrete Cosine Transform的縮寫詞),是一種數(shù)字處理方法,經(jīng)常用于數(shù)據(jù)處理。DCT是多種數(shù)字變換方法的一種,它是把空間域圖像變換到頻率域進(jìn)行分析的方法。由于DCT的變換核構(gòu)成的基向量與圖像內(nèi)容無關(guān),而且變換核是可以分離的,既二維DCT可以用兩次一維DCT來完成,使得數(shù)學(xué)運(yùn)算難度大大簡(jiǎn)化,再配以已經(jīng)發(fā)現(xiàn)的其它快速算法,使得DCT編碼得到了廣泛的應(yīng)用。將DCT應(yīng)用于圖像數(shù)據(jù)壓縮,可以減少代表圖像亮度(或色度)層次數(shù)碼信息,達(dá)到數(shù)據(jù)壓縮的目的。利用DCT不僅可將圖像編碼,還可以在編碼變換過程發(fā)現(xiàn)圖像細(xì)節(jié)的位置,以便刪去或略去對(duì)視覺不敏感的部分,而更加突出視覺的敏感部分,通過選擇主要數(shù)據(jù)來傳輸、重視圖像。
利用DCT壓縮圖像數(shù)據(jù),主要是根據(jù)圖像信號(hào)在頻率域的統(tǒng)計(jì)特性。在空間域看來,圖像內(nèi)容千差萬別;但在頻率域上,經(jīng)過對(duì)大量圖像的統(tǒng)計(jì)分析發(fā)現(xiàn),圖像經(jīng)過DCT變換后,其頻率系數(shù)的主要成分集中于比較小的范圍,且主要位于低頻部分。利用DCT變換揭示出這種規(guī)律后,可以再采取一些措施把頻譜中能量較小的部分舍棄,盡量保留傳輸頻譜中主要的頻率分量,就能夠達(dá)到圖像數(shù)據(jù)壓縮目的。
(2)規(guī)律和特點(diǎn)
①時(shí)間域信號(hào)的頻譜
對(duì)于一個(gè)隨時(shí)間變化的波形來說,它是隨時(shí)間變化的周期信號(hào),它是以一定幅度值為波形的直流平均值,其波形可看成是基波與無數(shù)次諧波疊加而成。其基波振幅最大,然后各次諧波振幅逐漸減小。各次諧波疊加次數(shù)越高,則合成波形越接近于理想矩形波。此分析方法就是應(yīng)用日益廣泛的頻譜分析方法。其中各次正弦波諧波的振幅值經(jīng)常稱為頻譜系數(shù),將頻譜系數(shù)排列起來,可以組成一個(gè)系數(shù)列。上述事實(shí)說明,周期性矩形波可以由時(shí)間域 (反映幅度-時(shí)間關(guān)系)來描述,也可以由頻率域(幅度-頻率關(guān)系)來描述。兩者有互相對(duì)應(yīng)的關(guān)系。實(shí)際上,各種時(shí)間域信號(hào)都可以由頻率域的規(guī)律來描述,兩種描述方法存在內(nèi)在的聯(lián)系,可以互相轉(zhuǎn)換。
②空間域信號(hào)的頻譜系數(shù)
對(duì)于各種空間域分布的信號(hào),也可以進(jìn)行類似的頻率變換,即將空間域信號(hào)轉(zhuǎn)變?yōu)轭l率域信號(hào)。DCT就是其中一種頻率分析方法??蓞㈤唸D2.2.2來說明DCT變換過程。
由圖像內(nèi)取出一個(gè)區(qū)塊,分成8×8個(gè)像素的64格陣列,即由圖(a)轉(zhuǎn)變?yōu)閳D(b)。經(jīng)過對(duì)逐個(gè)像素的亮度(或討論色度)數(shù)值取樣,并將像素的亮度數(shù)值列成矩陣形表格,見圖(C)。然后利用離散余弦變換(DCT)可將各空間取樣值轉(zhuǎn)變
評(píng)論