圖像壓縮編碼和解碼原理知識介紹
本文引用地址:http://butianyuan.cn/article/165863.htm 本節(jié)介紹圖像壓縮編碼的基本原理,圖像數(shù)據(jù)壓縮和解壓縮電路的基本結構。它們是看影碟機電路圖的基礎知識。 一、圖像壓縮的基本途徑 1、采用亮度(Y)、色度(C)取樣方式 2、將整幅圖像分割為小區(qū)域進行分割處理 彩電制式不同,分割圖像的具體數(shù)據(jù)將有所變化。例如PAL制,大多數(shù)為625行掃描標準,那么每幀圖像被切為18片,每片再切成22個宏塊,即每幀圖像分成396個宏塊;而525行的NTSC制,每幀圖像被切為15片,每片再切成22個宏塊,即每幀圖像分成330個宏塊。對亮度信號來說,每個宏塊又分為4個區(qū)塊,每個區(qū)塊含有8×8=64個像素,則每個宏塊含有256個像素。但對兩個色差信號來說,宏塊像素數(shù)等于區(qū)塊像素數(shù),即像素數(shù)是8×8=64個,是亮度像素的1/4。盡管兩色差信號的像素較少,清晰度低,但不影響人眼睛的主觀感覺。在進行數(shù)字圖像處理時,按照圖中各個8×8方塊( 共64塊) 編成次序,再按照編號順序依次處理。也就是說,以8×8像素的方塊作基本操作單元,依次處理每個像素(即取樣點)的取樣數(shù)值。
圖像的數(shù)據(jù)量極大,必須對其數(shù)據(jù)總量大大壓縮,才能夠存儲在直徑12cm的光盤上。在實用技術上,可通過以下途徑來壓縮圖像數(shù)據(jù)的總量。
實用彩色電視技術沒有傳輸、處理紅、藍、綠三基色信號,而傳輸、處理亮度信號Y和色度信號C。這種處理方法有利于實現(xiàn)彩色電視和黑白電視的兼容,也利于限制彩色電視信號的頻帶寬度。在數(shù)字圖像處理技術中,仍然采用傳輸、處理亮度信號Y和色度信號C的方法。由于人眼晴對亮度信息敏感,對彩色信息不夠敏感,因而對Y信號以較高清晰度傳送,對C信號以較低清晰度傳送。實際作法是這樣的:對每個亮度Y像素都進行傳送;而將色度C分解為U、V兩個色差信號(或寫為Cb、Cr、B-Y、R-Y),分別進行傳送;對亮度Y實行逐點取樣,而對色度C則取樣較少。即對應于4個亮度取樣點,僅對色度信號取樣1個點,即對U、V像素的取樣較低,各取1個取樣點,這種取樣格式稱為YUV411格式。
采用YUV411取樣格式后,它的數(shù)據(jù)總量將比三基色取樣量格式時減少一半。若采用三種基色取樣方式時,各基色應與亮度信號取樣方式一樣,即對每個紅、綠、藍色采取逐點取樣的方法。采用Y、C傳輸方式時,取樣次數(shù)減少一半,傳輸數(shù)碼也減少一半。人眼睛對色度的敏感程度較低,利用人眼睛這一生理視覺特性,人們在主觀感覺上并沒有感到圖像清晰度下降。顯然,這是壓縮圖像數(shù)據(jù)碼率的一個得力措施。
對圖像進行數(shù)據(jù)處理時,對每幀圖像進行分割處理。首先圖像橫向切成若干條,每一條稱為一片,將每一片再縱向切成若干塊,稱宏塊,宏塊是圖像壓縮的基本單位。每個宏塊的彩色圖像可用1個亮度信號Y和兩個色差信號Cb、Cr(即U、V)來表示,或者說,每個宏塊分為三層,一層亮度Y,兩層色度(各為Cb、Cr),統(tǒng)稱為一個宏塊。
由于人眼睛對亮度、色度的主觀敏感程度不同,通常把亮度宏塊再平均分成4塊,每一小塊稱為像塊或區(qū)塊,詳見示意圖2.2.1。每個區(qū)塊可以進一步分割,稱為像素或像點,像素是構成圖像的最小單位。對于數(shù)字圖像來說,每一個像素作為一個取樣點,有一個對應的取樣數(shù)值。可以看出,圖像分割越細,像素數(shù)越多,取樣點越多,圖像清晰度越高;反之,像素數(shù)越少,圖像清晰度越低。實際上,對圖像壓縮處理,就是對圖像區(qū)塊的數(shù)據(jù)、像素的數(shù)據(jù)進行壓縮處理。
3、采用幀間和幀內數(shù)據(jù)壓縮技術。
實用電視每秒鐘傳送25-30幀畫面,使畫面變化具有連續(xù)感,電視活動圖像是由各幀畫面差別很小的一系列畫面組成的。各幀畫面的微小變化主要表現(xiàn)于畫面主體部分,畫面的背景差別很小。圖像是由亮度、色度信息來描述的,在各相鄰幀圖像內,若分別比較同一相對位置的亮度、色度信號,通常其差別較小。經大量統(tǒng)計發(fā)現(xiàn),在各個像素當中僅有10%以下的像素點的亮度差值變化超過去時2%,而色度差值變化在0.1%以下。在各幀圖像中具有大量重復內容,這些重復內容的數(shù)據(jù)屬于多余(冗余)信息,于是,可以通過減少時域冗余信息的方法,即運作幀間數(shù)據(jù)壓縮技術,來減少圖像傳輸?shù)臄?shù)碼率。
經分析發(fā)現(xiàn),在同一幀畫面內也存在相當多的冗余信息。對圖像主體部分和眼睛最敏感的部分,應當準確、詳細地處理,需要對每個像素點進行精細傳輸;但對于圖像非主體部分和眼睛不敏感的部分,則可以進行粗略地處理,即進行信息數(shù)據(jù)的壓縮處理。于是,可以根據(jù)一幀圖像內容的具體分布情況,對不同位置可采用不同的數(shù)據(jù)量來傳送,減少傳送圖像的數(shù)據(jù)量,使圖像數(shù)據(jù)得到壓縮。這種壓縮數(shù)據(jù)的方法,是在同一幀圖像的不同空間部位進行數(shù)據(jù)壓縮,稱為空間域冗余壓縮。例如,有一幅人像畫面,其面部和頭部的線條清晰度可以不相同,尤其是眼睛、嘴唇部位表情豐富,線條比較精細復雜,是觀眾最注意的部位,應當用高清晰度傳送;而頭頂部位和面頰側面,輪廓變化較少,灰度層次變化較小,觀眾不太注意這些部位。顯然,圖像的主要部位,灰度層次變化較大的部位,人眼睛敏感的部位,應當以較大數(shù)據(jù)量進行精細傳送;而那些圖像的次要部位,灰度層次變化較小的部位,人眼睛不注意的部位,則可用較少數(shù)據(jù)量進行粗略傳送,甚至于僅僅傳送它們的平均亮度信息。
以下具體討論數(shù)字圖像的數(shù)據(jù)壓縮原理。先討論靜止圖像的數(shù)據(jù)壓縮技術,即幀內數(shù)據(jù)壓縮技術;然后討論活動圖像的數(shù)據(jù)壓縮技術,即幀間數(shù)據(jù)壓縮技術。
二、幀內數(shù)據(jù)壓縮技術
首先對整幅圖像進行分割處理,經分割取得最小操作單元。下面按8×8=64個像素組成的區(qū)塊來計論。每一個像素值都可以按一定規(guī)律取樣,例如可對亮度各個像素的亮度值取樣,若每個像素按8bit量化,則每個區(qū)塊的總數(shù)據(jù)量為8bit×64(像素點),即512bit??梢姡瑢θ嬅娓飨袼亓炕幚砗髷?shù)據(jù)量十分龐大,需要進行數(shù)據(jù)壓縮。通常,經過離散余弦變換,Z字型掃描,可變長度編碼等處理過程,可將數(shù)據(jù)總量進行大量壓縮。
1、離散余弦變換(DCT)編碼
(1) 功能簡述
離散余弦變換簡稱為DCT(是英Discrete Cosine Transform的縮寫詞),是一種數(shù)字處理方法,經常用于數(shù)據(jù)處理。DCT是多種數(shù)字變換方法的一種,它是把空間域圖像變換到頻率域進行分析的方法。由于DCT的變換核構成的基向量與圖像內容無關,而且變換核是可以分離的,既二維DCT可以用兩次一維DCT來完成,使得數(shù)學運算難度大大簡化,再配以已經發(fā)現(xiàn)的其它快速算法,使得DCT編碼得到了廣泛的應用。將DCT應用于圖像數(shù)據(jù)壓縮,可以減少代表圖像亮度(或色度)層次數(shù)碼信息,達到數(shù)據(jù)壓縮的目的。利用DCT不僅可將圖像編碼,還可以在編碼變換過程發(fā)現(xiàn)圖像細節(jié)的位置,以便刪去或略去對視覺不敏感的部分,而更加突出視覺的敏感部分,通過選擇主要數(shù)據(jù)來傳輸、重視圖像。
利用DCT壓縮圖像數(shù)據(jù),主要是根據(jù)圖像信號在頻率域的統(tǒng)計特性。在空間域看來,圖像內容千差萬別;但在頻率域上,經過對大量圖像的統(tǒng)計分析發(fā)現(xiàn),圖像經過DCT變換后,其頻率系數(shù)的主要成分集中于比較小的范圍,且主要位于低頻部分。利用DCT變換揭示出這種規(guī)律后,可以再采取一些措施把頻譜中能量較小的部分舍棄,盡量保留傳輸頻譜中主要的頻率分量,就能夠達到圖像數(shù)據(jù)壓縮目的。
(2)規(guī)律和特點
①時間域信號的頻譜
對于一個隨時間變化的波形來說,它是隨時間變化的周期信號,它是以一定幅度值為波形的直流平均值,其波形可看成是基波與無數(shù)次諧波疊加而成。其基波振幅最大,然后各次諧波振幅逐漸減小。各次諧波疊加次數(shù)越高,則合成波形越接近于理想矩形波。此分析方法就是應用日益廣泛的頻譜分析方法。其中各次正弦波諧波的振幅值經常稱為頻譜系數(shù),將頻譜系數(shù)排列起來,可以組成一個系數(shù)列。上述事實說明,周期性矩形波可以由時間域 (反映幅度-時間關系)來描述,也可以由頻率域(幅度-頻率關系)來描述。兩者有互相對應的關系。實際上,各種時間域信號都可以由頻率域的規(guī)律來描述,兩種描述方法存在內在的聯(lián)系,可以互相轉換。
②空間域信號的頻譜系數(shù)
對于各種空間域分布的信號,也可以進行類似的頻率變換,即將空間域信號轉變?yōu)轭l率域信號。DCT就是其中一種頻率分析方法??蓞㈤唸D2.2.2來說明DCT變換過程。
由圖像內取出一個區(qū)塊,分成8×8個像素的64格陣列,即由圖(a)轉變?yōu)閳D(b)。經過對逐個像素的亮度(或討論色度)數(shù)值取樣,并將像素的亮度數(shù)值列成矩陣形表格,見圖(C)。然后利用離散余弦變換(DCT)可將各空間取樣值轉變
評論