圖像壓縮編碼和解碼原理知識介紹

作者：時間：2012-02-21 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

本文引用地址：http://www.butianyuan.cn/article/165863.htm

本節(jié)介紹圖像壓縮編碼的基本原理，圖像數(shù)據(jù)壓縮和解壓縮電路的基本結(jié)構(gòu)。它們是看影碟機電路圖的基礎(chǔ)知識。

一、圖像壓縮的基本途徑
圖像的數(shù)據(jù)量極大，必須對其數(shù)據(jù)總量大大壓縮，才能夠存儲在直徑12cm的光盤上。在實用技術(shù)上，可通過以下途徑來壓縮圖像數(shù)據(jù)的總量。

1、采用亮度(Y)、色度(C)取樣方式
實用彩色電視技術(shù)沒有傳輸、處理紅、藍(lán)、綠三基色信號，而傳輸、處理亮度信號Y和色度信號C。這種處理方法有利于實現(xiàn)彩色電視和黑白電視的兼容，也利于限制彩色電視信號的頻帶寬度。在數(shù)字圖像處理技術(shù)中，仍然采用傳輸、處理亮度信號Y和色度信號C的方法。由于人眼晴對亮度信息敏感，對彩色信息不夠敏感，因而對Y信號以較高清晰度傳送，對C信號以較低清晰度傳送。實際作法是這樣的：對每個亮度Y像素都進行傳送；而將色度C分解為U、V兩個色差信號(或?qū)憺镃b、Cr、B-Y、R-Y)，分別進行傳送；對亮度Y實行逐點取樣，而對色度C則取樣較少。即對應(yīng)于4個亮度取樣點，僅對色度信號取樣1個點，即對U、V像素的取樣較低，各取1個取樣點，這種取樣格式稱為YUV411格式。
采用YUV411取樣格式后，它的數(shù)據(jù)總量將比三基色取樣量格式時減少一半。若采用三種基色取樣方式時，各基色應(yīng)與亮度信號取樣方式一樣，即對每個紅、綠、藍(lán)色采取逐點取樣的方法。采用Y、C傳輸方式時，取樣次數(shù)減少一半，傳輸數(shù)碼也減少一半。人眼睛對色度的敏感程度較低，利用人眼睛這一生理視覺特性，人們在主觀感覺上并沒有感到圖像清晰度下降。顯然，這是壓縮圖像數(shù)據(jù)碼率的一個得力措施。

2、將整幅圖像分割為小區(qū)域進行分割處理
對圖像進行數(shù)據(jù)處理時，對每幀圖像進行分割處理。首先圖像橫向切成若干條，每一條稱為一片，將每一片再縱向切成若干塊，稱宏塊，宏塊是圖像壓縮的基本單位。每個宏塊的彩色圖像可用1個亮度信號Y和兩個色差信號Cb、Cr(即U、V)來表示，或者說，每個宏塊分為三層，一層亮度Y，兩層色度(各為Cb、Cr)，統(tǒng)稱為一個宏塊。
由于人眼睛對亮度、色度的主觀敏感程度不同，通常把亮度宏塊再平均分成4塊，每一小塊稱為像塊或區(qū)塊，詳見示意圖2.2.1。每個區(qū)塊可以進一步分割，稱為像素或像點，像素是構(gòu)成圖像的最小單位。對于數(shù)字圖像來說，每一個像素作為一個取樣點，有一個對應(yīng)的取樣數(shù)值?？梢钥闯?，圖像分割越細(xì)，像素數(shù)越多，取樣點越多，圖像清晰度越高；反之，像素數(shù)越少，圖像清晰度越低。實際上，對圖像壓縮處理，就是對圖像區(qū)塊的數(shù)據(jù)、像素的數(shù)據(jù)進行壓縮處理。
將整幅圖像分割為小區(qū)域進行分割處理 http://www.elecfans.com

彩電制式不同，分割圖像的具體數(shù)據(jù)將有所變化。例如PAL制，大多數(shù)為625行掃描標(biāo)準(zhǔn)，那么每幀圖像被切為18片，每片再切成22個宏塊，即每幀圖像分成396個宏塊；而525行的NTSC制，每幀圖像被切為15片，每片再切成22個宏塊，即每幀圖像分成330個宏塊。對亮度信號來說，每個宏塊又分為4個區(qū)塊，每個區(qū)塊含有8×8=64個像素，則每個宏塊含有256個像素。但對兩個色差信號來說，宏塊像素數(shù)等于區(qū)塊像素數(shù)，即像素數(shù)是8×8=64個，是亮度像素的1/4。盡管兩色差信號的像素較少，清晰度低，但不影響人眼睛的主觀感覺。在進行數(shù)字圖像處理時，按照圖中各個8×8方塊( 共64塊) 編成次序，再按照編號順序依次處理。也就是說，以8×8像素的方塊作基本操作單元，依次處理每個像素(即取樣點)的取樣數(shù)值。
3、采用幀間和幀內(nèi)數(shù)據(jù)壓縮技術(shù)。
實用電視每秒鐘傳送25－30幀畫面，使畫面變化具有連續(xù)感，電視活動圖像是由各幀畫面差別很小的一系列畫面組成的。各幀畫面的微小變化主要表現(xiàn)于畫面主體部分，畫面的背景差別很小。圖像是由亮度、色度信息來描述的，在各相鄰幀圖像內(nèi)，若分別比較同一相對位置的亮度、色度信號，通常其差別較小。經(jīng)大量統(tǒng)計發(fā)現(xiàn)，在各個像素當(dāng)中僅有10%以下的像素點的亮度差值變化超過去時2%，而色度差值變化在0.1%以下。在各幀圖像中具有大量重復(fù)內(nèi)容，這些重復(fù)內(nèi)容的數(shù)據(jù)屬于多余(冗余)信息，于是，可以通過減少時域冗余信息的方法，即運作幀間數(shù)據(jù)壓縮技術(shù)，來減少圖像傳輸?shù)臄?shù)碼率。
經(jīng)分析發(fā)現(xiàn)，在同一幀畫面內(nèi)也存在相當(dāng)多的冗余信息。對圖像主體部分和眼睛最敏感的部分，應(yīng)當(dāng)準(zhǔn)確、詳細(xì)地處理，需要對每個像素點進行精細(xì)傳輸；但對于圖像非主體部分和眼睛不敏感的部分，則可以進行粗略地處理，即進行信息數(shù)據(jù)的壓縮處理。于是，可以根據(jù)一幀圖像內(nèi)容的具體分布情況，對不同位置可采用不同的數(shù)據(jù)量來傳送，減少傳送圖像的數(shù)據(jù)量，使圖像數(shù)據(jù)得到壓縮。這種壓縮數(shù)據(jù)的方法，是在同一幀圖像的不同空間部位進行數(shù)據(jù)壓縮，稱為空間域冗余壓縮。例如，有一幅人像畫面，其面部和頭部的線條清晰度可以不相同，尤其是眼睛、嘴唇部位表情豐富，線條比較精細(xì)復(fù)雜，是觀眾最注意的部位，應(yīng)當(dāng)用高清晰度傳送；而頭頂部位和面頰側(cè)面，輪廓變化較少，灰度層次變化較小，觀眾不太注意這些部位。顯然，圖像的主要部位，灰度層次變化較大的部位，人眼睛敏感的部位，應(yīng)當(dāng)以較大數(shù)據(jù)量進行精細(xì)傳送；而那些圖像的次要部位，灰度層次變化較小的部位，人眼睛不注意的部位，則可用較少數(shù)據(jù)量進行粗略傳送，甚至于僅僅傳送它們的平均亮度信息。
以下具體討論數(shù)字圖像的數(shù)據(jù)壓縮原理。先討論靜止圖像的數(shù)據(jù)壓縮技術(shù)，即幀內(nèi)數(shù)據(jù)壓縮技術(shù)；然后討論活動圖像的數(shù)據(jù)壓縮技術(shù)，即幀間數(shù)據(jù)壓縮技術(shù)。
二、幀內(nèi)數(shù)據(jù)壓縮技術(shù)
首先對整幅圖像進行分割處理，經(jīng)分割取得最小操作單元。下面按8×8=64個像素組成的區(qū)塊來計論。每一個像素值都可以按一定規(guī)律取樣，例如可對亮度各個像素的亮度值取樣，若每個像素按8bit量化，則每個區(qū)塊的總數(shù)據(jù)量為8bit×64（像素點），即512bit。可見，對全畫面各像素量化處理后數(shù)據(jù)量十分龐大，需要進行數(shù)據(jù)壓縮。通常，經(jīng)過離散余弦變換，Z字型掃描，可變長度編碼等處理過程，可將數(shù)據(jù)總量進行大量壓縮。
1、離散余弦變換（DCT）編碼
(1) 功能簡述
離散余弦變換簡稱為DCT（是英Discrete Cosine Transform的縮寫詞），是一種數(shù)字處理方法，經(jīng)常用于數(shù)據(jù)處理。DCT是多種數(shù)字變換方法的一種，它是把空間域圖像變換到頻率域進行分析的方法。由于DCT的變換核構(gòu)成的基向量與圖像內(nèi)容無關(guān)，而且變換核是可以分離的，既二維DCT可以用兩次一維DCT來完成，使得數(shù)學(xué)運算難度大大簡化，再配以已經(jīng)發(fā)現(xiàn)的其它快速算法，使得DCT編碼得到了廣泛的應(yīng)用。將DCT應(yīng)用于圖像數(shù)據(jù)壓縮，可以減少代表圖像亮度(或色度)層次數(shù)碼信息，達(dá)到數(shù)據(jù)壓縮的目的。利用DCT不僅可將圖像編碼，還可以在編碼變換過程發(fā)現(xiàn)圖像細(xì)節(jié)的位置，以便刪去或略去對視覺不敏感的部分，而更加突出視覺的敏感部分，通過選擇主要數(shù)據(jù)來傳輸、重視圖像。
利用DCT壓縮圖像數(shù)據(jù)，主要是根據(jù)圖像信號在頻率域的統(tǒng)計特性。在空間域看來，圖像內(nèi)容千差萬別；但在頻率域上，經(jīng)過對大量圖像的統(tǒng)計分析發(fā)現(xiàn)，圖像經(jīng)過DCT變換后，其頻率系數(shù)的主要成分集中于比較小的范圍，且主要位于低頻部分。利用DCT變換揭示出這種規(guī)律后，可以再采取一些措施把頻譜中能量較小的部分舍棄，盡量保留傳輸頻譜中主要的頻率分量，就能夠達(dá)到圖像數(shù)據(jù)壓縮目的。
(2)規(guī)律和特點
①時間域信號的頻譜
對于一個隨時間變化的波形來說，它是隨時間變化的周期信號，它是以一定幅度值為波形的直流平均值，其波形可看成是基波與無數(shù)次諧波疊加而成。其基波振幅最大，然后各次諧波振幅逐漸減小。各次諧波疊加次數(shù)越高，則合成波形越接近于理想矩形波。此分析方法就是應(yīng)用日益廣泛的頻譜分析方法。其中各次正弦波諧波的振幅值經(jīng)常稱為頻譜系數(shù)，將頻譜系數(shù)排列起來，可以組成一個系數(shù)列。上述事實說明，周期性矩形波可以由時間域 (反映幅度－時間關(guān)系)來描述，也可以由頻率域(幅度－頻率關(guān)系)來描述。兩者有互相對應(yīng)的關(guān)系。實際上，各種時間域信號都可以由頻率域的規(guī)律來描述，兩種描述方法存在內(nèi)在的聯(lián)系，可以互相轉(zhuǎn)換。
②空間域信號的頻譜系數(shù)
對于各種空間域分布的信號，也可以進行類似的頻率變換，即將空間域信號轉(zhuǎn)變?yōu)轭l率域信號。DCT就是其中一種頻率分析方法?？蓞㈤唸D2.2.2來說明DCT變換過程。
由圖像內(nèi)取出一個區(qū)塊，分成8×8個像素的64格陣列，即由圖(a)轉(zhuǎn)變?yōu)閳D(b)。經(jīng)過對逐個像素的亮度（或討論色度）數(shù)值取樣，并將像素的亮度數(shù)值列成矩陣形表格，見圖（C）。然后利用離散余弦變換（DCT）可將各空間取樣值轉(zhuǎn)變
圖2.2.2 DCT變換過程 http://www.elecfans.com

新聞中心

圖像壓縮編碼和解碼原理知識介紹

評論

相關(guān)推薦

技術(shù)專區(qū)