視頻壓縮技術(shù)解析
本文引用地址:http://butianyuan.cn/article/165860.htm 視頻數(shù)據(jù)中存在著大量的冗余, 即圖像的各像素?cái)?shù)據(jù)之間存在極強(qiáng)的相關(guān)性。 利用這些相關(guān)性, 一部分像素的數(shù)據(jù)可以由另一部分像素的數(shù)據(jù)推導(dǎo)出來(lái), 結(jié)果視頻數(shù)據(jù)量能極大地壓縮, 有利于傳輸和存儲(chǔ)。 視頻數(shù)據(jù)主要存在以下形式的冗余。 1. 空間冗余 2. 時(shí)間冗余 3. 結(jié)構(gòu)冗余 6. 圖像區(qū)域的相同性冗余 6.1.2 視頻信號(hào)的數(shù)字化和壓縮 圖 6-1 電視信號(hào)的數(shù)字化和復(fù)原
視頻圖像在水平方向相鄰像素之間、 垂直方向相鄰像素之間的變化一般都很小, 存在著極強(qiáng)的空間相關(guān)性。 特別是同一景物各點(diǎn)的灰度和顏色之間往往存在著空間連貫性, 從而產(chǎn)生了空間冗余, 常稱為幀內(nèi)相關(guān)性。
在相鄰場(chǎng)或相鄰幀的對(duì)應(yīng)像素之間, 亮度和色度信息存在著極強(qiáng)的相關(guān)性。 當(dāng)前幀圖像往往具有與前、 后兩幀圖像相同的背景和移動(dòng)物體, 只不過移動(dòng)物體所在的空間位置略有不同, 對(duì)大多數(shù)像素來(lái)說, 亮度和色度信息是基本相同的, 稱為幀間相關(guān)性或時(shí)間相關(guān)性。
在有些圖像的紋理區(qū), 圖像的像素值存在著明顯的分布模式。 如方格狀的地板圖案等。 已知分布模式, 可以通過某一過程生成圖像, 稱為結(jié)構(gòu)冗余。
4. 知識(shí)冗余
有些圖像與某些知識(shí)有相當(dāng)大的相關(guān)性。 如人臉的圖像有固定的結(jié)構(gòu), 嘴的上方有鼻子, 鼻子的上方有眼睛, 鼻子位于臉部圖像的中線上。 這類規(guī)律性的結(jié)構(gòu)可由先驗(yàn)知識(shí)得到, 此類冗余稱為知識(shí)冗余。
5. 視覺冗余
人眼具有視覺非均勻特性, 對(duì)視覺不敏感的信息可以適當(dāng)?shù)厣釛墶?在記錄原始的圖像數(shù)據(jù)時(shí), 通常假定視覺系統(tǒng)是線性的和均勻的, 對(duì)視覺敏感和不敏感的部分同等對(duì)待, 從而產(chǎn)生了比理想編碼(即把視覺敏感和不敏感的部分區(qū)分開來(lái)編碼)更多的數(shù)據(jù), 這就是視覺冗余。 人眼對(duì)圖像細(xì)節(jié)、 幅度變化和圖像的運(yùn)動(dòng)并非同時(shí)具有最高的分辨能力。
人眼視覺對(duì)圖像的空間分解力和時(shí)間分解力的要求具有交換性, 當(dāng)對(duì)一方要求較高時(shí), 對(duì)另一方的要求就較低。 根據(jù)這個(gè)特點(diǎn), 可以采用運(yùn)動(dòng)檢測(cè)自適應(yīng)技術(shù), 對(duì)靜止圖像或慢運(yùn)動(dòng)圖像降低其時(shí)間軸抽樣頻率, 例如每?jī)蓭瑐魉鸵粠?對(duì)快速運(yùn)動(dòng)圖像降低其空間抽樣頻率。
另外, 人眼視覺對(duì)圖像的空間、 時(shí)間分解力的要求與對(duì)幅度分解力的要求也具有交換性, 對(duì)圖像的幅度誤差存在一個(gè)隨圖像內(nèi)容而變的可覺察門限, 低于門限的幅度誤差不被察覺, 在圖像的空間邊緣(輪廓)或時(shí)間邊緣(景物突變瞬間)附近, 可覺察門限比遠(yuǎn)離邊緣處增大3~4倍, 這就是視覺掩蓋效應(yīng)。
根據(jù)這個(gè)特點(diǎn), 可以采用邊緣檢測(cè)自適應(yīng)技術(shù), 對(duì)于圖像的平緩區(qū)或正交變換后代表圖像低頻成分的系數(shù)細(xì)量化, 對(duì)圖像輪廓附近或正交變換后代表圖像高頻成分的系數(shù)粗量化; 當(dāng)由于景物的快速運(yùn)動(dòng)而使幀間預(yù)測(cè)編碼碼率高于正常值時(shí)進(jìn)行粗量化, 反之則進(jìn)行細(xì)量化。 在量化中, 盡量使每種情況下所產(chǎn)生的幅度誤差剛好處于可覺察門限之下, 這樣能實(shí)現(xiàn)較高的數(shù)據(jù)壓縮率而主觀評(píng)價(jià)不變。
在圖像中的兩個(gè)或多個(gè)區(qū)域所對(duì)應(yīng)的所有像素值相同或相近, 從而產(chǎn)生的數(shù)據(jù)重復(fù)性存儲(chǔ), 這就是圖像區(qū)域的相似性冗余。 在這種情況下, 記錄了一個(gè)區(qū)域中各像素的顏色值, 與其相同或相近的區(qū)域就不再記錄各像素的值。 矢量量化方法就是針對(duì)這種冗余圖像的壓縮方法。
7. 紋理的統(tǒng)計(jì)冗余
有些圖像紋理盡管不嚴(yán)格服從某一分布規(guī)律, 但是在統(tǒng)計(jì)的意義上服從該規(guī)律, 利用這種性質(zhì)也可以減少表示圖像的數(shù)據(jù)量, 稱為紋理的統(tǒng)計(jì)冗余。
電視圖像信號(hào)數(shù)據(jù)存在的信息冗余為視頻壓縮編碼提供了可能。
模擬電視信號(hào)(包括視頻和音頻)通過取樣、 量化后編碼 為二進(jìn)制數(shù)字信號(hào)的過程稱為模數(shù)變換(A/D變換)或脈沖編碼調(diào)制(PCM, Pulse Coding Modulation), 所得到的信號(hào)也稱為PCM信號(hào), 其過程可用圖6-1(a)表示。 若取樣頻率等于fs、 用n比特量化, 則PCM信號(hào)的碼率為nfs(比特/s)。 PCM編碼既可以對(duì)彩色全電視信號(hào)直接進(jìn)行, 也可以對(duì)亮度信號(hào)和兩個(gè)色差信號(hào)分別進(jìn)行, 前者稱為全信號(hào)編碼, 后者稱為分量編碼。
PCM信號(hào)經(jīng)解碼和插入濾波恢復(fù)為模擬信號(hào), 如圖6-1(b)所示, 解碼是編碼的逆過程, 插入濾波是把解碼后的信號(hào)插補(bǔ)為平滑、 連續(xù)的模擬信號(hào)。 這兩個(gè)步驟合稱為數(shù)模變換(D/A變換)或PCM解碼。
(a) A/D變換; (b) D/A變換
評(píng)論