新聞中心

EEPW首頁 > 消費(fèi)電子 > 設(shè)計(jì)應(yīng)用 > 視頻壓縮編解碼標(biāo)準(zhǔn)綜述

視頻壓縮編解碼標(biāo)準(zhǔn)綜述

作者: 時(shí)間:2012-07-02 來源:網(wǎng)絡(luò) 收藏

(3)通用的訪問性

MPEG-4提供了易出錯(cuò)環(huán)境的魯棒性,來保證其在許多無線和有線網(wǎng)絡(luò)以及存儲(chǔ)介質(zhì)中的應(yīng)用,此外,MPEG-4還支持基于內(nèi)容的的可分級(jí)性,即把內(nèi)容、質(zhì)量、復(fù)雜性分成許多小塊來滿足不同用戶的不同需求,支持具有不同帶寬,不同存儲(chǔ)容量的傳輸信道和接收端。

這些特點(diǎn)無疑會(huì)加速多媒體應(yīng)用的發(fā)展,從中受益的應(yīng)用領(lǐng)域有:因特網(wǎng)多媒體應(yīng)用;廣播電視;交互式游戲;實(shí)時(shí)可視通信;交互式存儲(chǔ)媒體應(yīng)用;演播室技術(shù)及電視后期制作;采用面部動(dòng)畫技術(shù)的虛擬會(huì)議;多媒體郵件;移動(dòng)通信條件下的多媒體應(yīng)用;遠(yuǎn)程監(jiān)控;通過ATM網(wǎng)絡(luò)等進(jìn)行的遠(yuǎn)程數(shù)據(jù)庫業(yè)務(wù)等。MPEG-4主要應(yīng)用如下:

(1)應(yīng)用于因特網(wǎng)視音頻廣播

由于上網(wǎng)人數(shù)與日俱增,傳統(tǒng)電視廣播的觀眾逐漸減少,隨之而來的便是廣告收入的減少,所以現(xiàn)在的固定式電視廣播最終將轉(zhuǎn)向基于TCP/IP的因特網(wǎng)廣播,觀眾的收看方式也由簡(jiǎn)單的遙控器選擇頻道轉(zhuǎn)為網(wǎng)上點(diǎn)播。視頻點(diǎn)播的概念不是先把節(jié)目下載到硬盤,然后再播放,而是流媒體視頻(streaming video),點(diǎn)擊即觀看,邊傳輸邊播放。

現(xiàn)在因特網(wǎng)中播放視音頻的有:Real Networks公司的 Real Media,微軟公司的 Windows Media,蘋果公司的 QuickTime,它們定義的視音頻格式互不兼容,有可能導(dǎo)致媒體流中難以控制的混亂,而MPEG-4為因特網(wǎng)視頻應(yīng)用提供了一系列的工具,使視音頻碼流具有規(guī)范一致性。因此在因特網(wǎng)播放視音頻采用MPEG-4,應(yīng)該說是一個(gè)安全的選擇。

(2)應(yīng)用于無線通信

MPEG-4高效的碼率,交互和分級(jí)特性尤其適合于在窄帶移動(dòng)網(wǎng)上實(shí)現(xiàn)多媒體通信,未來的手機(jī)將變成多媒體移動(dòng)接收機(jī),不僅可以打移動(dòng)電視電話、移動(dòng)上網(wǎng),還可以移動(dòng)接收多媒體廣播和收看電視。

(3)應(yīng)用于靜止圖像

靜止圖像(圖片)在因特網(wǎng)中大量使用,現(xiàn)在網(wǎng)上的圖片多采用JPEG技術(shù)。MPEG-4中的靜止圖像(紋理)壓縮是基于小波變換的,在同樣質(zhì)量條件下,壓縮后的文件大小約是JPEG壓縮文件的十分之一。把因特網(wǎng)上使用的JPEG圖片轉(zhuǎn)換成MPEG-4格式,可以大幅度提高圖片在網(wǎng)絡(luò)中的傳輸速度。

(4)應(yīng)用于電視電話

傳統(tǒng)用于窄帶電視電話業(yè)務(wù)的壓縮編碼,如H261,采用幀內(nèi)壓縮、幀間壓縮、減少象素和抽幀等辦法來降低碼率,但編碼效率和圖像質(zhì)量都難以令人滿意。MPEG-4的壓縮編碼可以做到以極低碼率傳送質(zhì)量可以接受的聲像信號(hào),使電視電話業(yè)務(wù)可以在窄帶的公用電話網(wǎng)上實(shí)現(xiàn)。

(5)應(yīng)用于計(jì)算機(jī)圖形、動(dòng)畫與仿真

MPEG-4特殊的編碼方式和強(qiáng)大的交互能力,使得基于MPEG-4的計(jì)算機(jī)圖形和動(dòng)畫可以從各種來源的多媒體數(shù)據(jù)庫中獲取素材,并實(shí)時(shí)組合出所需要的結(jié)果。因而未來的計(jì)算機(jī)圖形可以在MPEG-4語法所允許的范圍內(nèi)向所希望的方向無限發(fā)展,產(chǎn)生出今天無法想象的動(dòng)畫及仿真效果。

(6)應(yīng)用于電子游戲

MPEG-4可以進(jìn)行自然圖像與聲音同人工合成的圖像與聲音的混合編碼,在編碼方式上具有前所未有的靈活性,并且能及時(shí)從各種來源的多媒體數(shù)據(jù)庫中調(diào)用素材。這可以在將來產(chǎn)生象電影一樣的電子游戲,實(shí)現(xiàn)極高自由度的交互式操作。

4.MPEG-7

MPEG-7標(biāo)準(zhǔn)被稱為“多媒體內(nèi)容描述接口”,為各類多媒體信息提供一種標(biāo)準(zhǔn)化的描述,這種描述將與內(nèi)容本身有關(guān),允許快速和有效的查詢用戶感興趣的資料。它將擴(kuò)展現(xiàn)有內(nèi)容識(shí)別專用解決方案的有限的能力,特別是它還包括了更多的數(shù)據(jù)類型。換而言之,MPEG-7規(guī)定一個(gè)用于描述各種不同類型多媒體信息的描述符的標(biāo)準(zhǔn)集合。該標(biāo)準(zhǔn)于1998年10月提出。

MPEG-7的目標(biāo)是支持多種音頻和視覺的描述,包括自由文本、N維時(shí)空結(jié)構(gòu)、統(tǒng)計(jì)信息、客觀屬性、主觀屬性、生產(chǎn)屬性和組合信息。對(duì)于視覺信息,描述將包括顏色、視覺對(duì)象、紋理、草圖、形狀、體積、空間關(guān)系、運(yùn)動(dòng)及變形等。

MPEG-7的目標(biāo)是根據(jù)信息的抽象層次,提供一種描述多媒體材料的方法以便表示不同層次上的用戶對(duì)信息的需求。以視覺內(nèi)容為例,較低抽象層將包括形狀、尺寸、紋理、顏色、運(yùn)動(dòng)(軌道)和位置的描述。對(duì)于音頻的較低抽象層包括音調(diào)、調(diào)式、音速、音速變化、音響空間位置。最高層將給出語義信息:如“這是一個(gè)場(chǎng)景:一個(gè)鴨子正躲藏在樹后并有一個(gè)汽車正在幕后通過。”抽象層與提取特征的方式有關(guān):許多低層特征能以完全自動(dòng)的方式提取,而高層特征需要更多人的交互作用。MPEG-7還允許依據(jù)視覺描述的查詢?nèi)z索聲音數(shù)據(jù),反之也一樣。

MPEG-7的目標(biāo)是支持?jǐn)?shù)據(jù)管理的靈活性、數(shù)據(jù)資源的全球化和互操作性。

MPEG-7標(biāo)準(zhǔn)化的范圍包括:一系列的描述子(描述子是特征的表示法,一個(gè)描述子就是定義特征的語法和語義學(xué));一系列的描述結(jié)構(gòu)(詳細(xì)說明成員之間的結(jié)構(gòu)和語義);一種詳細(xì)說明描述結(jié)構(gòu)的語言、描述定義語言(DDL);一種或多種編碼描述方法。

在我們的日常生活中,日益龐大的可利用音視頻數(shù)據(jù)需要有效的多媒體系統(tǒng)來存取、交互。這類需求與一些重要的社會(huì)和經(jīng)濟(jì)問題相關(guān),并且在許多專業(yè)和消費(fèi)應(yīng)用方面都是急需的,尤其是在網(wǎng)絡(luò)高度發(fā)展的今天,而MPEG-7的最終目的是把網(wǎng)上的多媒體內(nèi)容變成象現(xiàn)在的文本內(nèi)容一樣,具有可搜索性。這使得大眾可以接觸到大量的多媒體內(nèi)容,MPEG-7標(biāo)準(zhǔn)可以支持非常廣泛的應(yīng)用,具體如下:

(1)音視數(shù)據(jù)庫的存儲(chǔ)和檢索;

(2)廣播媒體的選擇(廣播、電視節(jié)目);

(3)因特網(wǎng)上的個(gè)性化新聞服務(wù);

(4)智能多媒體、多媒體編輯;

(5)教育領(lǐng)域的應(yīng)用(如數(shù)字多媒體圖書館等);

(6)遠(yuǎn)程購物;

(7)社會(huì)和文化服務(wù)(歷史博物館、藝術(shù)走廊等);

(8)調(diào)查服務(wù)(人的特征的識(shí)別、辯論等);

(9)遙感;

(10)監(jiān)視(交通控制、地面交通等);

(11)生物醫(yī)學(xué)應(yīng)用;

(12)建筑、不動(dòng)產(chǎn)及內(nèi)部設(shè)計(jì);

(13)多媒體目錄服務(wù)(如,黃頁、旅游信息、地理信息系統(tǒng)等);

(14)家庭娛樂(個(gè)人的多媒體收集管理系統(tǒng)等)。

原則上,任何類型的AV(Audio-Video)材料都可以通過任何類型的查詢材料來檢索,例如,AV材料可以通過視頻、音樂、語言等來查詢,通過搜索引擎來匹配查詢數(shù)據(jù)和MPEG-7的音視頻描述。下面給出幾個(gè)查詢例子:

音樂:在鍵盤上彈幾個(gè)音符就能得到包含(或近似)要求曲調(diào)的音樂作品列表,或以某種方式匹配音符的圖象,例如,從情感方面。



評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉