嵌入式視頻圖像系統(tǒng)壓縮算法的實(shí)現(xiàn)和優(yōu)化
引言
本文引用地址:http://butianyuan.cn/article/92476.htm隨著網(wǎng)絡(luò)技術(shù)和多媒體技術(shù)的發(fā)展.視頻通信的需求逐漸增加.同時(shí)最新的視頻壓縮標(biāo)準(zhǔn)不斷推出。MPEG-4 ( Moving Pictures Expcrts Group-4)是國際運(yùn)動(dòng)圖像像編碼專家組(MPEG Moving Picture Experts Group)在1998年11月制定[1]的,它不同于其他標(biāo)準(zhǔn).是個(gè)而向多媒體應(yīng)用的壓縮標(biāo)準(zhǔn). 第1次提出了基于對(duì)象的壓縮方法.使交互功能的實(shí)現(xiàn)成為可能。日前基于PC平臺(tái)的MPEG-4視頻編碼器[2]在互聯(lián)網(wǎng)的遠(yuǎn)程教育和高清晰電影等方面己經(jīng)有較多的應(yīng)用.但在硬盤錄像機(jī)、多媒體通信等視頻業(yè)務(wù)的嵌入式系統(tǒng)應(yīng)用更為廣泛。以DSP為嵌入式圖像處理核心的系統(tǒng),具有開發(fā)周期短,編程靈活的特點(diǎn),因此DSP圖像處理系統(tǒng)成為了研究熱點(diǎn)。
DSPs結(jié)構(gòu)特點(diǎn)
TMS320C6455是TI ( Tcxas Instrumcnts Incorporatcd)公司推出的最新高速DSP芯片[3]。具體結(jié)構(gòu)見圖1。最主要的特點(diǎn)從是結(jié)構(gòu)[4]上采用了VLIW(VLIW: VeryLong Instruction Word)超長指令字內(nèi)核結(jié)構(gòu).具有1200 MHz的CPU,每個(gè)周期可以同時(shí)執(zhí)行8條32bit的指令。速度可達(dá)到9600 MIPS ( 1200 MHz X 8條指令=4 800 MIPS) 。片內(nèi)采用2級(jí)高速緩存結(jié)構(gòu).片外存儲(chǔ)器有很強(qiáng)大的外部存儲(chǔ)器接口EMIF ( Extcrnal Mcm ory Intcrfacc)。 這些性能能滿足視頻圖像處理的實(shí)時(shí)性要求.確立了它在高端多媒體應(yīng)用中的地位。
圖1 TMS320C6455DSP 的內(nèi)核結(jié)構(gòu)
對(duì)Cache的優(yōu)化
最大程度地發(fā)揮Cache效率是達(dá)到期望編碼器性能的一個(gè)關(guān)鍵因素[5]。Cache高速的存儲(chǔ)訪問速度可以減少CPU延遲周期.提高處理器的效率。TMS320C64xDSP有兩級(jí)存儲(chǔ)結(jié)構(gòu)應(yīng)用片內(nèi)數(shù)據(jù)和程序存儲(chǔ)。對(duì)于L1Cache能夠以CPU的同樣速度訪問。L2Cache既可以作數(shù)據(jù)空間也可以作為程序空間使用.L2是片外空間與L1的橋梁。
MPEG-4視頻編碼器是以宏塊為單位進(jìn)行編碼處理 ,只有當(dāng)前宏塊處理完成所有的過程后,視頻編碼器才能傳送一個(gè)宏塊。直接出現(xiàn)的缺點(diǎn)是: 一個(gè)視頻編碼器整個(gè)代碼大于 L1P。每個(gè)宏塊在 L1P和 L2之間的傳送過程 ,導(dǎo)致嚴(yán)重的Cache缺失。而一個(gè)單獨(dú)的宏塊從片外存儲(chǔ)空間到片內(nèi)空間的搬移 , 也不能發(fā)揮 EDMA (Extended Direct Memony Access )的優(yōu)勢(shì)。
評(píng)論