關 閉

新聞中心

EEPW首頁 > 工控自動化 > 設計應用 > JPEG軟件解碼及其在ARM7上的實現

JPEG軟件解碼及其在ARM7上的實現

作者: 時間:2011-09-21 來源:網絡 收藏

 JPEG作為一種成熟的圖像壓縮標準,具有壓縮效率高、恢復的圖像質量好、易于實現等優(yōu)點[1],已經得到了廣泛的運用。隨著現代嵌入式技術的快速發(fā)展,各類電子產品為了進一步降低成本,JPEG技術也越來越多地受到各種小型嵌入式產品的青睞。目前嵌入式系統方面對JPEG圖像軟件解碼較多地應用在DSP和多核等高速處理器上[2-3]。
 本文提出一種基于處理器LPC2478的軟件解碼JPEG方案,同時將圖像顯示在高分辨率10.4英寸的、具有LVDS接口的TFT_LCD液晶顯示器AA104SG02上。
1 硬件設計及實現
 以LPC2478為控制核心的小型嵌入式系統硬件實現框圖如圖1所示。

 LPC2478是一款NXP公司生產的基于的微控制器[4],擁有豐富的片上資源,在嵌入式控制領域得到了廣泛的運用。LPC2478的內核為32 bit的TDMIS處理器,CPU工作頻率最高可達72 MHz,片上Flash為512 KB,SDRAM為96 KB,Falsh、SRAM、SDRAM可擴展(SDRAM最大可擴展到1 024 MB),帶SSI、USB、UART等多種外設接口。此外,LPC2478還帶有LCD控制器,支持TFT及STN顯示模式。
 AA104SG02為三菱公司推出的10.4型SVGA TFT_LCD顯示屏[5],分辨率為800×600,亮度為400,對比度為500:1,輸入電壓為3.3 V,標準工作頻率為40 MHz,支持多種數據格式,電氣接口為LVDS信號。LVDS信號是一種能夠滿足大數據傳送需求的差分信號技術,具有功耗低、可靠性高及高速傳送等特點。
 在LPC2478控制LCD顯示模式下,LCD顯示數據的位寬度為16 bit,采用數據格式為R:G:B=5:6:5。LCD控制器輸出的信號有RGB數字信號、像素點時鐘(PCLK)、行同步時鐘(HSYNC)、場同步時鐘(VSYNC)及其他控制信號,這些信號均以并行方式輸出,因此,LPC2478的LCD控制器的輸出并行信號與AA104SG02的LVDS信號不能直接連接,必須在兩者之間加驅動電路,將并行信號轉換為LVDS差分信號。驅動芯片DS90383是一款信號傳輸轉換芯片,可將接收到的TTL/CMOS數據轉換為LVDS數據流,支持VGA、SVGA等更高分辨率,輸入時鐘為20 MHz~60 MHz,3.3 V單電源供電。因此,利用DS90383可實現兩者之間的信號轉換。
 在液晶控制器中,需要為顯示數據提供相應大小的緩存。屏幕為800×600像素,每個像素占2 B,則需要960 000 B的SDRAM作為顯示緩存。此外,在JPEG解碼過程中,需要緩存原始JPEG圖像數據、JPEG解碼中間數據等,對于一幅800×600的JPEG圖片來說,解碼需要2 MB左右的緩存空間。而LPC2478的片上SDRAM遠遠不能滿足空間要求,因此,本系統外擴了一個32 MB的SDRAM。與此同時,考慮到在實際應用中需要更換不同的顯示圖片,但又不可能把很多幅圖片都存儲在芯片內,為此,還外接了一個大容量SD卡。當需要顯示某個圖片時,LPC2478可從SD卡中讀取圖片,解碼后顯示在LCD上。
2 JPEG軟件解碼算法優(yōu)化及實現
 JPEG解碼技術主要包括獲取圖像基本信息、建立解碼碼表、Huffman解碼、反量化、反Zig-Zag、IDCT及顏色空間轉換。JPEG解碼流程圖如圖2所示。

2.1 圖像基本信息獲取
 在JPEG圖像解碼之前,需要通過JPEG文件獲取圖像解碼時所需的各種信息,包括圖像的大小、采樣因子、量化表以及Huffman表等。由于JPEG文件的存儲格式為JFIF格式(主要為標記碼和壓縮數據),因此,可以根據不同的標記碼獲得相應的信息。在掃描開始(SOS)標記段結束后才是真正的圖像壓縮數據流。
2.2 解碼碼表建立
 在Huffman解碼前,要建立解碼碼表。對于一幅圖像,一般有4個Huffman表(直流0號表、直流1號表、交流0號表、交流1號表),每個碼表都建立各自的三張解碼碼表,分別為:不同位數的碼字的數量表(Code_bitsnum_table)、碼權值表(Code_weight_table)、碼字表(Code_value_table)。不同位數碼字的數量表和碼權值表可直接從Huffman表中獲得。而碼字表則是通過Huffman表建立Huffman樹獲得,且碼字均自動按從小到大排列,而且沒必要保存每個碼字的長度(以下簡稱碼長)。因為每個碼長可由不同位數碼字的數量表與碼字表推算而得。建立碼字表的流程圖如圖3所示。

 圖中,L表示碼字的位數(最長為16 bit);huffnum為Huffman表的序號;Read_Byte()為讀取Huffman表的值,表示對應L位碼字的個數,如果等于0,表示沒有L位的碼字。第一個碼字值必定為0,若有K個碼字位數相同,則當前碼字為它前面的碼字加1;但如果它的位數比它前面的碼字位數大,則當前碼字是前面碼字加1后再在后面添若干個0,直到滿足位數長度位置為止。
2.3 Huffman解碼優(yōu)化
 在JPEG文件中,圖像壓縮數據流是逐位存儲的,因此解碼時也必須逐位地讀入。Huffman解碼的過程主要是解碼碼表的查找過程。簡單的解碼方法為直接查找解碼碼表直到找到正確的Huffman碼,此時,逐位移入碼流獲得的編碼值都需要從解碼碼表的頭開始查找,比較碼字是否相同、碼長是否相等。這將需要大量的存取操作,不僅會增加代碼量,同時還將耗費較多的CPU時間。
 為降低代碼開銷及盡可能減少CPU時間,本文對該解碼過程進行了優(yōu)化。獲得編碼值及編碼值長度后,根據不同位數碼字的數量表可直接定位到碼字表中第一個碼長相等的碼字,若編碼值不小于該碼字且不大于相同碼長的碼字的最大值,則可以找到與編碼值相同的碼字;否則不能找到,須重新獲得新的編碼值后再按上述步驟查找。根據查找出的相同的碼字在碼字表中的位置,由碼權值表獲得該碼字的權值。當這個碼字為直流碼字時,權值的大小即為直流分量數值的二進制位數,再根據Huffman直流譯碼表譯碼;當這個碼字為交流碼字時,權值的高4位表示當前值前面有多少個連續(xù)的0,低4位為該交流分量數值的二進制位數,再根據Huffman交流譯碼表譯碼。優(yōu)化后的一次Huffman解碼流程圖如圖4所示。

 在JPEG文件中存儲了兩張量化表,分別為亮度量化表和色度量化表。反量化運算過程即為經Huffman解碼得到的系數矩陣與相應的量化矩陣相乘。由于數據是按8×8矩陣的“之”字行排列,所以要對反量化運算的結果進行反Zig-Zag操作。
 在解碼8×8的數據塊過程中發(fā)現,右下角的高頻分量存在大量的0。如果完成Huffman解碼之后,再進行反量化及反Zig-Zag排序,必然存在許多乘0運算及重復的數據存取操作,而且同時必須至少開辟兩塊8×8大小的SDRAM來存儲這些數據,這樣不僅浪費了時間也浪費了空間,不利于在小型嵌入式系統上的應用。因此,采取Huffman解碼、反量化及反Zig-Zag三步合一的優(yōu)化措施,Huffman解碼出一個值后立即進行反量化、反Zig-Zag操作。但為了對應原來的存儲順序,需要建立這樣一個對應存儲位置的數組:

2.4 IDCT及浮點轉整點運算
 在圖形解碼運算中,IDCT變換是主要運算,占用大量的CPU時間。若直接進行IDCT變換計算,一次二維IDCT變換需要1 024次乘法和896次加法,這樣,在ARM7上解碼800×600大小圖像會相當慢,因此要提高解碼效率,必須利用IDCT的快速算法。為此,本文采用了參考文獻[6] ARAZ等人提出的IDCT快速算法。該算法的主要思想是:
 (1)將二維的IDCT分解為兩個一維的IDCT降維處理,先后在行方向、列方向上做IDCT變換。
 (2)IDCT通過數學變換轉化為離散傅里葉逆變換(IDFT),然后利用矩陣變換簡化計算。
 (3)減少乘法和加法運算次數。其結果是完成一次2D-IDFT僅需要10次乘法和29次加法。
原IDCT變換運算過程包含了5步計算,而本系統將其簡化為3步,最大限度地減少數據存取操作次數。三角函數及一些固定的系數采用查表方式,除法運算的除數均為2的n次冪,可直接轉換為右移操作,以減少計算量。但乘法和加法運算均為有符號浮點運算,而ARM7只支持整點運算,因此還需要將浮點運算轉化為整點運算。
 在IDCT運算中,大部分的浮點乘法運算為一個數乘以一個余弦值(即乘數小于1),根據這個特點,本文設計了如下浮點轉整點運算方法:
 (1)將浮點數乘以256,得到的32位整點數格式為0xXXXXXX XX,高24位保留了浮點的整數部分及符號位,低8位保留到了小數部分的第4位。
 (2)乘法運算:被乘數轉化為如上格式的32位整數(如0xAAAAAABB),乘數要求小于1。轉化后為8位整數,如0xCC。為了防止溢出,乘法運算做如下更改:
0xAAAAAABB×0xCC=(0xAAAAAA×0xCC)+((0xBB×0xCC)>>8)
 該方法能確保整個運算過程中數據不溢出。
2.5 色彩空間轉換
 通過解碼出來的Y(亮度)CrCb(色度)信號,要在屏幕上顯示圖像,還必須轉化為RGB信號。其轉換公式為:
 R=Y+1.402×Cb+128
 G=Y-0.344 14×Cr-0.714 14×Cb+128
 B=Y+1.772×Cr+128
 計算時,乘法運算使用上述的浮點轉整點運算法則,但需要作如下修改:
 R=Y+Cb+Cb×0.402+128
 G=Y-Cr×0.344 14-Cb×0.714 14+128
 B=Y+Cr+Cr×0.772+128
 解碼后的RGB信號直接存入顯示緩存區(qū),將實時顯示在屏幕的對應像素點上,實現邊解碼邊顯示,直到整個圖像全部顯示在屏幕上。解碼效果如圖5所示,解碼優(yōu)化前耗時為30 s,優(yōu)化后耗時為15 s,速度提高了一倍。

 本系統實現了JPEG圖像通過LPC2478解碼顯示在像素為800×600的AA104SG02液晶顯示器上,完成了基于LPC2478的圖像解碼及顯示的硬件設計,成功將JPEG解碼算法移植到本系統上,優(yōu)化了解碼算法。通過將優(yōu)化后的Huffman解碼與反量化、反Zig-Zag相結合,減少了乘零運算及數據存取操作、降低了內存消耗;引入快速IDCT算法,減少了乘法和加法運算次數;將浮點運算轉換為整點運算,加快了運算速度、提高了運算精度。使復雜的JPEG圖像解碼在主頻并不很高的小型嵌入式產品上得到了很好的實現。本系統可應用于控制系統的液晶桌面圖片顯示,為人機交互提供了友好的操作界面。
參考文獻
[1] 張益貞,劉滔.VisualC++.實現MPEG/JPEG編解碼技術[M].北京:人民郵電出版社,2002.
[2] 薛永林,劉珂,李鳳亭.并行處理JPEG算法的優(yōu)化[J].電子學報,2002(2).
[3] 董嵐,李麗,張宇昂.基于AMBA2AHB總線多核平臺的JPEG解碼[J].電子測量與儀器學報,2009,23(2).
[4] NXP Semiconductors. LPC24XX user manual. Rev. 04-26,August, 2009.
[5] Mitsubishi Electric Corp. Telchnical specification Aa104sg01. Mar.9, 2006.
[6] ARAI Y, AGUI T, NAKAJIMA M. A fast DCT-SQ scheme for images[J]. IECE Transactions 1990,71(11): 1095-1097.

pid控制相關文章:pid控制原理


c++相關文章:c++教程




關鍵詞: ARM7

評論


相關推薦

技術專區(qū)

關閉