JPEG軟件解碼及其在ARM7上的實現(xiàn)-AET-電子技術(shù)應(yīng)用

JPEG軟件解碼及其在ARM7上的實現(xiàn)

來源：微型機與應(yīng)用2011年第9期

廖小情，陳小平

(蘇州大學(xué) 電子信息學(xué)院，江蘇蘇州 215006)

摘要： 介紹了一種用ARM7實現(xiàn)JPEG控制解碼的方案。采用LPC2478軟件解碼JPEG圖像并將圖像實時顯示在具有LVDS接口的TFT_LCD顯示器上。在硬件設(shè)計中，解決了LVDS信號與LPC2478的LCD控制器輸出信號的轉(zhuǎn)換問題，并對解碼及顯示所需內(nèi)存大小作了詳細(xì)的分析；針對JPEG解碼中的Huffman解碼、IDCT變換等步驟提出了優(yōu)化方法，使解碼速度在一定程度上有了較大的提升，實現(xiàn)了在主頻不很高的LPC2478上解碼并顯示JPEG圖像。

關(guān)鍵詞： ARM LPC2478 LVDS JPEG 軟件解碼算法優(yōu)化 ARM7

Abstract：

Key words :

摘要： 介紹了一種用ARM7實現(xiàn)JPEG控制解碼的方案。采用LPC2478 軟件解碼JPEG圖像并將圖像實時顯示在具有LVDS接口的TFT_LCD顯示器上。在硬件設(shè)計中，解決了LVDS信號與LPC2478的LCD控制器輸出信號的轉(zhuǎn)換問題，并對解碼及顯示所需內(nèi)存大小作了詳細(xì)的分析；針對JPEG解碼中的Huffman解碼、IDCT變換等步驟提出了優(yōu)化方法，使解碼速度在一定程度上有了較大的提升，實現(xiàn)了在主頻不很高的LPC2478上解碼并顯示JPEG圖像。
關(guān)鍵詞： LPC2478；LVDS；JPEG；軟件解碼；算法優(yōu)化

　JPEG作為一種成熟的圖像壓縮標(biāo)準(zhǔn)，具有壓縮效率高、恢復(fù)的圖像質(zhì)量好、易于實現(xiàn)等優(yōu)點[1]，已經(jīng)得到了廣泛的運用。隨著現(xiàn)代嵌入式技術(shù)的快速發(fā)展，各類電子產(chǎn)品為了進(jìn)一步降低成本，JPEG技術(shù)也越來越多地受到各種小型嵌入式產(chǎn)品的青睞。目前嵌入式系統(tǒng)方面對JPEG圖像軟件解碼較多地應(yīng)用在DSP和多核等高速處理器上[2-3]。
　本文提出一種基于ARM7處理器LPC2478的軟件解碼JPEG方案，同時將圖像顯示在高分辨率10.4英寸的、具有LVDS接口的TFT_LCD液晶顯示器AA104SG02上。
1 硬件設(shè)計及實現(xiàn)
　以LPC2478為控制核心的小型嵌入式系統(tǒng)硬件實現(xiàn)框圖如圖1所示。

　LPC2478是一款NXP公司生產(chǎn)的基于ARM7的微控制器[4]，擁有豐富的片上資源，在嵌入式控制領(lǐng)域得到了廣泛的運用。LPC2478的內(nèi)核為32 bit的ARM7TDMIS處理器，CPU工作頻率最高可達(dá)72 MHz，片上Flash為512 KB，SDRAM為96 KB，F(xiàn)alsh、SRAM、SDRAM可擴展(SDRAM最大可擴展到1 024 MB)，帶SSI、USB、UART等多種外設(shè)接口。此外，LPC2478還帶有LCD控制器，支持TFT及STN顯示模式。
　AA104SG02為三菱公司推出的10.4型SVGA TFT_LCD顯示屏[5]，分辨率為800×600，亮度為400，對比度為500：1，輸入電壓為3.3 V，標(biāo)準(zhǔn)工作頻率為40 MHz，支持多種數(shù)據(jù)格式，電氣接口為LVDS信號。LVDS信號是一種能夠滿足大數(shù)據(jù)傳送需求的差分信號技術(shù)，具有功耗低、可靠性高及高速傳送等特點。
　在LPC2478控制LCD顯示模式下，LCD顯示數(shù)據(jù)的位寬度為16 bit，采用數(shù)據(jù)格式為R：G：B=5：6：5。LCD控制器輸出的信號有RGB數(shù)字信號、像素點時鐘(PCLK)、行同步時鐘(HSYNC)、場同步時鐘(VSYNC)及其他控制信號，這些信號均以并行方式輸出，因此，LPC2478的LCD控制器的輸出并行信號與AA104SG02的LVDS信號不能直接連接，必須在兩者之間加驅(qū)動電路，將并行信號轉(zhuǎn)換為LVDS差分信號。驅(qū)動芯片DS90383是一款信號傳輸轉(zhuǎn)換芯片，可將接收到的TTL/CMOS數(shù)據(jù)轉(zhuǎn)換為LVDS數(shù)據(jù)流，支持VGA、SVGA等更高分辨率，輸入時鐘為20 MHz~60 MHz，3.3 V單電源供電。因此，利用DS90383可實現(xiàn)兩者之間的信號轉(zhuǎn)換。
　在液晶控制器中，需要為顯示數(shù)據(jù)提供相應(yīng)大小的緩存。屏幕為800×600像素，每個像素占2 B，則需要960 000 B的SDRAM作為顯示緩存。此外，在JPEG解碼過程中，需要緩存原始JPEG圖像數(shù)據(jù)、JPEG解碼中間數(shù)據(jù)等，對于一幅800×600的JPEG圖片來說，解碼需要2 MB左右的緩存空間。而LPC2478的片上SDRAM遠(yuǎn)遠(yuǎn)不能滿足空間要求，因此，本系統(tǒng)外擴了一個32 MB的SDRAM。與此同時，考慮到在實際應(yīng)用中需要更換不同的顯示圖片，但又不可能把很多幅圖片都存儲在芯片內(nèi)，為此，還外接了一個大容量SD卡。當(dāng)需要顯示某個圖片時，LPC2478可從SD卡中讀取圖片，解碼后顯示在LCD上。
2 JPEG軟件解碼算法優(yōu)化及實現(xiàn)
　JPEG解碼技術(shù)主要包括獲取圖像基本信息、建立解碼碼表、Huffman解碼、反量化、反Zig-Zag、IDCT及顏色空間轉(zhuǎn)換。JPEG解碼流程圖如圖2所示。

2.1 圖像基本信息獲取
　在JPEG圖像解碼之前，需要通過JPEG文件獲取圖像解碼時所需的各種信息，包括圖像的大小、采樣因子、量化表以及Huffman表等。由于JPEG文件的存儲格式為JFIF格式(主要為標(biāo)記碼和壓縮數(shù)據(jù))，因此，可以根據(jù)不同的標(biāo)記碼獲得相應(yīng)的信息。在掃描開始(SOS)標(biāo)記段結(jié)束后才是真正的圖像壓縮數(shù)據(jù)流。
2.2 解碼碼表建立
　在Huffman解碼前，要建立解碼碼表。對于一幅圖像，一般有4個Huffman表(直流0號表、直流1號表、交流0號表、交流1號表)，每個碼表都建立各自的三張解碼碼表，分別為：不同位數(shù)的碼字的數(shù)量表(Code_bitsnum_table)、碼權(quán)值表(Code_weight_table)、碼字表(Code_value_table)。不同位數(shù)碼字的數(shù)量表和碼權(quán)值表可直接從Huffman表中獲得。而碼字表則是通過Huffman表建立Huffman樹獲得，且碼字均自動按從小到大排列，而且沒必要保存每個碼字的長度(以下簡稱碼長)。因為每個碼長可由不同位數(shù)碼字的數(shù)量表與碼字表推算而得。建立碼字表的流程圖如圖3所示。

　圖中，L表示碼字的位數(shù)(最長為16 bit)；huffnum為Huffman表的序號；Read_Byte()為讀取Huffman表的值，表示對應(yīng)L位碼字的個數(shù)，如果等于0，表示沒有L位的碼字。第一個碼字值必定為0，若有K個碼字位數(shù)相同，則當(dāng)前碼字為它前面的碼字加1；但如果它的位數(shù)比它前面的碼字位數(shù)大，則當(dāng)前碼字是前面碼字加1后再在后面添若干個0，直到滿足位數(shù)長度位置為止。
2.3 Huffman解碼優(yōu)化
　在JPEG文件中，圖像壓縮數(shù)據(jù)流是逐位存儲的，因此解碼時也必須逐位地讀入。Huffman解碼的過程主要是解碼碼表的查找過程。簡單的解碼方法為直接查找解碼碼表直到找到正確的Huffman碼，此時，逐位移入碼流獲得的編碼值都需要從解碼碼表的頭開始查找，比較碼字是否相同、碼長是否相等。這將需要大量的存取操作，不僅會增加代碼量，同時還將耗費較多的CPU時間。
　為降低代碼開銷及盡可能減少CPU時間，本文對該解碼過程進(jìn)行了優(yōu)化。獲得編碼值及編碼值長度后，根據(jù)不同位數(shù)碼字的數(shù)量表可直接定位到碼字表中第一個碼長相等的碼字，若編碼值不小于該碼字且不大于相同碼長的碼字的最大值，則可以找到與編碼值相同的碼字；否則不能找到，須重新獲得新的編碼值后再按上述步驟查找。根據(jù)查找出的相同的碼字在碼字表中的位置，由碼權(quán)值表獲得該碼字的權(quán)值。當(dāng)這個碼字為直流碼字時，權(quán)值的大小即為直流分量數(shù)值的二進(jìn)制位數(shù)，再根據(jù)Huffman直流譯碼表譯碼；當(dāng)這個碼字為交流碼字時，權(quán)值的高4位表示當(dāng)前值前面有多少個連續(xù)的0，低4位為該交流分量數(shù)值的二進(jìn)制位數(shù)，再根據(jù)Huffman交流譯碼表譯碼。優(yōu)化后的一次Huffman解碼流程圖如圖4所示。

　在JPEG文件中存儲了兩張量化表，分別為亮度量化表和色度量化表。反量化運算過程即為經(jīng)Huffman解碼得到的系數(shù)矩陣與相應(yīng)的量化矩陣相乘。由于數(shù)據(jù)是按8×8矩陣的“之”字行排列，所以要對反量化運算的結(jié)果進(jìn)行反Zig-Zag操作。
　在解碼8×8的數(shù)據(jù)塊過程中發(fā)現(xiàn)，右下角的高頻分量存在大量的０。如果完成Huffman解碼之后，再進(jìn)行反量化及反Zig-Zag排序，必然存在許多乘0運算及重復(fù)的數(shù)據(jù)存取操作，而且同時必須至少開辟兩塊8×8大小的SDRAM來存儲這些數(shù)據(jù)，這樣不僅浪費了時間也浪費了空間，不利于在小型嵌入式系統(tǒng)上的應(yīng)用。因此，采取Huffman解碼、反量化及反Zig-Zag三步合一的優(yōu)化措施，Huffman解碼出一個值后立即進(jìn)行反量化、反Zig-Zag操作。但為了對應(yīng)原來的存儲順序，需要建立這樣一個對應(yīng)存儲位置的數(shù)組：

2.4 IDCT及浮點轉(zhuǎn)整點運算
　在圖形解碼運算中，IDCT變換是主要運算，占用大量的CPU時間。若直接進(jìn)行IDCT變換計算，一次二維IDCT變換需要1 024次乘法和896次加法，這樣，在ARM7上解碼800×600大小圖像會相當(dāng)慢，因此要提高解碼效率，必須利用IDCT的快速算法。為此，本文采用了參考文獻(xiàn)[6] ARAZ等人提出的IDCT快速算法。該算法的主要思想是：
　(1)將二維的IDCT分解為兩個一維的IDCT降維處理，先后在行方向、列方向上做IDCT變換。
　(2)IDCT通過數(shù)學(xué)變換轉(zhuǎn)化為離散傅里葉逆變換(IDFT)，然后利用矩陣變換簡化計算。
　(3)減少乘法和加法運算次數(shù)。其結(jié)果是完成一次2D-IDFT僅需要10次乘法和29次加法。
原IDCT變換運算過程包含了5步計算，而本系統(tǒng)將其簡化為3步，最大限度地減少數(shù)據(jù)存取操作次數(shù)。三角函數(shù)及一些固定的系數(shù)采用查表方式，除法運算的除數(shù)均為2的n次冪，可直接轉(zhuǎn)換為右移操作，以減少計算量。但乘法和加法運算均為有符號浮點運算，而ARM7只支持整點運算，因此還需要將浮點運算轉(zhuǎn)化為整點運算。
　在IDCT運算中，大部分的浮點乘法運算為一個數(shù)乘以一個余弦值(即乘數(shù)小于1)，根據(jù)這個特點，本文設(shè)計了如下浮點轉(zhuǎn)整點運算方法：
　(1)將浮點數(shù)乘以256，得到的32位整點數(shù)格式為0xXXXXXX XX，高24位保留了浮點的整數(shù)部分及符號位，低8位保留到了小數(shù)部分的第4位。
　(2)乘法運算：被乘數(shù)轉(zhuǎn)化為如上格式的32位整數(shù)(如0xAAAAAABB)，乘數(shù)要求小于1。轉(zhuǎn)化后為8位整數(shù)，如0xCC。為了防止溢出，乘法運算做如下更改：
0xAAAAAABB×0xCC=(0xAAAAAA×0xCC)+((0xBB×0xCC)>>8)
　該方法能確保整個運算過程中數(shù)據(jù)不溢出。
2.5 色彩空間轉(zhuǎn)換
　通過解碼出來的Y(亮度)CrCb(色度)信號，要在屏幕上顯示圖像，還必須轉(zhuǎn)化為RGB信號。其轉(zhuǎn)換公式為：
　R=Y+1.402×Cb+128
　G=Y-0.344 14×Cr-0.714 14×Cb+128
　B=Y+1.772×Cr+128
　計算時，乘法運算使用上述的浮點轉(zhuǎn)整點運算法則，但需要作如下修改：
　R=Y+Cb+Cb×0.402+128
　G=Y-Cr×0.344 14-Cb×0.714 14+128
　B=Y+Cr+Cr×0.772+128
　解碼后的RGB信號直接存入顯示緩存區(qū)，將實時顯示在屏幕的對應(yīng)像素點上，實現(xiàn)邊解碼邊顯示，直到整個圖像全部顯示在屏幕上。解碼效果如圖5所示，解碼優(yōu)化前耗時為30 s，優(yōu)化后耗時為15 s，速度提高了一倍。

　本系統(tǒng)實現(xiàn)了JPEG圖像通過LPC2478解碼顯示在像素為800×600的AA104SG02液晶顯示器上，完成了基于LPC2478的圖像解碼及顯示的硬件設(shè)計，成功將JPEG解碼算法移植到本系統(tǒng)上，優(yōu)化了解碼算法。通過將優(yōu)化后的Huffman解碼與反量化、反Zig-Zag相結(jié)合，減少了乘零運算及數(shù)據(jù)存取操作、降低了內(nèi)存消耗；引入快速IDCT算法，減少了乘法和加法運算次數(shù)；將浮點運算轉(zhuǎn)換為整點運算，加快了運算速度、提高了運算精度。使復(fù)雜的JPEG圖像解碼在主頻并不很高的小型嵌入式產(chǎn)品上得到了很好的實現(xiàn)。本系統(tǒng)可應(yīng)用于控制系統(tǒng)的液晶桌面圖片顯示，為人機交互提供了友好的操作界面。
參考文獻(xiàn)
[1] 張益貞，劉滔.VisualC++.實現(xiàn)MPEG/JPEG編解碼技術(shù)[M].北京：人民郵電出版社，2002.
[2] 薛永林，劉珂，李鳳亭.并行處理JPEG算法的優(yōu)化[J].電子學(xué)報，2002(2).
[3] 董嵐，李麗，張宇昂.基于AMBA2AHB總線多核平臺的JPEG解碼[J].電子測量與儀器學(xué)報，2009，23(2).
[4] NXP Semiconductors. LPC24XX user manual. Rev. 04-26，August， 2009.
[5] Mitsubishi Electric Corp. Telchnical specification Aa104sg01. Mar.9， 2006.
[6] ARAI Y， AGUI T， NAKAJIMA M. A fast DCT-SQ scheme for images[J]. IECE Transactions 1990，71(11)： 1095-1097.

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容