摘 要: 介紹了一種用ARM7實(shí)現(xiàn)JPEG控制解碼的方案,。采用LPC2478軟件解碼JPEG圖像并將圖像實(shí)時(shí)顯示在具有LVDS接口的TFT_LCD顯示器上。在硬件設(shè)計(jì)中,,解決了LVDS信號(hào)與LPC2478的LCD控制器輸出信號(hào)的轉(zhuǎn)換問(wèn)題,,并對(duì)解碼及顯示所需內(nèi)存大小作了詳細(xì)的分析;針對(duì)JPEG解碼中的Huffman解碼,、IDCT變換等步驟提出了優(yōu)化方法,,使解碼速度在一定程度上有了較大的提升,實(shí)現(xiàn)了在主頻不很高的LPC2478上解碼并顯示JPEG圖像,。
關(guān)鍵詞: LPC2478,;LVDS;JPEG,;軟件解碼,;算法優(yōu)化
JPEG作為一種成熟的圖像壓縮標(biāo)準(zhǔn),具有壓縮效率高,、恢復(fù)的圖像質(zhì)量好、易于實(shí)現(xiàn)等優(yōu)點(diǎn)[1],,已經(jīng)得到了廣泛的運(yùn)用,。隨著現(xiàn)代嵌入式技術(shù)的快速發(fā)展,,各類電子產(chǎn)品為了進(jìn)一步降低成本,JPEG技術(shù)也越來(lái)越多地受到各種小型嵌入式產(chǎn)品的青睞,。目前嵌入式系統(tǒng)方面對(duì)JPEG圖像軟件解碼較多地應(yīng)用在DSP和多核等高速處理器上[2-3],。
本文提出一種基于ARM7處理器LPC2478的軟件解碼JPEG方案,同時(shí)將圖像顯示在高分辨率10.4英寸的,、具有LVDS接口的TFT_LCD液晶顯示器AA104SG02上,。
1 硬件設(shè)計(jì)及實(shí)現(xiàn)
以LPC2478為控制核心的小型嵌入式系統(tǒng)硬件實(shí)現(xiàn)框圖如圖1所示。
LPC2478是一款NXP公司生產(chǎn)的基于ARM7的微控制器[4],,擁有豐富的片上資源,,在嵌入式控制領(lǐng)域得到了廣泛的運(yùn)用。LPC2478的內(nèi)核為32 bit的ARM7TDMIS處理器,,CPU工作頻率最高可達(dá)72 MHz,,片上Flash為512 KB,SDRAM為96 KB,,F(xiàn)alsh,、SRAM、SDRAM可擴(kuò)展(SDRAM最大可擴(kuò)展到1 024 MB),,帶SSI,、USB、UART等多種外設(shè)接口,。此外,,LPC2478還帶有LCD控制器,支持TFT及STN顯示模式,。
AA104SG02為三菱公司推出的10.4型SVGA TFT_LCD顯示屏[5],,分辨率為800×600,亮度為400,,對(duì)比度為500:1,,輸入電壓為3.3 V,標(biāo)準(zhǔn)工作頻率為40 MHz,,支持多種數(shù)據(jù)格式,,電氣接口為L(zhǎng)VDS信號(hào)。LVDS信號(hào)是一種能夠滿足大數(shù)據(jù)傳送需求的差分信號(hào)技術(shù),,具有功耗低,、可靠性高及高速傳送等特點(diǎn)。
在LPC2478控制LCD顯示模式下,,LCD顯示數(shù)據(jù)的位寬度為16 bit,,采用數(shù)據(jù)格式為R:G:B=5:6:5。LCD控制器輸出的信號(hào)有RGB數(shù)字信號(hào),、像素點(diǎn)時(shí)鐘(PCLK),、行同步時(shí)鐘(HSYNC),、場(chǎng)同步時(shí)鐘(VSYNC)及其他控制信號(hào),這些信號(hào)均以并行方式輸出,,因此,,LPC2478的LCD控制器的輸出并行信號(hào)與AA104SG02的LVDS信號(hào)不能直接連接,必須在兩者之間加驅(qū)動(dòng)電路,,將并行信號(hào)轉(zhuǎn)換為L(zhǎng)VDS差分信號(hào),。驅(qū)動(dòng)芯片DS90383是一款信號(hào)傳輸轉(zhuǎn)換芯片,可將接收到的TTL/CMOS數(shù)據(jù)轉(zhuǎn)換為L(zhǎng)VDS數(shù)據(jù)流,,支持VGA,、SVGA等更高分辨率,輸入時(shí)鐘為20 MHz~60 MHz,,3.3 V單電源供電,。因此,利用DS90383可實(shí)現(xiàn)兩者之間的信號(hào)轉(zhuǎn)換,。
在液晶控制器中,,需要為顯示數(shù)據(jù)提供相應(yīng)大小的緩存。屏幕為800×600像素,,每個(gè)像素占2 B,,則需要960 000 B的SDRAM作為顯示緩存。此外,,在JPEG解碼過(guò)程中,,需要緩存原始JPEG圖像數(shù)據(jù)、JPEG解碼中間數(shù)據(jù)等,,對(duì)于一幅800×600的JPEG圖片來(lái)說(shuō),,解碼需要2 MB左右的緩存空間。而LPC2478的片上SDRAM遠(yuǎn)遠(yuǎn)不能滿足空間要求,,因此,,本系統(tǒng)外擴(kuò)了一個(gè)32 MB的SDRAM。與此同時(shí),,考慮到在實(shí)際應(yīng)用中需要更換不同的顯示圖片,,但又不可能把很多幅圖片都存儲(chǔ)在芯片內(nèi),為此,,還外接了一個(gè)大容量SD卡,。當(dāng)需要顯示某個(gè)圖片時(shí),LPC2478可從SD卡中讀取圖片,,解碼后顯示在LCD上,。
2 JPEG軟件解碼算法優(yōu)化及實(shí)現(xiàn)
JPEG解碼技術(shù)主要包括獲取圖像基本信息、建立解碼碼表,、Huffman解碼,、反量化,、反Zig-Zag,、IDCT及顏色空間轉(zhuǎn)換,。JPEG解碼流程圖如圖2所示。
2.1 圖像基本信息獲取
在JPEG圖像解碼之前,,需要通過(guò)JPEG文件獲取圖像解碼時(shí)所需的各種信息,,包括圖像的大小、采樣因子,、量化表以及Huffman表等,。由于JPEG文件的存儲(chǔ)格式為JFIF格式(主要為標(biāo)記碼和壓縮數(shù)據(jù)),因此,,可以根據(jù)不同的標(biāo)記碼獲得相應(yīng)的信息,。在掃描開始(SOS)標(biāo)記段結(jié)束后才是真正的圖像壓縮數(shù)據(jù)流。
2.2 解碼碼表建立
在Huffman解碼前,,要建立解碼碼表,。對(duì)于一幅圖像,一般有4個(gè)Huffman表(直流0號(hào)表,、直流1號(hào)表,、交流0號(hào)表、交流1號(hào)表),,每個(gè)碼表都建立各自的三張解碼碼表,,分別為:不同位數(shù)的碼字的數(shù)量表(Code_bitsnum_table)、碼權(quán)值表(Code_weight_table),、碼字表(Code_value_table),。不同位數(shù)碼字的數(shù)量表和碼權(quán)值表可直接從Huffman表中獲得。而碼字表則是通過(guò)Huffman表建立Huffman樹獲得,,且碼字均自動(dòng)按從小到大排列,,而且沒(méi)必要保存每個(gè)碼字的長(zhǎng)度(以下簡(jiǎn)稱碼長(zhǎng))。因?yàn)槊總€(gè)碼長(zhǎng)可由不同位數(shù)碼字的數(shù)量表與碼字表推算而得,。建立碼字表的流程圖如圖3所示,。
圖中,L表示碼字的位數(shù)(最長(zhǎng)為16 bit),;huffnum為Huffman表的序號(hào),;Read_Byte()為讀取Huffman表的值,表示對(duì)應(yīng)L位碼字的個(gè)數(shù),,如果等于0,,表示沒(méi)有L位的碼字。第一個(gè)碼字值必定為0,,若有K個(gè)碼字位數(shù)相同,,則當(dāng)前碼字為它前面的碼字加1,;但如果它的位數(shù)比它前面的碼字位數(shù)大,則當(dāng)前碼字是前面碼字加1后再在后面添若干個(gè)0,,直到滿足位數(shù)長(zhǎng)度位置為止,。
2.3 Huffman解碼優(yōu)化
在JPEG文件中,圖像壓縮數(shù)據(jù)流是逐位存儲(chǔ)的,,因此解碼時(shí)也必須逐位地讀入,。Huffman解碼的過(guò)程主要是解碼碼表的查找過(guò)程。簡(jiǎn)單的解碼方法為直接查找解碼碼表直到找到正確的Huffman碼,,此時(shí),,逐位移入碼流獲得的編碼值都需要從解碼碼表的頭開始查找,比較碼字是否相同,、碼長(zhǎng)是否相等,。這將需要大量的存取操作,不僅會(huì)增加代碼量,,同時(shí)還將耗費(fèi)較多的CPU時(shí)間,。
為降低代碼開銷及盡可能減少CPU時(shí)間,本文對(duì)該解碼過(guò)程進(jìn)行了優(yōu)化,。獲得編碼值及編碼值長(zhǎng)度后,,根據(jù)不同位數(shù)碼字的數(shù)量表可直接定位到碼字表中第一個(gè)碼長(zhǎng)相等的碼字,若編碼值不小于該碼字且不大于相同碼長(zhǎng)的碼字的最大值,,則可以找到與編碼值相同的碼字,;否則不能找到,須重新獲得新的編碼值后再按上述步驟查找,。根據(jù)查找出的相同的碼字在碼字表中的位置,,由碼權(quán)值表獲得該碼字的權(quán)值。當(dāng)這個(gè)碼字為直流碼字時(shí),,權(quán)值的大小即為直流分量數(shù)值的二進(jìn)制位數(shù),,再根據(jù)Huffman直流譯碼表譯碼;當(dāng)這個(gè)碼字為交流碼字時(shí),,權(quán)值的高4位表示當(dāng)前值前面有多少個(gè)連續(xù)的0,,低4位為該交流分量數(shù)值的二進(jìn)制位數(shù),再根據(jù)Huffman交流譯碼表譯碼,。優(yōu)化后的一次Huffman解碼流程圖如圖4所示,。
在JPEG文件中存儲(chǔ)了兩張量化表,分別為亮度量化表和色度量化表,。反量化運(yùn)算過(guò)程即為經(jīng)Huffman解碼得到的系數(shù)矩陣與相應(yīng)的量化矩陣相乘,。由于數(shù)據(jù)是按8×8矩陣的“之”字行排列,所以要對(duì)反量化運(yùn)算的結(jié)果進(jìn)行反Zig-Zag操作。
在解碼8×8的數(shù)據(jù)塊過(guò)程中發(fā)現(xiàn),,右下角的高頻分量存在大量的0,。如果完成Huffman解碼之后,再進(jìn)行反量化及反Zig-Zag排序,,必然存在許多乘0運(yùn)算及重復(fù)的數(shù)據(jù)存取操作,,而且同時(shí)必須至少開辟兩塊8×8大小的SDRAM來(lái)存儲(chǔ)這些數(shù)據(jù),這樣不僅浪費(fèi)了時(shí)間也浪費(fèi)了空間,,不利于在小型嵌入式系統(tǒng)上的應(yīng)用,。因此,采取Huffman解碼,、反量化及反Zig-Zag三步合一的優(yōu)化措施,Huffman解碼出一個(gè)值后立即進(jìn)行反量化,、反Zig-Zag操作,。但為了對(duì)應(yīng)原來(lái)的存儲(chǔ)順序,需要建立這樣一個(gè)對(duì)應(yīng)存儲(chǔ)位置的數(shù)組:
2.4 IDCT及浮點(diǎn)轉(zhuǎn)整點(diǎn)運(yùn)算
在圖形解碼運(yùn)算中,,IDCT變換是主要運(yùn)算,,占用大量的CPU時(shí)間。若直接進(jìn)行IDCT變換計(jì)算,,一次二維IDCT變換需要1 024次乘法和896次加法,,這樣,在ARM7上解碼800×600大小圖像會(huì)相當(dāng)慢,,因此要提高解碼效率,,必須利用IDCT的快速算法。為此,,本文采用了參考文獻(xiàn)[6] ARAZ等人提出的IDCT快速算法,。該算法的主要思想是:
(1)將二維的IDCT分解為兩個(gè)一維的IDCT降維處理,先后在行方向,、列方向上做IDCT變換,。
(2)IDCT通過(guò)數(shù)學(xué)變換轉(zhuǎn)化為離散傅里葉逆變換(IDFT),然后利用矩陣變換簡(jiǎn)化計(jì)算,。
(3)減少乘法和加法運(yùn)算次數(shù),。其結(jié)果是完成一次2D-IDFT僅需要10次乘法和29次加法。
原IDCT變換運(yùn)算過(guò)程包含了5步計(jì)算,,而本系統(tǒng)將其簡(jiǎn)化為3步,,最大限度地減少數(shù)據(jù)存取操作次數(shù)。三角函數(shù)及一些固定的系數(shù)采用查表方式,,除法運(yùn)算的除數(shù)均為2的n次冪,,可直接轉(zhuǎn)換為右移操作,以減少計(jì)算量。但乘法和加法運(yùn)算均為有符號(hào)浮點(diǎn)運(yùn)算,,而ARM7只支持整點(diǎn)運(yùn)算,,因此還需要將浮點(diǎn)運(yùn)算轉(zhuǎn)化為整點(diǎn)運(yùn)算。
在IDCT運(yùn)算中,,大部分的浮點(diǎn)乘法運(yùn)算為一個(gè)數(shù)乘以一個(gè)余弦值(即乘數(shù)小于1),,根據(jù)這個(gè)特點(diǎn),本文設(shè)計(jì)了如下浮點(diǎn)轉(zhuǎn)整點(diǎn)運(yùn)算方法:
(1)將浮點(diǎn)數(shù)乘以256,,得到的32位整點(diǎn)數(shù)格式為0xXXXXXX XX,,高24位保留了浮點(diǎn)的整數(shù)部分及符號(hào)位,低8位保留到了小數(shù)部分的第4位,。
(2)乘法運(yùn)算:被乘數(shù)轉(zhuǎn)化為如上格式的32位整數(shù)(如0xAAAAAABB),,乘數(shù)要求小于1。轉(zhuǎn)化后為8位整數(shù),,如0xCC,。為了防止溢出,乘法運(yùn)算做如下更改:
0xAAAAAABB×0xCC=(0xAAAAAA×0xCC)+((0xBB×0xCC)>>8)
該方法能確保整個(gè)運(yùn)算過(guò)程中數(shù)據(jù)不溢出,。
2.5 色彩空間轉(zhuǎn)換
通過(guò)解碼出來(lái)的Y(亮度)CrCb(色度)信號(hào),,要在屏幕上顯示圖像,還必須轉(zhuǎn)化為RGB信號(hào),。其轉(zhuǎn)換公式為:
R=Y+1.402×Cb+128
G=Y-0.344 14×Cr-0.714 14×Cb+128
B=Y+1.772×Cr+128
計(jì)算時(shí),,乘法運(yùn)算使用上述的浮點(diǎn)轉(zhuǎn)整點(diǎn)運(yùn)算法則,但需要作如下修改:
R=Y+Cb+Cb×0.402+128
G=Y-Cr×0.344 14-Cb×0.714 14+128
B=Y+Cr+Cr×0.772+128
解碼后的RGB信號(hào)直接存入顯示緩存區(qū),,將實(shí)時(shí)顯示在屏幕的對(duì)應(yīng)像素點(diǎn)上,,實(shí)現(xiàn)邊解碼邊顯示,直到整個(gè)圖像全部顯示在屏幕上,。解碼效果如圖5所示,,解碼優(yōu)化前耗時(shí)為30 s,優(yōu)化后耗時(shí)為15 s,,速度提高了一倍,。
本系統(tǒng)實(shí)現(xiàn)了JPEG圖像通過(guò)LPC2478解碼顯示在像素為800×600的AA104SG02液晶顯示器上,完成了基于LPC2478的圖像解碼及顯示的硬件設(shè)計(jì),,成功將JPEG解碼算法移植到本系統(tǒng)上,,優(yōu)化了解碼算法。通過(guò)將優(yōu)化后的Huffman解碼與反量化,、反Zig-Zag相結(jié)合,,減少了乘零運(yùn)算及數(shù)據(jù)存取操作、降低了內(nèi)存消耗,;引入快速IDCT算法,,減少了乘法和加法運(yùn)算次數(shù);將浮點(diǎn)運(yùn)算轉(zhuǎn)換為整點(diǎn)運(yùn)算,加快了運(yùn)算速度,、提高了運(yùn)算精度,。使復(fù)雜的JPEG圖像解碼在主頻并不很高的小型嵌入式產(chǎn)品上得到了很好的實(shí)現(xiàn)。本系統(tǒng)可應(yīng)用于控制系統(tǒng)的液晶桌面圖片顯示,,為人機(jī)交互提供了友好的操作界面,。
參考文獻(xiàn)
[1] 張益貞,劉滔.VisualC++.實(shí)現(xiàn)MPEG/JPEG編解碼技術(shù)[M].北京:人民郵電出版社,,2002.
[2] 薛永林,,劉珂,李鳳亭.并行處理JPEG算法的優(yōu)化[J].電子學(xué)報(bào),,2002(2).
[3] 董嵐,,李麗,張宇昂.基于AMBA2AHB總線多核平臺(tái)的JPEG解碼[J].電子測(cè)量與儀器學(xué)報(bào),,2009,,23(2).
[4] NXP Semiconductors. LPC24XX user manual. Rev. 04-26,August,, 2009.
[5] Mitsubishi Electric Corp. Telchnical specification Aa104sg01. Mar.9, 2006.
[6] ARAI Y,, AGUI T,, NAKAJIMA M. A fast DCT-SQ scheme for images[J]. IECE Transactions 1990,71(11): 1095-1097.