文獻(xiàn)標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.2016.12.013
中文引用格式: 楊茹,,秦振濤,楊武年. 基于字典學(xué)習(xí)的古建筑圖像修復(fù)研究[J].電子技術(shù)應(yīng)用,,2016,,42(12):51-53,57.
英文引用格式: Yang Ru,,Qin Zhentao,,Yang Wunian. Study on inpainting of drawings of ancient buildings based on dictionary learning[J].Application of Electronic Technique,2016,,42(12):51-53,,57.
0 引言
古代建筑圖紙能夠反映古人對建筑獨特的認(rèn)識與理解,,不僅具有極高的歷史價值,、文化價值和科學(xué)價值,同時也是現(xiàn)代仿古建筑,、園林景觀和旅游景區(qū)的重要借鑒[1],。建筑圖紙的質(zhì)地、圖形,、字體及涂料具有多樣性,,需要特別的保護(hù)。當(dāng)前,,在實際的工作環(huán)境中,,大部分建筑圖紙以卷宗的形式進(jìn)行保存,隨著時間的變遷,,建筑圖紙的缺損非常嚴(yán)重,,且在掃描、微縮處理中,,圖紙的像素丟失嚴(yán)重,。對建筑圖紙進(jìn)行修復(fù)、評估及再利用,,一直作為建筑學(xué)科及計算機(jī)圖像處理等領(lǐng)域的研究熱點而受到關(guān)注[2],。僛文峰等人指出圖紙的破損主要是由于圖紙質(zhì)地的酸性化而變黃、發(fā)干, 以及隨之而來的粉碎和撕毀情況比較嚴(yán)重,;由于時間久遠(yuǎn),,圖紙質(zhì)地及顏料也會出現(xiàn)不同程度的缺損、黃色斑點等破損,;在對古建筑圖紙進(jìn)行信息化加工的過程中也會造成像素的丟失,,出現(xiàn)黑色斑點等。本文針對掃描及微縮以后的古建筑圖像提出一種新的基于字典學(xué)習(xí)的修復(fù)方法,,該算法在稀疏域針對污損圖像的特迭代處理,,從而達(dá)到古建筑圖紙修復(fù)的目的。通過實驗表明,,該算法能較好地修復(fù)古建筑圖像,,降低了圖像的均方誤差,在實際應(yīng)用中具有良好的前景,。
1 古建筑圖像修復(fù)模型
1.1 基于稀疏表示的古建筑圖像處理模型
在圖像處理領(lǐng)域[3],,任一理想的古建筑圖像可以表示為y0∈RN,稀疏表示的目標(biāo)是找到一個稀疏表示向量x0,且x0的0范數(shù)||x0||0=k0,,滿足:y0=Ax0。A為字典,,B為圖像退化算子,,表示圖像丟失掉的p個采樣,則:y=By0,。B表示單位矩陣(大小為:n×n)根據(jù)丟失掉的(缺損)采樣去除p行后的矩陣,,其大小為(n-p)×n,則古建筑圖像修復(fù)問題就轉(zhuǎn)化為求其稀疏表示向量進(jìn)而獲得未降質(zhì)圖像
則可以建模為式(1)[4]:
1.2 對模型的求解
該問題中由于原始古建筑圖像y0未知,,且古建筑圖像一般較大,,存在多種類型的缺損,因此需要對大的圖像進(jìn)行分塊,。根據(jù)給定的字典A,,將大的圖像分割成一些小的塊后,每個塊都有其稀疏表示系數(shù),,降質(zhì)操作B為一矩陣,,根據(jù)Elad等人的原理,該問題屬于M-稀疏域模型,,則可以轉(zhuǎn)化如下最大后驗概率問題[5]:
下一部分獲得該模型中字典A的求解,,通過式(5)能夠獲得輸出圖像,對丟失掉的像素,,通過塊中已知像素進(jìn)行平均獲得,。
2 字典學(xué)習(xí)算法
字典學(xué)習(xí)過程一般分為2個階段,分別是稀疏編碼及字典更新,。在對式(5)求解時,,一般假設(shè)字典A∈Rn×k(k>n)為已知,如DCT,、DWT和FFT等,。為了進(jìn)一步提高修復(fù)古建筑圖像的修復(fù)能力,本文分別通過MOD算法和K-SVD算法進(jìn)行字典學(xué)習(xí),,在字典學(xué)習(xí)過程中需考慮缺損像素,。因此,一旦獲得字典,,就可以完成稀疏編碼,,然后固定系數(shù),再更新字典,,從而轉(zhuǎn)化為求式(6)錯誤的最小值:
2.1 MOD字典學(xué)習(xí)算法
MOD算法(Method of Optimal Direction)也稱為最優(yōu)方向法[6],,該算法由K.Engan等人在1999年提出,通過對錯誤求導(dǎo),然后令其為0,,則可得:
2.2 改進(jìn)的K-SVD字典學(xué)習(xí)算法
本文根據(jù)缺損的古建筑圖像進(jìn)行K-SVD字典學(xué)習(xí),,利用K-SVD算法[7]每次更新字典A的一列,,對字典的第j列aj,根據(jù)式(6),,僅有第k塊用到了這個原子,,將其表示為域Pk,則可將式(6)進(jìn)行如下轉(zhuǎn)化:
將圖像塊合并后輸出即可獲得最終修復(fù)圖像,,經(jīng)過字典學(xué)習(xí)后獲得的MOD字典及K-SVD字典如圖1和圖2所示,。由圖可見,K-SVD字典包含了缺損圖像形變區(qū)的原子,,表明K-SVD字典能夠根據(jù)圖像的特點進(jìn)行自適應(yīng)調(diào)整,,從而保留更多的細(xì)節(jié)和邊緣信息,更加有利于后續(xù)的處理,。
2.3 算法分析
該算法的計算復(fù)雜度可以分為兩部分:稀疏編碼,、字典更新(迭代J次)與最終的輸出過程構(gòu)成。古建筑圖像中的每個像素點的計算復(fù)雜度為:O(K×L×J),,其中,,K為字典的列向量的個數(shù),L為每個系數(shù)的非零元素的個數(shù),,一般取決于古建筑圖像的噪聲的方差和缺損像素的個數(shù),。
3 模擬實驗
對本文提出算法的性能進(jìn)行測試,實驗用古建筑圖像稱為重檐四角亭,,來源于成都理工大學(xué),;圖像的大小為256×256。實驗所使用的PC是CPU 3.0 GHz,,內(nèi)存為2 GB,,算法用GNUOctave進(jìn)行實現(xiàn)。圖3分別為加噪20 dB后,,損失50%像素后的原始古建筑圖像,,以及采用MOD字典學(xué)習(xí)算法的修復(fù)結(jié)果和采用K-SVD字典學(xué)習(xí)算法的修復(fù)結(jié)果圖。設(shè)置字典原子的個數(shù)為256,,圖像塊大小為8×8,。圖4為隨著迭代次數(shù)的增加,MOD字典學(xué)習(xí)算法和K-SVD字典學(xué)習(xí)算法的修復(fù)效果對比圖,。表1為采用MOD字典學(xué)習(xí)算法和K-SVD字典學(xué)習(xí)算法迭代15次后所獲得的RMSE(均方根誤差),。由圖3可見,采用K-SVD算法修復(fù)的效果明顯優(yōu)于采用MOD算法修復(fù)的效果,,尤其是右上角塔頂處的局部放大圖所示,。
本實驗中運用K-SVD字典學(xué)習(xí)算法實現(xiàn)了對古建筑圖像的修復(fù),由圖4可見,K-SVD字典學(xué)習(xí)算法的修復(fù)效果優(yōu)于MOD字典學(xué)習(xí)算法,,且 K-SVD算法的魯棒性更強,。
4 結(jié)論
本文通過對缺損古建筑圖像問題進(jìn)行建模,然后利用字典學(xué)習(xí)算法實現(xiàn)對缺損圖像的修復(fù),。通過對重檐四角亭古建筑圖像進(jìn)行修復(fù)試驗,,表明K-SVD字典學(xué)習(xí)算法具有更優(yōu)的效果。本文利用機(jī)器學(xué)習(xí)及圖像處理技術(shù)對解決古建筑圖紙,、古文獻(xiàn)修復(fù)等問題提出了新的思路,對該算法的優(yōu)化和應(yīng)用的拓展是下一步研究的重點,。
參考文獻(xiàn)
[1] 王茹.古建筑數(shù)字化及三維建模關(guān)鍵技術(shù)研究[D].西安:西北大學(xué),,2010.
[2] 李四明.工程圖紙輸入與自動識別系統(tǒng)的研究[D].北京:中國農(nóng)業(yè)大學(xué),2000.
[3] N Metaxas D,,AXEL L.Recent novel methods and approaches in sparsity-based compressive sensing and sparse learning have shown promising results. Introduction[J].Med Image Anal,,2014,18(6):819.
[4] ELDAR Y C.Compressed sensing:theory and applications[M].Cambridge University Press,,2012:556.
[5] ELAD M,,AHARON M.Image denoising via sparse and redundant representations over learned dictionaries[J].IEEE Transactions Image Process,2006,,15(12):3736-3745.
[6] OLSHAUSEN B A,,F(xiàn)IELD D J.Sparse coding with an overcomplete basis set: a strategy employed by V1[J].Vision Research,1997,,37(23):3311-3325.
[7] RUBINSTEIN R,,PELEG T,ELAD M.Analysis K-SVD:a dictionary-learning algorithm for the analysis sparse model[J].IEEE Transactions on Signal Processing,,2013,,61(3):661-677.