圖像數(shù)據(jù)的混沌模式的提取與表達-AET-電子技術應用

圖像數(shù)據(jù)的混沌模式的提取與表達

2016年微型機與應用第18期

于碩1，李思思1，于萬波2

1. 大連財經(jīng)學院工商管理學院，遼寧大連 116600；2. 大連大學信息工程學院，遼寧大連 116622

摘要： 研究以離散余弦變換（DCT）基函數(shù)作為輔助函數(shù)，結合序列灰度圖像構造動力系統(tǒng)，然后迭代得到軌跡點集合（近似的吸引子）；使用該吸引子能夠?qū)⒁曨l圖像的不同場景鑒別出來，用于視頻分段裁剪等。使用多個DCT基函數(shù)矩陣，分別與一個圖像構造動力系統(tǒng)，生成多個近似吸引子，這些吸引子可以作為圖像的特征，用于圖像識別，也可以重構原圖像。

關鍵詞： 圖像數(shù)據(jù) 混沌吸引子離散余弦變換基函數(shù)

Abstract：

Key words :

　　1，李思思1，于萬波2

　　（1. 大連財經(jīng)學院工商管理學院，遼寧大連 116600；2. 大連大學信息工程學院，遼寧大連 116622）

摘要：研究以離散余弦變換（DCT）基函數(shù)作為輔助函數(shù)，結合序列灰度圖像構造動力系統(tǒng)，然后迭代得到軌跡點集合（近似的吸引子）；使用該吸引子能夠?qū)⒁曨l圖像的不同場景鑒別出來，用于視頻分段裁剪等。使用多個DCT基函數(shù)矩陣，分別與一個圖像構造動力系統(tǒng)，生成多個近似吸引子，這些吸引子可以作為圖像的特征，用于圖像識別，也可以重構原圖像。

　　關鍵詞：圖像數(shù)據(jù)；混沌吸引子；離散余弦變換基函數(shù)

0引言

　　目前，大數(shù)據(jù)是許多學科領域的研究焦點［13］。大數(shù)據(jù)細節(jié)較多且無規(guī)則，不易用現(xiàn)有的數(shù)學方法、計算機工具等進行描述和處理［46］。混沌現(xiàn)象是非線性科學固有的、內(nèi)在的、普遍的現(xiàn)象，盡管有些研究人員認為混沌是未來數(shù)據(jù)處理與表達的合適的工具，但是，目前把混沌理論與方法用到大數(shù)據(jù)處理與表達等并不多見。

　　圖像數(shù)據(jù)是大數(shù)據(jù)的一種，具有可視性、復雜性、冗余性、規(guī)則性、隨機性、人腦的可理解性等諸多特點［1,46］。對圖像的理解、基于知識的存儲、基于內(nèi)容的檢索、視頻數(shù)據(jù)分析等還有很多問題有待解決。對于是否可以用混沌理論與方法處理圖像、識別圖像，查找相關文獻發(fā)現(xiàn)了一些這方面的工作，例如LEE C S與ELGAMMAT A用非線性模型來表示人臉等［78］。基于非線性理論的方法作為一種新的特征表達方式，也已經(jīng)開始初步應用于圖像研究領域。

　　參考文獻［9］、［10］的研究結果顯示，以類似于文獻［9］、［10］中的函數(shù)作為輔助函數(shù)，與其他（要處理的）函數(shù)或者矩陣構造動力系統(tǒng)，迭代后就可以產(chǎn)生（近似的）混沌吸引子，該吸引子形狀隨著動力系統(tǒng)參數(shù)的改變而改變，被處理函數(shù)的改變（圖像形狀）越小，其吸引子的輪廓形狀改變就越小。基于此，文獻［11］、［12］將正弦函數(shù)作為輔助函數(shù)，圖像作為被處理函數(shù)，構造動力系統(tǒng)，迭代后得到的吸引子作為圖像特征，繼而用這種方法提取人臉圖像特征，識別人臉，取得了較好的結果。

　　在參考文獻［13］中，使用離散余弦變換（DCT）基函數(shù)矩陣作為輔助函數(shù)，將圖像作為被處理函數(shù)，提取吸引子作為圖像特征。因為DCT基函數(shù)更加震蕩，具有更好的混沌特性，所以生成吸引子的質(zhì)量更好。又因為DCT基函數(shù)數(shù)量眾多，有更多的選擇，所以，與正弦函數(shù)等相比，更適合于作為輔助函數(shù)。本文研究使用DCT基函數(shù)矩陣作為輔助函數(shù)，與視頻圖像構造動力系統(tǒng)，發(fā)現(xiàn)不同場景得到的吸引子不同，同時發(fā)現(xiàn)，使用多個吸引子可以重構圖像。

　　下文中提到的吸引子都是指近似的混沌吸引子，或者說是動力系統(tǒng)的迭代軌跡。

1動力系統(tǒng)構造與迭代方法

　　下面使用DCT基函數(shù)矩陣與圖像矩陣構造動力系統(tǒng)。DCT基函數(shù)矩陣的定義如下：

　 QQ圖片20161012161527.png

　　其中, 0≤p≤M－1,0≤q≤N－1，

　　 QQ圖片20161012161530.png

　　固定p,q后, R(m,n)都可以看作是以m,n為自變量的二元離散函數(shù)。這里令m,n,p,q均為正整數(shù)。隨著p,q的變化, 基函數(shù)（矩陣）也隨之變化, 共M×N個，選取一個，與灰度圖像矩陣構造動力系統(tǒng)，如式（2）所示：

　　 QQ圖片20161012161533.png

　　式（2）中，f(x,y)表示離散余弦基函數(shù)矩陣，g(x,y)表示灰度圖像矩陣。

　　算法1利用DCT基函數(shù)與圖像構造動力系統(tǒng)，然后迭代，生成迭代序列

　　（1）給定p,q的值以及M，N的值，此處取M=N=256。

　　（2）計算DCT基函數(shù)矩陣A，并用插值方法將其元素值調(diào)整到1~256之間。

　　（3）讀入圖像，適當裁剪邊緣，以便生成質(zhì)量更好的吸引子。

　　（4）將裁剪后的圖像調(diào)整到M×N大小，記為H；將圖像調(diào)整為1~256大小是為了使其與像素值一致，便于下面的迭代操作。

　　（5）給定初始迭代值（u,v），代入矩陣B，即把（u,v）作為下標，取出矩陣B在（u,v）的元素值，記為z1；再將初始迭代值（u,v）代入矩陣H，即把（u,v）作為下標，取出矩陣H在（u,v）的元素值，記為z2。

　　(6）將（z1,z2）的值賦值給（u,v），將每次的（z1,z2）記載下來，然后轉到步驟(5）。

　　(7）將第（6）步重復執(zhí)行n次。

2視頻圖像特征提取

　　例如，使用DCT基函數(shù)作為輔助函數(shù)，對一視頻圖像進行處理，即按照一定時間間隔從視頻圖像中取出圖像，與DCT基函數(shù)構成動力系統(tǒng)，使用算法1，迭代生成吸引子，不同場景下的視頻圖像其吸引子區(qū)別也比較大，如圖1所示。

圖像 001.png

　　圖1中的圖像取自于一段視頻。一般情況下，越復雜的圖像，越容易產(chǎn)生吸引子。

　　算法2視頻圖像場景變化檢測

　　(1）給定p,q的值，給定M，N的值，生成基函數(shù)矩陣A，將矩陣A的值調(diào)整為1~M，此處M、N的值視圖像而定，例如M為每幀圖像的高，N為寬。

　　(2）讀入視頻圖像的三幀，轉變?yōu)榛叶葓D像，將圖像的灰度值調(diào)整為1~N，記做B；分別與矩陣A構成動力系統(tǒng)，迭代生成近似吸引子，記做T1、T2、T3。

　　(3）將T1、T2、T3進行二維傅里葉變換，得到變換后的矩陣F1、F2、F3。

　　(4）計算F1、F2的相關系數(shù)，記為C1；再計算F2、F3的相關系數(shù)，記為C2。

　　(5）計算C1與C2差值絕對值D1，C2與C3的差值絕對值D2。

　　(6）如果D1遠小于D2，那么T1、T2場景相同，T2、T3場景不同；如果D1與D2的差值較小，那么T1、T2、T3場景相同。

3圖像的分解與重構

　　下面使用多個DCT基函數(shù)矩陣，分別與一個圖像構造動力系統(tǒng)，生成多個近似吸引子，然后再使用這些吸引子，重構原圖像。

　　以Lena圖像作為被處理函數(shù)，為了便于分析，對Lena圖像進行了截取；與256×256的DCT基函數(shù)矩陣構造動力系統(tǒng)，p,q的值分別為（2,2）、（3,3）、（4,4）、（5,5）、（6,6）、（7,7），使用算法1，得到的近似吸引子點陣如圖2所示。

　　DCT基函數(shù)矩陣M=256,N=256, (p,q) 的值分別為(2,2),

　　(3,3),(4,4),(5,5),(6,6), (7,7),圖像使用Lena圖像

圖像 002.png

　　吸引子用二維點集的形式表現(xiàn)，但是如果記錄下這些點的先后順序，便可以表達（記載）圖像的灰度信息。圖3

圖像 003.png

就是根據(jù)吸引子點產(chǎn)生的先后順序，將二維吸引子轉化為三維點陣；（x,y）是圖像的像素位置，z軸是圖像的灰度值。這些位置與灰度值來源于圖像，可以表達圖像的某種特征，也可以近似復原圖像。

　　利用圖3所示的吸引子三維點陣，可以近似復原圖像。例如，使用語句for p=1 to 2, for q=1 to 2，嵌套循環(huán)，即利用(p,q)為(1,1)，(1,2)，(2,1)，(2,2)這4個DCT基函數(shù)矩陣，復原后效果如圖4（a）所示；利用for p=1 to 5, for q=1 to 5嵌套循環(huán)，得到25個DCT基函數(shù)矩陣，復原效果如圖4（b）所示；利用10×10=100個吸引子復原效果如圖4（c）所示；利用15×15,30×30,40×40個吸引子的復原效果分別如圖4（d）、（e）、（f）所示。

圖像 004.png

　　在圖像復原的時候，如果繪制出一個點，將這個點的周圍點也繪制出來，可以加速圖像復原。例如，當每次繪制周圍的3×3個點時，使用前100個（p,q）就可以繪制出如圖5（a）所示效果，與圖4（c）相比，復原效果更好。如果繪制每點周圍5×5個點，那么使用前49個（p,q）就可以復原出如圖5（b）所示效果。

圖像 005.png

　　49個近似吸引子疊加在一起，能夠重構圖像輪廓；這意味著49個稀疏的三維數(shù)組代表著一個Lena圖像；需要的時候組合，不需要的時候可以分散放到吸引子庫中。

4結論

　　在已有文獻的基礎上，將輔助函數(shù)改為離散余弦變換基函數(shù)，與圖像構造動力系統(tǒng)，得到的近似吸引子可以作為視頻圖像分割的依據(jù)。這種方法與其他圖像特征提取方法存在著本質(zhì)上的不同。

　　視頻圖像數(shù)據(jù)是一種大數(shù)據(jù)，既然這種方法可以應用于圖像處理、圖像模式提取，那么也可以經(jīng)過改進后，用于其他數(shù)據(jù)處理。

　　進一步的工作是，改進這種數(shù)據(jù)存儲與表達方式，嘗試建立一種新的索引方式，即點陣與概念索引方式。例如“臉”這個概念，是否對應著“高一級”的點陣，即吸引子點陣的一種索引結構。

　　這是一種特征提取與存儲方法，是否可以成為一種數(shù)據(jù)分解與重構的方法還有待于進一步研究。

　　參考文獻

　　［1］ KOMMINENI J, SATRIA M, MOHD S S. Content based image retrieval using colour strings comparison［J］. Procedia Computer Science, 2015，50：374 379.

　　［2］ Wu Fei, Wang Zhuhao, Zhang Zhongfei, et al. Weakly semi-supervised deep learning for multi-label image annotation［J］. IEEE Transactions on Big Data, 2015(1)：109 122.

　　［3］ TEMESGUEN M, RUSSEL C H, TIMOTHY R T. Segmentation of pulmonary nodules in computed tomography using a regression neural network approach and its application to the lung image database consortium and image database resource initiative dataset［J］. Medical Image Analysis, 2015, 22(1)：48 62.

　　［4］ Tian Xinmei, Lu Yijuan, STENDER N, et al. Exploration of image search results quality assessment［J］. IEEE Transactions on Big Data, 2015,1(3)：95 108.

　　［5］ ZANG M, WEN D, WANG K, et al. A novel topic feature for image scene classification［J］. Neurocomputing, 2015, 148(1)：467 476.

　　［6］ WEINMANN M, URBAN S, HINZ S, et al. Distinctive 2D and 3D features for automated large-scale scene analysis in urban areas［J］. Computers & Graphics, 2015, 49(7)：47 57.

　　［7］ Yuan Yuan, Wan Jia, Wang Qi. Congested scene classification via efficient unsupervised feature learning and density estimation［J］. Pattern Recognition, 2016, 56：159 169.

　　［8］ Lin Liang, Wang Xiaolong, Yang Wei, et al. Discriminatively trained andor graph models for object shape detection［J］IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, 37(5)：959 972.

　　［9］于萬波, 趙斌. 曲面迭代混沌特性研究［J］物理學報, 2014，63(12)：29 39.

　　［10］于萬波. 截面的幾何形狀決定三維函數(shù)的混沌特性［J］. 物理學報, 2014(12)：20-28.

　　［11］于萬波, 王大慶. 圖像函數(shù)與三角函數(shù)迭代的混沌特性研究［C］. 第17屆全國圖象圖形學學術會議論文集，北京: 北京交通大學出版社, 2014.

　　［12］于萬波, 王大慶. 曲面迭代混沌特性及其在人臉識別中的應用［J］. 計算機輔助設計與圖形學學報, 2015，27(12)：2264 2271.

　　［13］于萬波. 混沌的計算分析與探索［M］. 北京：清華大學出版社，2016.

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權禁止轉載。

相關內(nèi)容