文獻標識碼: A
文章編號: 0258-7998(2014)11-0120-03
0 引言
傳統(tǒng)的昆蟲識別主要是通過專家觀察昆蟲的外部特征并與標準的樣本進行鑒別,工作量大,。為科學準確地識別害蟲與預防蟲害,,利用計算機模式識別可有效地管理昆蟲圖像數(shù)據(jù)庫?;趦?nèi)容的圖像檢索自動提取昆蟲的底層與高層特征,匹配視覺特征,,將相似性較大的圖像反饋給用戶,,不僅較少了工作量,且提高了檢索精度,。
顏色特征作為重要的圖像視覺特征之一,,其不受圖像的尺寸、平移,、旋轉(zhuǎn)的影響,。提取顏色特征的方法相對容易,研究者提出了基于顏色特征的諸多算法[1],,如顏色直方圖,、顏色矩、顏色熵,、顏色聚合向量,、顏色相關圖等。顏色特征檢索方法只是基于內(nèi)容圖像檢索的一種方法, 在實際應用中應與其他特征檢索方法相結(jié)合, 檢索效果會更佳[2],。紋理特征是圖像另一個重要特征,,不僅體現(xiàn)了灰度值間的相互關系,而且反映出紋理變化規(guī)律的周期性,,成為分析圖像特征的重要方法,。單一特征片面地描述圖像信息,丟失了圖像的部分信息,檢索通用性差,,檢索效果不好[3],。采用綜合特征提取圖像視覺特征,可有效地改善檢索效果,,更加符合人的視覺要求,。本文首先實現(xiàn)了顏色特征和紋理特征的SVM圖像檢索仿真,在此基礎上結(jié)合圖像分塊,,實現(xiàn)三者結(jié)合的SVM圖像檢索仿真,。
1 算法描述
1.1 顏色矩
顏色矩于1995年被Stricker和Orengo提出,是一種簡單且有效的圖像顏色特征描述方法,。圖像的顏色分布信息主要集中在低階矩中,,采用顏色直方圖的一階矩、二階中心矩和三階中心矩就可以表達圖像的顏色特征[4],。
其中,,hij表示第i個顏色通道分量中灰度為j的像素出現(xiàn)的概率,n表示灰度級,。
1.2 灰度共生矩陣
灰度共生矩陣方法是公認的有效方法,,具有較強的適應能力和魯棒性[5]。
假設f(x,,y)為一幅灰度圖像,,對圖像中任一區(qū)域R,定義S為區(qū)域中具有特定空間聯(lián)系的像素對的集合,,則灰度共生矩陣可表示為:
其中,,為圖像任意一點與其他相鄰點的偏離方向,d為偏離距離,。在實際應用中,,為減小計算量,需對式(4)進行歸一化,,即式(5)所示:
為減少θ的方向數(shù),,通常計算4個方向的灰度共生矩陣,即θ取值為0°,、45°,、90°、135°,。根據(jù)在共生矩陣基礎上提取的數(shù)字統(tǒng)計量,,取主要5種描述紋理統(tǒng)計量,分別為能量,、相關性,、熵,、對比度和逆差矩。
1.3 SVM
SVM(支持向量機)建立在統(tǒng)計學習和VC維理論的基礎上[6],,在解決小樣本問題中存在特有的優(yōu)勢,,其主要思想是構(gòu)造一個使分類間隔最大的超平面,使得離分類超平面最近的樣本點間的間隔最大,,從而控制VC維大小,,降低了機器學習的復雜度。在訓練小樣本情況下,不需要特定問題的先驗知識,,可以很好地控制學習機器的推廣能力,,因而在圖像檢索中可以有效地改善檢索結(jié)果[7]。
SVM解決分類問題,,使得一些在低維特征空間不可分問題在高維空間變得可分,。SVM分類器主要受兩個關鍵因素的影響:其一,誤差懲罰參數(shù)C,;其二,,核函數(shù)形式及其參數(shù)設置[8]。選擇不同的核函數(shù)以及相同核函數(shù)設置不同參數(shù)對其分類性能均有影響,。這里借用MATLAB自帶的Libsvm軟件包,,構(gòu)造訓練模型,實現(xiàn)圖像樣本預測,。LIBSVM中最重要的是核函數(shù)及其相關參數(shù)的選取,。常用的核函數(shù)有線性核、多項式核和RBF核,。一般選擇RBF核及徑向基核函數(shù),它只有一個待定參數(shù),,其值越大,,收斂速度越快[9]。
本實驗分別從正,、負類圖像中選取前N張用于訓練集,,其余的1 000-N用于測試集。選取SVM類型為e-SVR,,核函數(shù)選用RBF(徑向基函數(shù))核,,又稱高斯核函數(shù),SVM分類器優(yōu)化問題就轉(zhuǎn)化式(6)的最小化問題:
其中,,ai為拉格朗日乘子,,C為懲罰參數(shù)。式(6)的最小值取決于參數(shù)(C,,?酌)的設置,,合適的參數(shù)可使得SVM分類器的性能最佳,其推廣能力最好。經(jīng)過多次試驗,,C取100,,?酌取1/k,k為類數(shù),。用訓練數(shù)據(jù)訓練SVM分類器,,預測測試樣本,同時,,為了避免數(shù)值計算困難問題,,采用尺度因子壓縮數(shù)據(jù),用ROC曲線與AUC值作為評價分類器性能的指標,。
2 改進算法
2.1 圖像分塊
圖像分塊通過綜合利用圖像全局特征和綜合特征,,更好地描述了圖像內(nèi)容。由于顏色空間分布存在差異性,,故將圖像分成若干個子塊[10],。分塊圖像特征檢索方法具有良好的旋轉(zhuǎn)、平移和尺度不變性,,得到的檢索結(jié)果能夠很好地滿足人的視覺感受[11],。圖像的空間分布信息對圖像相似性判斷的影響極大,圖像分塊注重了圖像的空間分布信息,,實現(xiàn)了基于均勻分塊的圖像檢索算法[12],,三者結(jié)合更加全面地描述了圖像信息,使得檢索結(jié)果更加準確,。
2.2 Bag of Words算法描述
Bag of Words算法也稱為詞袋算法,,是一種有效的基于語義特征提取與描述的物體識別算法。其基本思想是假定對于一個文本,,忽略其詞序和語法,、句法,僅僅將其看作是一些詞匯的集合,,而文本中的每個詞匯都是獨立的[13],。Bag of Words算法首先要提取圖像的特征點,通過描述方式轉(zhuǎn)化為特征描述符,,利用K-Means對描述符進行聚類,,得到每個類的聚類中心,所有的聚類中心的集合成為視覺詞匯,,最后利用機器學習的方法對多個類別的描述符進行訓練,。
2.3 Bag of Words模型
Bag of Words模型應用于圖像表示,為了能表示一幅圖像,,需將圖像視為文檔,。K-Means算法是基于樣本間相似度測量的間接聚類算法,,其特點:理論可靠、算法簡單,、收斂速度快[14],。
實驗將圖像庫里的圖像大小分成50×50,采用重疊的分塊方式,,并提取每塊的顏色紋理特征,,由于圖像大小不同,故分塊的數(shù)量也不同,。為了能用標準的SVM學習與檢索,,借鑒Bag of Words模型,則步驟如下:
(1)用K-Means對所有訓練圖像的所有分塊的顏色與紋理特征進行聚類,,找到聚類中心點,,構(gòu)造視覺詞匯;
(2)將每幅圖像的分塊特征向量在聚類中心點映射,,得到圖像的映射向量,;
(3)以圖像的映射向量作為圖像的特征向量,從而利用SVM學習與檢索,。
用K-Means算法將訓練類的所有圖像示例聚成100類,,并產(chǎn)生每一類的投影特征,建立每小類的視覺字,,分別計算訓練與測試類的投影特征,。
3 實驗分析
實驗選取蝴蝶、蜻蜓,、蜜蜂,、蟋蟀、蝗蟲,、螳螂,、天牛、棉鈴蟲(幼蟲),、瓢蟲與蚜蟲10類各100張圖片構(gòu)建昆蟲圖像數(shù)據(jù)庫,。分別采用顏色矩小波紋理綜合特征與圖像分塊結(jié)合顏色矩小波紋理綜合特征的方法,,進行SVM圖像檢索,。實驗結(jié)果如表1所示。
根據(jù)每類圖像的AUC值繪制PR曲線,,如圖1所示,。
實驗表明,圖像分塊特征結(jié)合顏色紋理綜合特征檢索效果比顏色紋理綜合特征SVM圖像檢索結(jié)果精度高,,同時也表明了全面的綜合特征描述了圖像的完整信息,。
4 結(jié)論
利用計算機模式識別可有效地識別昆蟲,,通過提取綜合特征描述昆蟲圖像信息,構(gòu)建訓練模型,,使用SVM訓練樣本,,并預測測試樣本。圖像分塊彌補了圖像空間分布信息,,更加全面描述了圖像內(nèi)容,,SVM在圖像檢索中的應用提高了檢索精度。
參考文獻
[1] 李勃,,章毓晉.基于特征元素和關聯(lián)規(guī)則的圖像分類方法[J].電子學報,,2002,30(9):1262-1265.
[2] 李向陽,,莊越挺,,潘云鶴.基于內(nèi)容的圖像檢索技術(shù)與系統(tǒng)[J].計算機研究與發(fā)展,2001,,38(3):344-348.
[3] 肖秦琨,,劉米娜,高嵩.基于顏色和紋理特征的遙感圖像檢索[J].計算機技術(shù)與發(fā)展,,2013,,23(4):107-110.
[4] 孫君頂,趙珊.圖像低層特征提取與檢索技術(shù)[M].北京:電子工業(yè)出版社,,2009.
[5] 侯群群,,王飛,嚴麗.基于灰度共生矩陣的彩色遙感圖像紋理特征提取[J].國土資源遙感,,2013,,25(12):26-32.
[6] Deng Yining,MANJUNATH B S.Unsupervised segmentation of color-texture regions in images and video[J].IEEE Trans-actions on Pattern Analysis and Machine Intelligence,,2001,,23(8):800-810.
[7] VAPNIK V.The nature of statistical learning theory[M].New York:Springer Verlag,1995.
[8] 奉國和.SVM分類核函數(shù)及參數(shù)選擇比較[J].計算機工程與應用,,2011,,47(3):126-127.
[9] 羅成石.基于LIBSVM 的糧食水分數(shù)據(jù)融合研究[J].科學技術(shù)與工程,2012,,12(2):292-294.
[10] 陳雅芳,,薛清福,陳方芳,,等.基于圖像全局和局部顏色特征的圖像檢索[J].長春教育學院學報,,2013,29(24):50-51.
[11] 郭麗,,黃元元,,楊靜宇.用分塊圖像特征進行商標圖像檢索[J].計算機輔助設計與圖形學報,,2004,16(7):968-972.
[12] 張磊,,林福宗,,張鈸.基于支持向量機的相關反饋圖像索算法[J].清華大學學報,2002,,42(1):80-83.
[13] 孫孟柯,,張紅梅.基于Bag of words模型的圖像檢索系統(tǒng)的設計與實現(xiàn)[J].電腦知識與技術(shù),2012,,8(5):1139-1141.
[14] 曾接賢,,王軍婷,符祥.K均值聚類分割的多特征圖像檢索方法[J].計算機工程與應用,,2013,,49(2):226-227.