摘 要: 本文采用非參數(shù)化的特征提取技術(shù)提取樣本的特征,,再用模塊化的神經(jīng)網(wǎng)絡(luò)的方法進(jìn)行訓(xùn)練識(shí)別,取得了較好的實(shí)驗(yàn)效果,。
關(guān)鍵詞: 特征提取 神經(jīng)網(wǎng)絡(luò) 目標(biāo)識(shí)別
傳統(tǒng)的特征提取方法建立在目標(biāo)分割的基礎(chǔ)上,,通過分割獲得目標(biāo)的形狀信息,并與已知的待識(shí)別目標(biāo)的形狀特征進(jìn)行比較,,實(shí)現(xiàn)目標(biāo)分類,。目標(biāo)的形狀特征通常由一組參數(shù)來描述,如不變矩,、Fourier描繪子,、各線特征的起點(diǎn)和終點(diǎn)、各點(diǎn)特征(角點(diǎn),、形殊點(diǎn))的位置等,。故傳統(tǒng)的特征提取方法可視作參數(shù)化方法。但由于目標(biāo)分割問題自身的內(nèi)在復(fù)雜性,,目前還不存在通用的,、理想的目標(biāo)分割方法。近年來,,人們的注意力較多地集中于所謂的無分割(Segmentation Free)目標(biāo)識(shí)別,,即利用目標(biāo)的灰度信息提取某些統(tǒng)計(jì)特征(如全局的或局部的灰度均值、灰度標(biāo)準(zhǔn)差等),,構(gòu)成目標(biāo)的特征,,并將其作為神經(jīng)網(wǎng)絡(luò)的輸入,對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,。訓(xùn)練完成后的神經(jīng)網(wǎng)絡(luò)即可用于目標(biāo)識(shí)別,,這是一類非參數(shù)化的特征提取技術(shù)。具體實(shí)現(xiàn)時(shí),,可供采用的特征提取方法很多,,簡(jiǎn)單的如進(jìn)行方向投影或提取方向邊緣特征等,復(fù)雜的如采用各種局部或全局變換等,。本文重點(diǎn)研究了一種非參數(shù)化的特征提取方法——感興趣算子圖像特征提取方法,。
1 感興趣算子特征提取方法
感興趣算子(Interest Operator)提取的是圖像在其水平、垂直和二個(gè)對(duì)角線方向上的灰度方差。圖1為感興趣算子特征提取示意圖,。
例如對(duì)一幅大小為50×60象素的圖像采用上面的方法進(jìn)行特征提取,,則選取的圖像子塊像素大小為5×5。因此可以將原圖像劃分成無重疊的120個(gè)子塊,,然后針對(duì)每個(gè)圖像子塊提取圖像的感興趣特征向量,。
2 模塊化的神經(jīng)網(wǎng)絡(luò)
模塊化神經(jīng)網(wǎng)絡(luò)由若干獨(dú)立訓(xùn)練的子網(wǎng)絡(luò)組成,每一子網(wǎng)絡(luò)分別針對(duì)訓(xùn)練樣本集的某一子集進(jìn)行分類識(shí)別,,通過組合各子網(wǎng)絡(luò)的分類決策確定最終的識(shí)別結(jié)果,。訓(xùn)練樣本集各子集的劃分采用了數(shù)據(jù)分組技術(shù),即將樣本根據(jù)一定的相似性準(zhǔn)則劃分為多組,。如此分組后,,各網(wǎng)絡(luò)僅需解決一個(gè)更為簡(jiǎn)單的分類問題,因此可提高分類識(shí)別概率,。
2.1 基于特征分解的模塊化神經(jīng)網(wǎng)絡(luò)
基于特征分解的模塊化神經(jīng)網(wǎng)絡(luò)按照某種規(guī)則將圖像特征分成幾個(gè)不同的特征組,。每個(gè)特征組都用一個(gè)獨(dú)立的神經(jīng)網(wǎng)絡(luò)來訓(xùn)練識(shí)別,然后由一個(gè)融合網(wǎng)絡(luò)將各獨(dú)立神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果綜合得到最后的識(shí)別結(jié)果,。這種算法的優(yōu)點(diǎn)是:通過分組,,每個(gè)用于識(shí)別的神經(jīng)網(wǎng)絡(luò)只需要處理某一部分特征而不是全部,從而減少了單個(gè)網(wǎng)絡(luò)的自由參數(shù),,降低了問題的復(fù)雜度,。
2.2 基于圖像子塊的特征分組神經(jīng)網(wǎng)絡(luò)
基于圖像子塊的特征分組神經(jīng)網(wǎng)絡(luò)算法的結(jié)構(gòu)框圖如圖2所示。
該算法的實(shí)現(xiàn)包括以下幾個(gè)步驟:
(1)將原始圖像按照某種規(guī)則分成若干圖像子塊,,各個(gè)圖像子塊間可以有交叉也可以無交叉。圖3和圖4分別為有交叉和無交叉圖像分塊的示意圖,。
(2)對(duì)每一個(gè)圖像子塊進(jìn)行特征提取,,得到其相應(yīng)的圖像特征。本文選用了感興趣算子的特征提取方法,。
(3)對(duì)步驟(2)經(jīng)過特征提取所得到的圖像特征向量進(jìn)行特征選擇,,以去除特征向量間的冗余特征和選出具有更強(qiáng)分類識(shí)別能力的特征,從而降低特征維數(shù),,減小識(shí)別算法中神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)規(guī)模,。
(4)對(duì)每幅子圖分別用一個(gè)單獨(dú)的BP網(wǎng)絡(luò)對(duì)其進(jìn)行訓(xùn)練或識(shí)別。
(5)將各個(gè)獨(dú)立BP網(wǎng)絡(luò)的輸出結(jié)果送到一個(gè)融合網(wǎng)絡(luò)中進(jìn)行融合從而得到最終判識(shí)結(jié)果,。
基于圖像子塊的特征分組神經(jīng)網(wǎng)絡(luò)除了可以降低問題的復(fù)雜性外,,還具有一定的抗局部遮擋能力。由于一些人為的或非人為的因素,,目標(biāo)圖像可能會(huì)受到局部遮擋的影響,。由于局部遮擋本身的復(fù)雜性和其對(duì)目標(biāo)遮擋部位的不可預(yù)測(cè)性,使得抗遮擋成為一個(gè)相對(duì)困難的課題?;趫D像子塊的特征分組策略具有一定的抗局部遮擋能力,。
設(shè)原圖像在長(zhǎng)度和寬度方向分別被等分為X和Y份,于是可以得到X×Y個(gè)子塊圖像,。若局部遮擋處于第(i,,j)個(gè)子塊上,則只有該子塊受到影響并導(dǎo)致與它對(duì)應(yīng)的神經(jīng)網(wǎng)絡(luò)進(jìn)行錯(cuò)誤判識(shí)的可能性增大,。但是由于其他子塊及對(duì)應(yīng)神經(jīng)網(wǎng)絡(luò)的判識(shí)并未受到遮擋影響,,因此至少可以得到X×Y-1個(gè)網(wǎng)絡(luò)的正確輸出。經(jīng)過融合網(wǎng)絡(luò),,最終可以消除對(duì)第(i,,j)個(gè)子塊圖像的錯(cuò)誤判識(shí)的影響而得到正確的識(shí)別結(jié)果,達(dá)到抗遮擋的效果,。當(dāng)然,,實(shí)際應(yīng)用中局部遮擋可能會(huì)存在于不止一個(gè)子塊圖像中,但只要這些子塊圖像的數(shù)量占總子塊圖像數(shù)的比重相對(duì)較小,,這種特征分組神經(jīng)網(wǎng)絡(luò)識(shí)別策略就可以表現(xiàn)出很好的抗局部遮擋性能,。
3 實(shí)驗(yàn)結(jié)果及其分析
實(shí)驗(yàn)中訓(xùn)練樣本取kh-11、kh-12,、lacrosses三類衛(wèi)星的三個(gè)譜段(CCD:可見光,,MIDDLE:中波,LONG:長(zhǎng)波)圖像作為試驗(yàn)用的樣本,。
(1)訓(xùn)練樣本:取每類不同譜段的圖像001,、005、009,、L,、057共15幅圖像。如果三個(gè)譜段的圖像一起訓(xùn)練,,則訓(xùn)練樣本個(gè)數(shù)為15×9=135,;如果只有單譜段圖像參加訓(xùn)練,則訓(xùn)練樣本個(gè)數(shù)為:15×3=45,。
(2)識(shí)別樣本:取每類不同譜段的圖像003,、007、0011,、L,、059以及060、061,、L,、072總共30幅圖像,。如果三個(gè)譜段的圖像一起識(shí)別,則識(shí)別樣本個(gè)數(shù)為30×9=270,;如果只有單譜段圖像參加識(shí)別,,則識(shí)別樣本個(gè)數(shù)為30×3=90。
表1給出了不同分辨率情況下的正確識(shí)別率,。其中,,All組實(shí)驗(yàn)表示對(duì)每類三個(gè)譜段的衛(wèi)星圖像進(jìn)行實(shí)驗(yàn),CCD,、MIDDLE和LONG組實(shí)驗(yàn)分別表示對(duì)可見光譜段,、中波紅外圖像和長(zhǎng)波紅外圖像進(jìn)行實(shí)驗(yàn)。CCD為可見光圖像,,MIDDLE為中波圖像,,LONG為長(zhǎng)波圖像。
研究中還用最小距離分類器對(duì)提取的不同目標(biāo)的參數(shù)化特征進(jìn)行了實(shí)驗(yàn),,以便觀察其與神經(jīng)網(wǎng)絡(luò)方法的性能差異,。在實(shí)驗(yàn)中,三類目標(biāo)的圖片各為3×72=216幅,,用奇數(shù)圖作為訓(xùn)練樣本,,對(duì)偶數(shù)圖進(jìn)行識(shí)別。表2顯示了在三組不同分辨率下選擇不同特征集得到的識(shí)別結(jié)果,。
從實(shí)驗(yàn)中可以發(fā)現(xiàn),,常規(guī)分類方法性能不穩(wěn)定,而且其識(shí)別率與神經(jīng)網(wǎng)絡(luò)方法相比要低很多,。
參考文獻(xiàn)
1 Choi S M.A segmentation-free recognition of two touching
numerals using neural network.In:Proceedings of the Fifth
International Conference on Document Analysis and
Recognition,,1999
2 Ozdil M A,Vural F T Y.Optical character recognition
without segmentation.In:Proceedings of the Fourth Inter-
national Conference on Document Analysis and Recogni-
tion,,1997
3 Rocha J,,Pavlidis T.Character recognition without segmen-
tation.IEEE Transactions on,Pattern Analysis and
Machine Intelligence,,1995;17:903
4 Cai C,,Shi Z.A modular neural network architecture with
approximation capability and its applications. The Second
IEEE International Conference on Cognitive Informatics,,
2003
5 Wang L C,Der S Z,,Nasrabadi N M.Automatic target
recognition using a feature-decomposition and data-
decomposition modular neural network.IEEE Transactions
on Image Processing,,1998;7:1113