基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)算法的目標(biāo)識別方法-AET-電子技術(shù)應(yīng)用

基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)算法的目標(biāo)識別方法

2014年微型機(jī)與應(yīng)用第10期

羅斌，楊宜民

廣東工業(yè)大學(xué) 自動(dòng)化學(xué)院，廣東廣州

摘要： 顏色是物體表面的基本特征, 外部世界提供了豐富的顏色信息,因此通過顏色對目標(biāo)進(jìn)行識別[1-2]是一種常用的方法。然而，同一顏色在變化環(huán)境下所接收到的光照并不完全一樣，不同于人眼識別的靈敏性。機(jī)器人視覺系統(tǒng)所感知到的目標(biāo)顏色會(huì)隨著光照的變化發(fā)生顏色畸變，降低識別精度。目前自然光線已經(jīng)被逐漸引入到RoboCup中型組足球機(jī)器人比賽[3]中，因此在自然光照條件下的魯棒性識別是當(dāng)今研究的重點(diǎn)。

關(guān)鍵詞： 顏色空間 BP神經(jīng)網(wǎng)絡(luò) RoboCup 目標(biāo)識別

Abstract：

Key words :

　　摘要： RoboCup中型組足球機(jī)器人在比賽過程中由于受環(huán)境光照變化影響，使目標(biāo)識別率降低。以HSV顏色空間為基礎(chǔ)，針對傳統(tǒng)BP算法的缺陷，提出了一種改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)算法，利用其良好的分類效果來適應(yīng)環(huán)境光照的變化，對目標(biāo)作出準(zhǔn)確識別。實(shí)驗(yàn)結(jié)果證明，該方法能有效地提高識別速度，并具有較好的光照魯棒性。

　　關(guān)鍵詞：顏色空間；BP神經(jīng)網(wǎng)絡(luò)；RoboCup；目標(biāo)識別

　　顏色是物體表面的基本特征, 外部世界提供了豐富的顏色信息,因此通過顏色對目標(biāo)進(jìn)行識別[1-2]是一種常用的方法。然而，同一顏色在變化環(huán)境下所接收到的光照并不完全一樣，不同于人眼識別的靈敏性。機(jī)器人視覺系統(tǒng)所感知到的目標(biāo)顏色會(huì)隨著光照的變化發(fā)生顏色畸變，降低識別精度。目前自然光線已經(jīng)被逐漸引入到RoboCup中型組足球機(jī)器人比賽[3]中，因此在自然光照條件下的魯棒性識別是當(dāng)今研究的重點(diǎn)。

　　戚瑋瑋提出一種基于Gabor濾波器和支持向量機(jī)(SVM)的目標(biāo)識別方法[4]，以改善機(jī)器人對目標(biāo)識別不穩(wěn)定和有效性差的問題。JUNGEL M等人利用顏色閾值法[5]實(shí)現(xiàn)物體的識別，并通過參考顏色實(shí)現(xiàn)閾值的自動(dòng)調(diào)節(jié)，提高了對光照的魯棒性。本文提出一種基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)算法，以用于足球機(jī)器人視覺系統(tǒng)的目標(biāo)識別中。

　　1 顏色空間的選擇

　　顏色空間是表示顏色的一種數(shù)學(xué)方法，人們用它來指定和產(chǎn)生顏色，使顏色形象化。HSV模型就是一種常用的顏色模型。HSV模型[6]由色調(diào)(Hue)、飽和度(Saturation)和亮度(Value)三屬性組成，其結(jié)構(gòu)如圖1所示。

　　HSV顏色模型構(gòu)成的是一個(gè)均勻的顏色空間，采用線性的標(biāo)尺，彩色之間感覺上的距離與HSV顏色模型坐標(biāo)上點(diǎn)的歐氏距離成正比，與RGB顏色模型相比，HSV模型對應(yīng)于光線的變化具有一定的不變性。由于人的視覺對亮度的敏感程度遠(yuǎn)強(qiáng)于對顏色濃淡的敏感程度，為了便于顏色處理和識別，本文采用HSV顏色空間，它比RGB顏色空間更符合人的視覺特性。

　　2 BP神經(jīng)網(wǎng)絡(luò)簡介

　　BP神經(jīng)網(wǎng)絡(luò)是一種多層前饋型網(wǎng)絡(luò)，網(wǎng)絡(luò)結(jié)構(gòu)包括輸入層、中間層（隱含層）和輸出層。其拓?fù)浣Y(jié)構(gòu)如圖2所示。

　　圖2中，xj表示輸入層第j個(gè)節(jié)點(diǎn)的輸入，j=1，…，M；wij表示隱含層第i個(gè)節(jié)點(diǎn)到輸入層第j個(gè)節(jié)點(diǎn)之間的權(quán)值；?茲i表示隱含層第i個(gè)節(jié)點(diǎn)的閾值；?準(zhǔn)(x)表示隱含層的激勵(lì)函數(shù)；wki表示輸出層第k個(gè)節(jié)點(diǎn)到隱含層第i個(gè)節(jié)點(diǎn)之間的權(quán)值，i=1，…，q；ak表示輸出層第k個(gè)節(jié)點(diǎn)的閾值，k=1，…，L；?追(x)表示輸出層的激勵(lì)函數(shù)；Ok表示輸出層第k個(gè)節(jié)點(diǎn)的輸出。

　　BP算法的基本思想[7]是：學(xué)習(xí)訓(xùn)練過程由正向信號傳輸和反向誤差傳播構(gòu)成。正向傳播時(shí)輸入樣本從輸入層進(jìn)入，經(jīng)各隱含層逐層處理后，傳向輸出層。若輸出層的實(shí)際輸出與期望輸出不符，則轉(zhuǎn)入誤差的反向傳播階段。誤差反傳是將輸出誤差以某種形式通過隱含層向輸入層逐層反傳，并將誤差分?jǐn)偨o各層的所有單元，從而獲得各層單元的誤差信號，以此誤差信號作為修正各單元權(quán)值的依據(jù)。此過程一直進(jìn)行到網(wǎng)絡(luò)輸出的誤差減少到可接受的程度，或進(jìn)行到預(yù)先設(shè)定的學(xué)習(xí)次數(shù)為止。

　　3 改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)算法

　　BP神經(jīng)網(wǎng)絡(luò)算法的缺陷是難以確定隱含層和隱節(jié)點(diǎn)個(gè)數(shù)，訓(xùn)練時(shí)常會(huì)出現(xiàn)收斂慢、震蕩和陷入局部極小等問題[8]。本文通過引入附加動(dòng)量法和自適應(yīng)學(xué)習(xí)速率加以改進(jìn)。

　　3.1 附加動(dòng)量法

　　BP算法實(shí)質(zhì)上是一種簡單的最速下降靜態(tài)尋優(yōu)算法，在沒有附加動(dòng)量的作用下，網(wǎng)絡(luò)可能陷入淺的局部極小值，利用附加動(dòng)量的作用有可能滑過這些極小值。該方法是在反向傳播法的基礎(chǔ)上，在每一個(gè)權(quán)值(或閾值)的變化上加上一項(xiàng)正比于前次權(quán)值（或閾值）變化量的值，并根據(jù)反向傳播法來產(chǎn)生新的權(quán)值(或閾值)變化。帶有附加動(dòng)量因子的權(quán)值和閾值調(diào)節(jié)方法為：

　　?駐wij(k+1)=(1-mc)?濁 ?啄i pj+mc?駐wij(k)

　　?駐bi(k+1)=(1-mc)?濁 ?啄i+mc?駐bi(k)

　　其中，k為訓(xùn)練次數(shù)，mc為動(dòng)量因子。

　　3.2 自適應(yīng)學(xué)習(xí)速率

　　一階梯度法尋優(yōu)收斂較慢的一個(gè)重要原因是?濁(學(xué)習(xí)速率)不好選擇。?濁選得太小，收斂太慢；選得太大，則有可能修正過頭，導(dǎo)致震蕩甚至發(fā)散。通常調(diào)節(jié)學(xué)習(xí)速率的準(zhǔn)則是：檢查權(quán)值是否真正降低了誤差函數(shù)，如果確實(shí)如此，則說明所選學(xué)習(xí)速率小了，可以適當(dāng)增加一個(gè)量；若產(chǎn)生了過調(diào)，則應(yīng)該減少學(xué)習(xí)速率的值。自適應(yīng)學(xué)習(xí)速率的調(diào)整方法為：

　　?濁(k+1)=1.05?濁(k) E(k+1)<E(k)

　　0.7?濁(k) E(k+1)>1.04E(k)

　　?濁(k) 其他

　　其中，E(k)為第k步誤差平方和。

　　3.3 改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)算法

　　當(dāng)采用動(dòng)量法時(shí)，可以避免網(wǎng)絡(luò)陷入局部最小。當(dāng)采用自適應(yīng)學(xué)習(xí)速率時(shí)，可以加快網(wǎng)絡(luò)的收斂速度。因此本文將兩種方法結(jié)合對基本BP算法進(jìn)行改進(jìn)，以彌補(bǔ)不足。

　　BP算法的執(zhí)行步驟如下：

　　 BU94]QR@00Q~AWPL{~{27MP.jpg 　　

　　(6)當(dāng)求出了各層各權(quán)系數(shù)之后，可按給定判別指標(biāo)判別是否滿足要求，如果滿足則算法結(jié)束；不滿足則返回步驟(3)。

　　4 基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)算法的目標(biāo)識別

　　4.1 識別過程

　　足球場地主要由綠、橙、白、黑4種顏色構(gòu)成，由于光線的變化會(huì)使得顏色發(fā)生偏差，本文的目的就是要在此條件下識別出橙色的球。識別過程分為學(xué)習(xí)階段和識別階段。

　　在學(xué)習(xí)階段，由于通常的彩色圖像都是RGB圖像，因此首先將圖像樣本轉(zhuǎn)化到HSV顏色空間，然后將樣本數(shù)據(jù)進(jìn)行歸一化處理，再輸入到改進(jìn)后的BP網(wǎng)絡(luò)中進(jìn)行訓(xùn)練，以確定網(wǎng)絡(luò)的權(quán)值和閾值。

　　在識別階段，同樣將由攝像機(jī)所采集到的不同光照下的全向視覺圖像先進(jìn)行顏色空間轉(zhuǎn)換，經(jīng)歸一化處理后再輸入到已訓(xùn)練好的網(wǎng)絡(luò)中，指導(dǎo)輸出為1或0(1表示為橙色，0表示為非橙色)。

　　4.2 網(wǎng)絡(luò)設(shè)計(jì)

　　現(xiàn)有神經(jīng)網(wǎng)絡(luò)理論證明，3層前饋神經(jīng)網(wǎng)絡(luò)能夠以任意精度逼近任意非線性關(guān)系，因此本文選用3層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。輸入層為經(jīng)預(yù)處理后的某一點(diǎn)的顏色值，輸入節(jié)點(diǎn)為3；隱含層節(jié)點(diǎn)數(shù)經(jīng)不斷操作調(diào)整確定為22個(gè)節(jié)點(diǎn)；輸出以1或0作指導(dǎo)，節(jié)點(diǎn)數(shù)為1，故網(wǎng)絡(luò)的整體結(jié)構(gòu)為3-22-1。

　　5 仿真實(shí)驗(yàn)及結(jié)果

　　本足球機(jī)器人視覺系統(tǒng)使用的彩色數(shù)字?jǐn)z像機(jī)是由加拿大Procilica公司生產(chǎn)的EC655C，攝像機(jī)輸出的圖像分辨率為640×480，幀速率為30 幀/s，圖像的輸出格式為RGB24。處理圖像所采用的計(jì)算機(jī)為宏基TravelMate3010，CPU主頻為1.6 GHz，內(nèi)存為1.5 GB，在MATLAB7.0中進(jìn)行仿真實(shí)驗(yàn)。

　　5.1 4種不同目標(biāo)識別方法的比較

　　4種不同目標(biāo)識別方法的比較如表1所示。

　　從表1的結(jié)果可以看出，基本BP算法迭代次數(shù)最多，耗時(shí)最長；自適應(yīng)調(diào)整學(xué)習(xí)速率算法和引入動(dòng)量的算法都有所改善，而新的改進(jìn)算法最為明顯，不僅訓(xùn)練速度大大提高，而且還成功地避免了陷入局部極小值，保證了網(wǎng)絡(luò)的穩(wěn)定性。

　　5.2 不同光照下的識別情況

　　不同光照下的識別情況如表2所示。

　　從表2可看出，采用基本BP算法的系統(tǒng)識別率較低，采用了改進(jìn)BP算法的系統(tǒng)的識別率相比要高一些，而且受光照影響并不大，識別率波動(dòng)范圍小，整體保持在一個(gè)穩(wěn)定水平，說明該方法有很好的光照自適應(yīng)性。

　　本文在傳統(tǒng)BP算法基礎(chǔ)上加以改進(jìn)，使得網(wǎng)絡(luò)避免陷入局部最小值，而且收斂速度有了顯著提高。將改進(jìn)后的BP算法應(yīng)用于足球機(jī)器人全向視覺系統(tǒng)的目標(biāo)識別中，結(jié)果顯示，該算法識別快速、精準(zhǔn)，具有良好的光照自適應(yīng)能力。

　　參考文獻(xiàn)

　　[1] NEVES A J R，CORRENTE G，PINHO A J.An omnidirec-tional vision system for soccer robots[C].Proceedings of the EPIA 2007，Lecture Notes in Artificial Intelligence，Berlin，Germany：Springer-Verlag，2007，4874：499-507.

　　[2] MOHAN S，PETER S.Color learning and illumination vari-ance on mobile robots:a survey[J].Robotics and AutonomousSystem，2009，75(1)：1-38.

　　[3] 洪炳熔，韓學(xué)東，孟偉.機(jī)器人足球比賽研究[J].機(jī)器人，2003，25（4）：373-377.

　　[4] 戚瑋瑋，欒新，宋大雷，等.一種魯棒的基于全景視覺的機(jī)器人目標(biāo)識別方法[J].中國海洋大學(xué)學(xué)報(bào)，2011，41(6)：109-114.

　　[5] JUNGEL M，HOFFMANN J，TZSCH M L.A real-time au-to-adjusting vision system for robotic soccer.RoboCup 2003：Robot Soccer World Cup VII，2004：214-225.

　　[6] 李偲.全自主足球機(jī)器人視覺系統(tǒng)的研制[M].青島：中國海洋大學(xué)，2008.

　　[7] 張國忠.智能控制系統(tǒng)及應(yīng)用[M].北京：中國電力出版社，2007.

　　[8] 趙明旺，王杰.智能控制[M].武漢：華中科技大學(xué)出版社，2010.

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容