摘 要: RoboCup中型組足球機(jī)器人在比賽過程中由于受環(huán)境光照變化影響,,使目標(biāo)識別率降低。以HSV顏色空間為基礎(chǔ),,針對傳統(tǒng)BP算法的缺陷,,提出了一種改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)算法,利用其良好的分類效果來適應(yīng)環(huán)境光照的變化,,對目標(biāo)作出準(zhǔn)確識別,。實(shí)驗(yàn)結(jié)果證明,該方法能有效地提高識別速度,,并具有較好的光照魯棒性,。
關(guān)鍵詞: 顏色空間,;BP神經(jīng)網(wǎng)絡(luò);RoboCup,;目標(biāo)識別
顏色是物體表面的基本特征, 外部世界提供了豐富的顏色信息,因此通過顏色對目標(biāo)進(jìn)行識別[1-2]是一種常用的方法,。然而,同一顏色在變化環(huán)境下所接收到的光照并不完全一樣,,不同于人眼識別的靈敏性,。機(jī)器人視覺系統(tǒng)所感知到的目標(biāo)顏色會隨著光照的變化發(fā)生顏色畸變,降低識別精度,。目前自然光線已經(jīng)被逐漸引入到RoboCup中型組足球機(jī)器人比賽[3]中,,因此在自然光照條件下的魯棒性識別是當(dāng)今研究的重點(diǎn)。
戚瑋瑋提出一種基于Gabor濾波器和支持向量機(jī)(SVM)的目標(biāo)識別方法[4],,以改善機(jī)器人對目標(biāo)識別不穩(wěn)定和有效性差的問題,。JUNGEL M等人利用顏色閾值法[5]實(shí)現(xiàn)物體的識別,并通過參考顏色實(shí)現(xiàn)閾值的自動調(diào)節(jié),,提高了對光照的魯棒性,。本文提出一種基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)算法,以用于足球機(jī)器人視覺系統(tǒng)的目標(biāo)識別中,。
1 顏色空間的選擇
顏色空間是表示顏色的一種數(shù)學(xué)方法,人們用它來指定和產(chǎn)生顏色,,使顏色形象化,。HSV模型就是一種常用的顏色模型。HSV模型[6]由色調(diào)(Hue),、飽和度(Saturation)和亮度(Value)三屬性組成,,其結(jié)構(gòu)如圖1所示。
HSV顏色模型構(gòu)成的是一個均勻的顏色空間,,采用線性的標(biāo)尺,,彩色之間感覺上的距離與HSV顏色模型坐標(biāo)上點(diǎn)的歐氏距離成正比,與RGB顏色模型相比,,HSV模型對應(yīng)于光線的變化具有一定的不變性,。由于人的視覺對亮度的敏感程度遠(yuǎn)強(qiáng)于對顏色濃淡的敏感程度,為了便于顏色處理和識別,,本文采用HSV顏色空間,,它比RGB顏色空間更符合人的視覺特性。
2 BP神經(jīng)網(wǎng)絡(luò)簡介
BP神經(jīng)網(wǎng)絡(luò)是一種多層前饋型網(wǎng)絡(luò),,網(wǎng)絡(luò)結(jié)構(gòu)包括輸入層,、中間層(隱含層)和輸出層。其拓?fù)浣Y(jié)構(gòu)如圖2所示,。
圖2中,,xj表示輸入層第j個節(jié)點(diǎn)的輸入,,j=1,…,,M,;wij表示隱含層第i個節(jié)點(diǎn)到輸入層第j個節(jié)點(diǎn)之間的權(quán)值;?茲i表示隱含層第i個節(jié)點(diǎn)的閾值,;?準(zhǔn)(x)表示隱含層的激勵函數(shù),;wki表示輸出層第k個節(jié)點(diǎn)到隱含層第i個節(jié)點(diǎn)之間的權(quán)值,i=1,,…,,q;ak表示輸出層第k個節(jié)點(diǎn)的閾值,,k=1,,…,L,;?追(x)表示輸出層的激勵函數(shù),;Ok表示輸出層第k個節(jié)點(diǎn)的輸出。
BP算法的基本思想[7]是:學(xué)習(xí)訓(xùn)練過程由正向信號傳輸和反向誤差傳播構(gòu)成,。正向傳播時輸入樣本從輸入層進(jìn)入,,經(jīng)各隱含層逐層處理后,傳向輸出層,。若輸出層的實(shí)際輸出與期望輸出不符,,則轉(zhuǎn)入誤差的反向傳播階段。誤差反傳是將輸出誤差以某種形式通過隱含層向輸入層逐層反傳,,并將誤差分?jǐn)偨o各層的所有單元,,從而獲得各層單元的誤差信號,以此誤差信號作為修正各單元權(quán)值的依據(jù),。此過程一直進(jìn)行到網(wǎng)絡(luò)輸出的誤差減少到可接受的程度,,或進(jìn)行到預(yù)先設(shè)定的學(xué)習(xí)次數(shù)為止。
3 改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)算法
BP神經(jīng)網(wǎng)絡(luò)算法的缺陷是難以確定隱含層和隱節(jié)點(diǎn)個數(shù),,訓(xùn)練時常會出現(xiàn)收斂慢,、震蕩和陷入局部極小等問題[8]。本文通過引入附加動量法和自適應(yīng)學(xué)習(xí)速率加以改進(jìn),。
3.1 附加動量法
BP算法實(shí)質(zhì)上是一種簡單的最速下降靜態(tài)尋優(yōu)算法,,在沒有附加動量的作用下,網(wǎng)絡(luò)可能陷入淺的局部極小值,,利用附加動量的作用有可能滑過這些極小值,。該方法是在反向傳播法的基礎(chǔ)上,在每一個權(quán)值(或閾值)的變化上加上一項(xiàng)正比于前次權(quán)值(或閾值)變化量的值,,并根據(jù)反向傳播法來產(chǎn)生新的權(quán)值(或閾值)變化,。帶有附加動量因子的權(quán)值和閾值調(diào)節(jié)方法為:
?駐wij(k+1)=(1-mc)?濁 ?啄i pj+mc?駐wij(k)
?駐bi(k+1)=(1-mc)?濁 ?啄i+mc?駐bi(k)
其中,,k為訓(xùn)練次數(shù),mc為動量因子,。
3.2 自適應(yīng)學(xué)習(xí)速率
一階梯度法尋優(yōu)收斂較慢的一個重要原因是?濁(學(xué)習(xí)速率)不好選擇,。?濁選得太小,收斂太慢,;選得太大,,則有可能修正過頭,導(dǎo)致震蕩甚至發(fā)散,。通常調(diào)節(jié)學(xué)習(xí)速率的準(zhǔn)則是:檢查權(quán)值是否真正降低了誤差函數(shù),,如果確實(shí)如此,則說明所選學(xué)習(xí)速率小了,,可以適當(dāng)增加一個量,;若產(chǎn)生了過調(diào),則應(yīng)該減少學(xué)習(xí)速率的值,。自適應(yīng)學(xué)習(xí)速率的調(diào)整方法為:
?濁(k+1)=1.05?濁(k) E(k+1)<E(k)
0.7?濁(k) E(k+1)>1.04E(k)
?濁(k) 其他
其中,,E(k)為第k步誤差平方和。
3.3 改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)算法
當(dāng)采用動量法時,,可以避免網(wǎng)絡(luò)陷入局部最小,。當(dāng)采用自適應(yīng)學(xué)習(xí)速率時,可以加快網(wǎng)絡(luò)的收斂速度,。因此本文將兩種方法結(jié)合對基本BP算法進(jìn)行改進(jìn),,以彌補(bǔ)不足。
BP算法的執(zhí)行步驟如下:
(6)當(dāng)求出了各層各權(quán)系數(shù)之后,,可按給定判別指標(biāo)判別是否滿足要求,如果滿足則算法結(jié)束,;不滿足則返回步驟(3),。
4 基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)算法的目標(biāo)識別
4.1 識別過程
足球場地主要由綠、橙,、白,、黑4種顏色構(gòu)成,由于光線的變化會使得顏色發(fā)生偏差,,本文的目的就是要在此條件下識別出橙色的球,。識別過程分為學(xué)習(xí)階段和識別階段。
在學(xué)習(xí)階段,,由于通常的彩色圖像都是RGB圖像,,因此首先將圖像樣本轉(zhuǎn)化到HSV顏色空間,然后將樣本數(shù)據(jù)進(jìn)行歸一化處理,,再輸入到改進(jìn)后的BP網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,,以確定網(wǎng)絡(luò)的權(quán)值和閾值,。
在識別階段,同樣將由攝像機(jī)所采集到的不同光照下的全向視覺圖像先進(jìn)行顏色空間轉(zhuǎn)換,,經(jīng)歸一化處理后再輸入到已訓(xùn)練好的網(wǎng)絡(luò)中,,指導(dǎo)輸出為1或0(1表示為橙色,0表示為非橙色),。
4.2 網(wǎng)絡(luò)設(shè)計(jì)
現(xiàn)有神經(jīng)網(wǎng)絡(luò)理論證明,,3層前饋神經(jīng)網(wǎng)絡(luò)能夠以任意精度逼近任意非線性關(guān)系,因此本文選用3層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),。輸入層為經(jīng)預(yù)處理后的某一點(diǎn)的顏色值,,輸入節(jié)點(diǎn)為3;隱含層節(jié)點(diǎn)數(shù)經(jīng)不斷操作調(diào)整確定為22個節(jié)點(diǎn),;輸出以1或0作指導(dǎo),,節(jié)點(diǎn)數(shù)為1,故網(wǎng)絡(luò)的整體結(jié)構(gòu)為3-22-1,。
5 仿真實(shí)驗(yàn)及結(jié)果
本足球機(jī)器人視覺系統(tǒng)使用的彩色數(shù)字?jǐn)z像機(jī)是由加拿大Procilica公司生產(chǎn)的EC655C,,攝像機(jī)輸出的圖像分辨率為640×480,幀速率為30 幀/s,,圖像的輸出格式為RGB24,。處理圖像所采用的計(jì)算機(jī)為宏基TravelMate3010,CPU主頻為1.6 GHz,,內(nèi)存為1.5 GB,,在MATLAB7.0中進(jìn)行仿真實(shí)驗(yàn)。
5.1 4種不同目標(biāo)識別方法的比較
4種不同目標(biāo)識別方法的比較如表1所示,。
從表1的結(jié)果可以看出,,基本BP算法迭代次數(shù)最多,耗時最長,;自適應(yīng)調(diào)整學(xué)習(xí)速率算法和引入動量的算法都有所改善,,而新的改進(jìn)算法最為明顯,不僅訓(xùn)練速度大大提高,,而且還成功地避免了陷入局部極小值,,保證了網(wǎng)絡(luò)的穩(wěn)定性。
5.2 不同光照下的識別情況
不同光照下的識別情況如表2所示,。
從表2可看出,,采用基本BP算法的系統(tǒng)識別率較低,采用了改進(jìn)BP算法的系統(tǒng)的識別率相比要高一些,,而且受光照影響并不大,,識別率波動范圍小,整體保持在一個穩(wěn)定水平,,說明該方法有很好的光照自適應(yīng)性,。
本文在傳統(tǒng)BP算法基礎(chǔ)上加以改進(jìn),,使得網(wǎng)絡(luò)避免陷入局部最小值,而且收斂速度有了顯著提高,。將改進(jìn)后的BP算法應(yīng)用于足球機(jī)器人全向視覺系統(tǒng)的目標(biāo)識別中,,結(jié)果顯示,該算法識別快速,、精準(zhǔn),,具有良好的光照自適應(yīng)能力。
參考文獻(xiàn)
[1] NEVES A J R,,CORRENTE G,,PINHO A J.An omnidirec-tional vision system for soccer robots[C].Proceedings of the EPIA 2007,Lecture Notes in Artificial Intelligence,,Berlin,,Germany:Springer-Verlag,2007,,4874:499-507.
[2] MOHAN S,,PETER S.Color learning and illumination vari-ance on mobile robots:a survey[J].Robotics and AutonomousSystem,2009,,75(1):1-38.
[3] 洪炳熔,,韓學(xué)東,孟偉.機(jī)器人足球比賽研究[J].機(jī)器人,,2003,,25(4):373-377.
[4] 戚瑋瑋,欒新,,宋大雷,,等.一種魯棒的基于全景視覺的機(jī)器人目標(biāo)識別方法[J].中國海洋大學(xué)學(xué)報,2011,,41(6):109-114.
[5] JUNGEL M,,HOFFMANN J,TZSCH M L.A real-time au-to-adjusting vision system for robotic soccer.RoboCup 2003:Robot Soccer World Cup VII,,2004:214-225.
[6] 李偲.全自主足球機(jī)器人視覺系統(tǒng)的研制[M].青島:中國海洋大學(xué),2008.
[7] 張國忠.智能控制系統(tǒng)及應(yīng)用[M].北京:中國電力出版社,,2007.
[8] 趙明旺,,王杰.智能控制[M].武漢:華中科技大學(xué)出版社,2010.