引用格式:魯志敏,,袁勛,陳松.一種基于卷積神經(jīng)網(wǎng)絡(luò)的立體匹配算法設(shè)計(jì)[J].信息技術(shù)與網(wǎng)絡(luò)安全,,2020,39(5):1-5,,21.
立體視覺(jué)作為計(jì)算機(jī)視覺(jué)最為熱門(mén)的研究領(lǐng)域,廣泛應(yīng)用于車(chē)輛的自動(dòng)駕駛,、機(jī)器人導(dǎo)航,、三維重建、物體檢測(cè)和識(shí)別等方面,。立體匹配作為立體視覺(jué)系統(tǒng)中的核心技術(shù),,其匹配的精確度決定著整個(gè)系統(tǒng)的性能。由于拍攝的立體圖像大多存在噪聲干擾,、重復(fù)紋理,、低紋理和遮擋區(qū)域等問(wèn)題,并且受到光照條件的影響,,如何高效快速地獲取精準(zhǔn)的視差圖仍存在著諸多挑戰(zhàn),。
立體匹配算法的典型流程包含匹配代價(jià)計(jì)算、代價(jià)聚合,、視差計(jì)算和視差優(yōu)化四個(gè)步驟[1],,其又分為全局算法和局部算法。局部算法通常使用固定大小的窗口或可變的窗口來(lái)計(jì)算初始代價(jià),,例如Census算法等,,實(shí)現(xiàn)都比較簡(jiǎn)便,但是在視差突變區(qū)域存在諸多弊端,,對(duì)低紋理和遮擋區(qū)域匹配效果差,。全局匹配算法通過(guò)建立全局能量函數(shù),,利用最小化全局能量函數(shù)來(lái)獲取最優(yōu)的視差值[2]。常用的全局匹配算法包含動(dòng)態(tài)規(guī)劃,、圖割法,、置信傳播法、遺傳算法等,。全局匹配算法隨著計(jì)算復(fù)雜度的提升,匹配效果較局部算法有所提升,,但數(shù)據(jù)依賴(lài)性大導(dǎo)致運(yùn)行速度慢,,需要花費(fèi)很長(zhǎng)的時(shí)間進(jìn)行計(jì)算。
為了解決傳統(tǒng)立體匹配算法在低紋理,、遮擋區(qū)域的匹配效果差的問(wèn)題,,本文研究了一種端到端的基于卷積神經(jīng)網(wǎng)絡(luò)的立體匹配算法,并利用了空洞空間金字塔池化(ASPP)[3]網(wǎng)絡(luò)獲取圖像的上下文信息和多尺度的三維卷積網(wǎng)絡(luò)來(lái)擴(kuò)大圖像的感受野,。最終獲得的視差圖的精度遠(yuǎn)高于傳統(tǒng)匹配算法,,對(duì)圖像的邊緣、遮擋區(qū)域的匹配效果都非常優(yōu)異,。
本文詳細(xì)內(nèi)容請(qǐng)下載:http://wldgj.com/resource/share/2000003083
作者信息:
魯志敏,,袁勛,陳松(中國(guó)科學(xué)技術(shù)大學(xué) 信息科學(xué)技術(shù)學(xué)院,,安徽 合肥 230026)