引用格式: 趙國(guó)順,,方建安,,瞿斌杰,等. 基于頻域注意力時(shí)空卷積網(wǎng)絡(luò)的步態(tài)識(shí)別方法[J].信息技術(shù)與網(wǎng)絡(luò)安全,,2020,,39(6):13-18.
步態(tài)特征,,通俗來說就是人行走時(shí)的姿態(tài)外觀,,具體包括手臂、大腿,、小腿等身體輪廓的變化,,由于步態(tài)的采集不需要與被識(shí)別者有物理上的接觸,也不需要近距離的接觸,,因此應(yīng)用場(chǎng)景比較完善,。醫(yī)學(xué)研究表明,每一個(gè)人的步態(tài)都有自己的形態(tài),,具有唯一性,,使用步態(tài)識(shí)別具有一定的安全性,不會(huì)導(dǎo)致信息的錯(cuò)誤,。將步態(tài)識(shí)別技術(shù)應(yīng)用于當(dāng)今智能監(jiān)控領(lǐng)域,,可以在多場(chǎng)景下對(duì)人員進(jìn)行監(jiān)控,防止意外情況發(fā)生,,也有利于鎖定犯罪嫌疑人,,節(jié)省人力物力。
目前,,關(guān)于步態(tài)識(shí)別的方法主要有兩種,。一種是基于步態(tài)模板的方法,主要是通過構(gòu)建步態(tài)特征,比如關(guān)節(jié)點(diǎn)的位置變化,、重心的起伏周期等幾何數(shù)字特征,,將一個(gè)人的行走視頻序列壓縮成一個(gè)模板,然后通過匹配待預(yù)測(cè)行人的步態(tài)與模板的相似度進(jìn)行識(shí)別,。另一種方法是通過深度學(xué)習(xí)直接抽取原始圖像序列的步態(tài)信息,,通過深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)高維時(shí)空信息來匹配行人的步態(tài),這種方法不需要大量精細(xì)的特征構(gòu)建,,是一種端到端的識(shí)別方法,。
雖然基于步態(tài)模板的方法取得了一定的準(zhǔn)確率,但是這種特征構(gòu)造方法復(fù)雜,,而且受角度,、環(huán)境、穿著變化影響較大,,同時(shí)這種特征缺失了時(shí)空信息的抽取,,在精度上具有一定的限制性。深度學(xué)習(xí)方法是一種端到端的學(xué)習(xí)方法,,魯棒性強(qiáng),,易于操作,但是由于模型參數(shù)巨大,,如何保證準(zhǔn)確性與實(shí)時(shí)性成了關(guān)鍵,。
本文基于深度學(xué)習(xí)的方法,改良了三維卷積網(wǎng)絡(luò)(C3D)的網(wǎng)絡(luò)結(jié)構(gòu),,提出頻域注意力卷積操作,,主要通過劃分頻域空間,引進(jìn)頻域卷積,。同時(shí)另一個(gè)創(chuàng)新主要是注意力機(jī)制的引入,,這使得網(wǎng)絡(luò)更加關(guān)注不同步態(tài)之間的不同,調(diào)整步態(tài)分布的重要性,,提升網(wǎng)絡(luò)學(xué)習(xí)效果,。經(jīng)由中科大數(shù)據(jù)集CASIA dataset B檢測(cè),本文方法在跨視角實(shí)驗(yàn)和方法對(duì)比實(shí)驗(yàn)中具有提升,。
本文詳細(xì)內(nèi)容請(qǐng)下載:http://wldgj.com/resource/share/2000003146
作者信息:
趙國(guó)順1,2,,方建安1,2,,瞿斌杰1,,2,Samah A.F.Manssor1,,2,,孫韶媛1,,2
(1.東華大學(xué) 信息科學(xué)與技術(shù)學(xué)院,上海201620,;
2.數(shù)字化紡織服裝技術(shù)教育部工程研究中心,,上海201620)