基于增強(qiáng)語義信息理解的場(chǎng)景圖生成
所屬分類:技術(shù)論文
上傳者:zhoubin333
文檔大?。?span>4006 K
標(biāo)簽: 場(chǎng)景圖生成 圖像裁剪 語義轉(zhuǎn)化
所需積分:0分積分不夠怎么辦,?
文檔介紹:場(chǎng)景圖生成(SGG)任務(wù)旨在檢測(cè)圖像中的視覺關(guān)系三元組,即主語、謂語,、賓語,為場(chǎng)景理解提供結(jié)構(gòu)視覺布局,。然而,,現(xiàn)有的場(chǎng)景圖生成方法忽略了預(yù)測(cè)的謂詞頻率高但卻無信息性的問題,從而阻礙了該領(lǐng)域進(jìn)步,。為了解決上述問題,,提出一種基于增強(qiáng)語義信息理解的場(chǎng)景圖生成算法。整個(gè)模型由特征提取模塊,、圖像裁剪模塊,、語義轉(zhuǎn)化模塊、拓展信息謂詞模塊四部分組成,。特征提取模塊和圖像裁剪模塊負(fù)責(zé)提取視覺特征并使其具有全局性和多樣性,。語義轉(zhuǎn)化模塊負(fù)責(zé)將謂詞之間的語義關(guān)系從常見的預(yù)測(cè)中恢復(fù)信息預(yù)測(cè)。拓展信息謂詞模塊負(fù)責(zé)擴(kuò)展信息謂詞的采樣空間,。在數(shù)據(jù)集VG和VG-MSDN上與其他方法進(jìn)行比較,,平均召回率分別達(dá)到59.5%和40.9%。該算法可改善預(yù)測(cè)出來的謂詞信息性不足問題,,進(jìn)而提升場(chǎng)景圖生成算法的性能,。
現(xiàn)在下載
VIP會(huì)員,AET專家下載不扣分,;重復(fù)下載不扣分,,本人上傳資源不扣分。