基于深度注意力的融合全局和語義特征的圖像描述模型
所屬分類:技術論文
上傳者:wwei
文檔大?。?span>907 K
標簽: 圖像描述 全局特征 語義特征
所需積分:0分積分不夠怎么辦?
文檔介紹:現有的圖像描述模型使用全局特征時受限于感受野大小相同,,而基于對象區(qū)域的圖像特征缺少背景信息,。為此,提出了一種新的語義提取模塊提取圖像中的語義特征,,使用多特征融合模塊將全局特征與語義特征進行融合,,使得模型同時關注圖像的關鍵對象內容信息和背景信息,。并提出基于深度注意力的解碼模塊,,對齊視覺和文本特征以生成更高質量的圖像描述語句。所提模型在Microsoft COCO數據集上進行了實驗評估,,分析結果表明該方法能夠明顯提升描述的性能,,相較于其他先進模型具有競爭力,。
現在下載
VIP會員,AET專家下載不扣分,;重復下載不扣分,,本人上傳資源不扣分。