基于ERNIE-CAB-CNN的稀土專利文本分類模型
所屬分類:技術論文
上傳者:wwei
文檔大小:4277 K
標簽: 稀土專利分類 文本分類 類別注意力
所需積分:0分積分不夠怎么辦,?
文檔介紹:針對稀土專利文本專業(yè)性強的特點以及現(xiàn)有的文本分類方法存在的不足,,鑒于類別注意力在計算機視覺領域的廣泛應用和取得的良好效果,提出了一種用于文本分類的類別注意力模塊(Category Attention Module,,CAB),,并結(jié)合預訓練模型ERNIE和卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks,CNN)構(gòu)建了一個用于稀土專利文本分類的創(chuàng)新模型ERNIE-CAB-CNN,。模型使用ERNIE對專利文本進行向量化,,得到語義信息更加豐富的向量表示后,通過CAB為文本中各個類別的重要特征賦予較高權(quán)值,,使模型可以更準確地區(qū)分不同類別的特征,。最后用CNN進一步提取文本中其他關鍵局部特征,得到的最終文本向量表示用于分類,。通過Patsnap專利數(shù)據(jù)庫官方網(wǎng)站檢索下載稀土專利數(shù)據(jù)構(gòu)建數(shù)據(jù)集進行實驗,,實驗結(jié)果表明,稀土專利文本分類模型ERNIE-CAB-CNN在測試集上分類的準確率,、精確率,、F1分數(shù)分別為82.68%、83.2%,、82.06%,,取得了良好的分類效果。
現(xiàn)在下載
VIP會員,,AET專家下載不扣分,;重復下載不扣分,本人上傳資源不扣分,。