文獻(xiàn)標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.200263
中文引用格式: 肖國麟,楊春玲,,陳宇. 基于權(quán)值交互思想的卷積神經(jīng)網(wǎng)絡(luò)量化算法[J].電子技術(shù)應(yīng)用,,2020,46(10):39-41.
英文引用格式: Xiao Guolin,,Yang Chunling,,Chen Yu. Convolutional neural network quantization algorithm based on weight interaction ideas[J]. Application of Electronic Technique,2020,,46(10):39-41.
0 引言
隨著深度學(xué)習(xí)的飛速發(fā)展,,卷積神經(jīng)網(wǎng)絡(luò)(CNN)被越來越多地應(yīng)用于各個領(lǐng)域,如圖像識別[1-2]和目標(biāo)檢測[3-4],。然而,,隨著應(yīng)用要求的提高,CNN的結(jié)構(gòu)越來越深,,導(dǎo)致其對于計算力和內(nèi)存的需求大大提高,。同時由于移動端設(shè)備的飛速發(fā)展,設(shè)備小型化的需求和市場不斷擴(kuò)大,,將CNN應(yīng)用到小型移動端設(shè)備的需求也隨之增加,。然而,,受限于電源、內(nèi)存及功耗,,移動端平臺無法滿足高性能CNN對于硬件性能,、功耗及內(nèi)存的要求,因此優(yōu)化CNN模型從而降低其對于計算資源的要求非常必要[5],。
CNN權(quán)值量化是目前一種主流的CNN模型優(yōu)化方法,,而三值量化其中一種能夠?qū)?quán)值由32位量化到2位(0,±α)從而達(dá)到16倍壓縮比的低位量化方法,。自從2016年三值化網(wǎng)絡(luò)被LI F等人提出以來[6],,其方法不斷改進(jìn),性能不斷提高,。其中MELLEMPUDI N等人于2017年提出的細(xì)粒度三值化網(wǎng)絡(luò)[7],,將激活函數(shù)量化到8或4位,將權(quán)重量化至2位,,將每N個權(quán)值分為一個組,,分組量化,兩組之間相互獨立,,其中N=2,,4,8,,16,,…。該方法主要通過嘗試不同的分組和暴力搜索解空間以及二次訓(xùn)練的方式得到最優(yōu)解,,但相比原精度的32位卷積網(wǎng)絡(luò)仍有較大性能差距,。目前的三值量化網(wǎng)絡(luò)性能不佳的其中一個問題在于都使用對稱均勻量化操作,只考慮了單個權(quán)值的量化,,忽視了相鄰權(quán)值量化之間的相互關(guān)系,,量化噪音直接相互累加,導(dǎo)致每一層網(wǎng)絡(luò)的噪聲積累過高,,使得量化模型的預(yù)測準(zhǔn)確率有極大的下降,。
針對此問題,本文提出一種新的CNN模型三值量化算法,,基于權(quán)值交互思想,,在同一卷積核內(nèi),將先前量化產(chǎn)生的積累噪聲作為一個負(fù)變量加入到下一個權(quán)值的量化操作中,,使得對下一個權(quán)值朝著能減小積累噪聲的方向進(jìn)行量化,。然后,通過層級貪婪搜索算法逐層搜索局部最優(yōu)解,得到效果近似最優(yōu)解的優(yōu)化解,,降低搜索算法復(fù)雜度,,極大減少搜索所需時間。實驗證明,,相比于其他使用對稱均勻量化操作的算法,,本文的算法極大地減小了由于量化操作導(dǎo)致的模型預(yù)測準(zhǔn)確率的損失。
本文詳細(xì)內(nèi)容請下載:http://wldgj.com/resource/share/2000003017
作者信息:
肖國麟,,楊春玲,,陳 宇
(哈爾濱工業(yè)大學(xué) 電氣工程及自動化學(xué)院,黑龍江 哈爾濱150001)