引言
隨著信息化的快速發(fā)展,,網(wǎng)絡(luò)流量的安全性備受關(guān)注。近年來(lái),,隨著 SSL/TLS 等流量加密算法的普及,,加密流量比例已超過(guò) 90%。雖然加密技術(shù)提升了信息傳輸?shù)陌踩?,但越?lái)越多的惡意軟件通過(guò)加密技術(shù)隱藏自己,,引發(fā)了更多不可控的安全隱患?!吨袊?guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,,截至2023年6月,我國(guó)互聯(lián)網(wǎng)普及率更是高達(dá)76.4%[1],,互聯(lián)網(wǎng)企業(yè)對(duì)加密流量識(shí)別和檢測(cè)的不重視給了不法分子更多可乘之機(jī),如何保障安全的網(wǎng)絡(luò)環(huán)境成為了當(dāng)下的挑戰(zhàn),。SSL/TLS協(xié)議是當(dāng)下主流的加密算法之一,,攻擊者可以通過(guò)將惡意行為嵌入被 SSL/TLS 協(xié)議加密的內(nèi)容中,對(duì)公眾網(wǎng)絡(luò)安全造成威脅,。傳統(tǒng)的基于端口號(hào)和深度包檢測(cè)的流量分析方法在加密流量面前顯得力不從心,。在加密通信時(shí)代,學(xué)界積極探索新的技術(shù)路徑,,如楊旭提出的基于流量統(tǒng)計(jì)特征的分類方法,,將流量外部統(tǒng)計(jì)特征與機(jī)器學(xué)習(xí)相結(jié)合,有效解決了偽裝端口,、加密流量等問(wèn)題,,為加密流量分類提供了新思路[2],。仝鑫等人提出的基于機(jī)器學(xué)習(xí)的加密流量分析方法,展示了該領(lǐng)域在特征工程,、分類器模型等方面的研究進(jìn)展,,在一定程度上提高了加密流量識(shí)別的準(zhǔn)確率[3]。此外,,朱蓓佳等人提出的基于對(duì)比學(xué)習(xí)的加密流量檢測(cè)技術(shù),,通過(guò)設(shè)計(jì)特定的檢測(cè)方案來(lái)提高檢測(cè)準(zhǔn)確率和泛化性,但仍需在保障數(shù)據(jù)安全方面進(jìn)一步探索[4],。在此情形下,,迫切需求一種既能有效利用數(shù)據(jù)又能保障數(shù)據(jù)安全的新技術(shù),聯(lián)邦學(xué)習(xí)等技術(shù)應(yīng)運(yùn)而生,,其核心優(yōu)勢(shì)在于可在不匯聚原始數(shù)據(jù)的前提下進(jìn)行分布式建模,,打破數(shù)據(jù)孤島,實(shí)現(xiàn)數(shù)據(jù)隱私保護(hù)與高效利用的雙重目標(biāo),。面對(duì)這一問(wèn)題,,本研究認(rèn)為,根據(jù)SSL/TLS分別在客戶端與服務(wù)端相互認(rèn)證等技術(shù)特點(diǎn),,使用分布式聯(lián)邦學(xué)習(xí)進(jìn)行本地監(jiān)測(cè)成為了一種可行的方案,。聯(lián)邦學(xué)習(xí)的核心理念是在保證數(shù)據(jù)隱私安全及合法合規(guī)的基礎(chǔ)上,利用各個(gè)節(jié)點(diǎn)完全掌握的數(shù)據(jù)共同建模,,核心優(yōu)勢(shì)在于原始數(shù)據(jù)無(wú)需匯聚在中央服務(wù)器,,在各個(gè)終端服務(wù)器即可進(jìn)行訓(xùn)練和計(jì)算模型梯度信息,只將參數(shù)和梯度等信息上傳至中央服務(wù)器,,通過(guò)加權(quán)等方式整合最終模型,,下發(fā)到各個(gè)服務(wù)器終端,從而有效打破數(shù)據(jù)孤島,,提升模型的效果,。該方法不僅可以有效保護(hù)用戶隱私,還可以綜合大量數(shù)據(jù)使得系統(tǒng)對(duì)加密流量更加敏感,,識(shí)別率大大提高,。 本文研究了基于聯(lián)邦學(xué)習(xí)技術(shù)的SSL/TLS加密流量識(shí)別,通過(guò)預(yù)處理網(wǎng)絡(luò)流量數(shù)據(jù),,提取關(guān)鍵特征,,并利用聯(lián)邦學(xué)習(xí)框架訓(xùn)練模型,實(shí)現(xiàn)了高效的加密流量分類,,同時(shí)保護(hù)了數(shù)據(jù)安全和用戶隱私,。實(shí)驗(yàn)結(jié)果表明,該方法在分類準(zhǔn)確率,、實(shí)時(shí)性和隱私保護(hù)等方面均優(yōu)于傳統(tǒng)方法,。
本文詳細(xì)內(nèi)容請(qǐng)下載:
http://wldgj.com/resource/share/2000006295
作者信息:
崔又文1,2,,馮千燁1,何云華1,,高健桐1,2,,單伯瑜1,2,劉馨妍1
(1.北方工業(yè)大學(xué)信息學(xué)院,,北京100144,;
2.文脈聯(lián)坊(北京)科技有限責(zé)任公司,北京100143)