2020年4月9日,,中共中央,、國務院發(fā)布《中共中央國務院關于構建更加完善的要素市場化配置體制機制的意見》,,提出“土地,、勞動力、資本,、技術和數(shù)據(jù)”五個要素領域改革方向,,明確數(shù)據(jù)已經(jīng)成為新的生產(chǎn)要素,參與到社會生產(chǎn)生活各環(huán)節(jié),。數(shù)據(jù)通過動態(tài)流動創(chuàng)造價值、提高政府治理能力,,同時也面臨數(shù)據(jù)竊取,、數(shù)據(jù)泄露、個人隱私安全等問題,。為了保障作為生產(chǎn)要素的數(shù)據(jù)安全,,需要正確理解認識數(shù)據(jù)特性,把握數(shù)據(jù)安全特點,,建設以數(shù)據(jù)為中心的安全保障體系,,切實保障數(shù)據(jù)參與生產(chǎn)過程各環(huán)節(jié)安全。
一,、概述
1.數(shù)據(jù)特性
在大數(shù)據(jù)時代,,數(shù)據(jù)參與社會生產(chǎn)過程,實現(xiàn)價值增值,,是一種新型生產(chǎn)要素,,具有以下特性:
(1)增值性,。在大數(shù)據(jù)時代,,數(shù)據(jù)可以通過分析挖掘等手段產(chǎn)生新的數(shù)據(jù),挖掘新的信息和情報,,生成新的數(shù)據(jù)產(chǎn)品,,形成新的數(shù)據(jù)業(yè)務,實現(xiàn)價值的增加,。
?。?)流動性。數(shù)據(jù)作為新型生產(chǎn)要素參與社會生產(chǎn)過程,,需要從一個系統(tǒng)流動到另一個系統(tǒng),,從一個網(wǎng)絡區(qū)域流動到另一個網(wǎng)絡區(qū)域,從一個組織流動到另一個組織。數(shù)據(jù)流動是實現(xiàn)價值增值的前提和基礎,。
?。?)復雜的權屬性。在大數(shù)據(jù)時代,,除了數(shù)據(jù)擁有者,,還有數(shù)據(jù)主體、數(shù)據(jù)提供者和數(shù)據(jù)消費者等角色,,不同角色擁有數(shù)據(jù)的不同權益,,如數(shù)據(jù)主體對數(shù)據(jù)擁有訪問權、更正權和遺忘權等,。
2.數(shù)據(jù)安全特點
由于數(shù)據(jù)具有增值性,、流動性和復雜的權屬性等特性,在數(shù)據(jù)安全保護方面具有以下特點:
?。?)嚴格的合規(guī)要求,。國內外新增了一系列數(shù)據(jù)安全保護法律法規(guī)和標準規(guī)范,針對數(shù)據(jù)安全保護提出嚴格要求,。如歐盟的《通用數(shù)據(jù)保護條例》,,我國的《網(wǎng)絡安全法》《數(shù)據(jù)安全法(草案)》和《信息安全技術 個人信息安全規(guī)范》(GB/T 35273-2017)等。同時,,保護范圍覆蓋全面,,涵蓋數(shù)據(jù)采集、存儲,、使用,、發(fā)布、共享,、離境等全生命周期和用戶權利保護等內容,。
(2)開放的應用環(huán)境,。作為生產(chǎn)要素的數(shù)據(jù),,為了實現(xiàn)增值目標,需要通過API接口與第三方系統(tǒng)交換共享數(shù)據(jù),,增加了數(shù)據(jù)暴露面,,相對處于更加開放的環(huán)境。
?。?)復雜的應用場景,。數(shù)據(jù)在參與生產(chǎn)過程中,存在數(shù)據(jù)在組織內部進行匯聚融合,、向監(jiān)管單位提供數(shù)據(jù),、與第三方交換共享數(shù)據(jù),、數(shù)據(jù)服務外包、數(shù)據(jù)跨境傳輸?shù)葢脠鼍?,不同的應用場景可能帶來新的安全風險,,增加了數(shù)據(jù)安全保護的難度。
?。?)多維的關聯(lián)分析,。不同來源、不同類別的數(shù)據(jù)匯聚融合后,,可以從多個維度對數(shù)據(jù)進行關聯(lián)分析,,產(chǎn)生新的、更有價值的數(shù)據(jù),。這些新產(chǎn)生的數(shù)據(jù)在帶來新的價值的同時,,也可能產(chǎn)生未知安全風險,如泄露個人隱私,、組織秘密和國家機密等,。
二、數(shù)據(jù)安全保護面臨的問題
根據(jù)數(shù)據(jù)安全具有的特點,,從認知觀念、標準規(guī)范和生產(chǎn)過程等方面對數(shù)據(jù)安全保護面臨的問題進行分析,。
1.對數(shù)據(jù)安全的認知觀念存在誤區(qū)
目前,,對數(shù)據(jù)安全的認知存在誤區(qū),主要體現(xiàn)在以下幾個方面:(1)數(shù)據(jù)安全保護理念落后,。認為傳統(tǒng)的信息安全保障思路仍然能夠解決目前數(shù)據(jù)安全遇到的問題,,忽視了數(shù)據(jù)是新型生產(chǎn)要素,沒有把握住數(shù)據(jù)動態(tài)流動等特點,,缺乏以數(shù)據(jù)為中心的安全保護理念,。(2)窄化數(shù)據(jù)安全保護目標。認為數(shù)據(jù)安全保護就是保障數(shù)據(jù)機密性,、完整性和可用性,,忽視了數(shù)據(jù)具有權屬性,保護數(shù)據(jù)相關角色的權益也是數(shù)據(jù)安全保護的目標之一,。(3)簡化數(shù)據(jù)安全保護手段,。認為數(shù)據(jù)安全保護就是區(qū)域邊界防護,只需在區(qū)域邊界采取身份鑒別,、訪問控制,、安全審計等技術手段,忽視了數(shù)據(jù)具有流動性,,在流動過程中更需要通過數(shù)據(jù)脫敏,、數(shù)據(jù)溯源分析,、數(shù)據(jù)安全持續(xù)風險監(jiān)測等技術手段。
2.數(shù)據(jù)安全相關的標準規(guī)范不健全
由于數(shù)據(jù)安全事件頻發(fā),,為了控制數(shù)據(jù)安全風險,,保護個人的合法權益,維護國家安全,,我國十分重視數(shù)據(jù)安全立法工作,。在《網(wǎng)絡安全法》中提出了“國家鼓勵開發(fā)網(wǎng)絡數(shù)據(jù)安全保護和利用技術”“防止網(wǎng)絡數(shù)據(jù)泄露或被竊取、篡改”等要求,;在《數(shù)據(jù)安全法(草案)》中提出了“國家對數(shù)據(jù)實行分級分類保護”“開展數(shù)據(jù)活動必須履行數(shù)據(jù)安全保護義務,,承擔社會責任”等,具體包括建立健全數(shù)據(jù)安全治理體系,,建立數(shù)據(jù)安全風險評估,、數(shù)據(jù)安全應急處置機制,建立數(shù)據(jù)安全審查等數(shù)據(jù)安全管理制度,,實現(xiàn)數(shù)據(jù)自由安全流動,。在《全球數(shù)據(jù)安全倡議》中呼吁各國秉持發(fā)展和安全并重的原則,平衡處理技術進步,、經(jīng)濟發(fā)展與保護國家安全和社會公共利益的關系,。但是,目前缺乏與《數(shù)據(jù)安全法(草案)》《全球數(shù)據(jù)安全倡議》等配套的實施細則與標準規(guī)范,,數(shù)據(jù)安全保護工作難以達到預期效果,。
3.數(shù)據(jù)參與生產(chǎn)過程帶來安全風險
由于數(shù)據(jù)具有流動性等特性,數(shù)據(jù)安全具有嚴格的合規(guī)要求,、開放的應用環(huán)境和復雜的應用場景等特點,,數(shù)據(jù)在存儲訪問、分析挖掘,、開放共享,、交易流通和數(shù)據(jù)產(chǎn)品使用等生產(chǎn)過程中存在一定的安全風險。
?。?)存儲訪問過程安全風險
由于數(shù)據(jù)具有海量規(guī)模,,存儲數(shù)據(jù)的平臺以分布式大數(shù)據(jù)系統(tǒng)為主。當前,,建設大數(shù)據(jù)系統(tǒng)主要采用基于開源產(chǎn)品搭建,、開源產(chǎn)品二次封裝、采購國外產(chǎn)品等方式,。以上三種模式的核心還是離不開開源產(chǎn)品和國外產(chǎn)品,,關鍵技術不能安全可控,數(shù)據(jù)在存儲和訪問過程中面臨數(shù)據(jù)泄露風險,。根據(jù)國家漏洞庫(CNNVD)統(tǒng)計數(shù)據(jù)顯示,,截至今年9月底,,Hadoop存在權限控制、輸入驗證,、目錄遍歷,、信息泄露等27個漏洞,Spark存在權限控制,、跨站腳本等45個漏洞,,MongoDB存在訪問控制等26個漏洞。因安全漏洞導致大量數(shù)據(jù)丟失和數(shù)據(jù)泄露,,如2019年5月,,MongoDB因安全漏洞導致超過1.2萬個數(shù)據(jù)庫被攻擊者刪除。2020年9月,,微軟的Elasticsearch數(shù)據(jù)庫因存在身份認證缺陷,,數(shù)據(jù)庫直接暴露在互聯(lián)網(wǎng)上,導致1億多條數(shù)據(jù)泄露,。
?。?)分析挖掘過程安全風險
在分析挖掘過程中存在以下安全問題:1)泄露用戶隱私信息。通過知識挖掘,、機器學習,、人工智能等技術,將過去分離的信息進行關聯(lián),、碰撞和整合,,可以重新刻畫用戶的興趣愛好、政治傾向和人格特征等,,使原始數(shù)據(jù)中被隱藏的信息再次顯現(xiàn)出來,甚至分析挖掘后得到的信息遠遠大于原始數(shù)據(jù)所擁有的信息,;2)人工智能技術帶來數(shù)據(jù)安全問題,。因人工智能學習框架和組件存在安全漏洞,導致訓練數(shù)據(jù)存在竊取和泄露風險,。某安全團隊在一個月的時間里發(fā)現(xiàn)了數(shù)十個深度學習框架及其依賴庫存在內存訪問越界,、空指針引用、整數(shù)溢出,、除零異常等漏洞,,使深度學習應用存在數(shù)據(jù)泄露、數(shù)據(jù)污染等安全風險,。3)數(shù)據(jù)濫用,。數(shù)據(jù)分析人員在開展業(yè)務的過程中,沒有嚴格按照業(yè)務目標和業(yè)務要求進行數(shù)據(jù)分析和挖掘,,基于授權的數(shù)據(jù)進行違規(guī)操作,,開展與業(yè)務目標不相關的分析挖掘,,導致用戶隱私泄露。如某電子商務網(wǎng)站要求基于用戶的購買歷史數(shù)據(jù)和查看商品記錄預測用戶感興趣的商品,,業(yè)務目標是對用戶可能購買的商品進行自動推薦,。但是,數(shù)據(jù)分析員可以基于這些數(shù)據(jù)對用戶的職業(yè),、興趣愛好等進行分析,,導致用戶隱私泄漏。4)侵犯數(shù)據(jù)主體權益,。按照《數(shù)據(jù)安全法(草案)》等要求,,需要采取特定技術手段對數(shù)據(jù)主體提供訪問權、控制權,、更正權等權益保護,,使數(shù)據(jù)主體能夠及時了解、掌握自身數(shù)據(jù)參與數(shù)據(jù)分析挖掘的業(yè)務過程和參與程度,。如數(shù)據(jù)在做某種用途的分析時,,數(shù)據(jù)主體提出異議,需要能立即把相關數(shù)據(jù)從分析作業(yè)中刪除,。但是,,目前并沒有相應的生產(chǎn)流程和技術系統(tǒng)能夠滿足數(shù)據(jù)主體權益保護要求。5)產(chǎn)生不可預知的安全風險,。大數(shù)據(jù)分析是一把雙刃劍,,分析結果除了能夠實現(xiàn)正常的業(yè)務目標外,還可能產(chǎn)生其他難以預料的結果,。如2016年劍橋分析事件,,通過調查問卷收集美國選民所關注的問題,對這些數(shù)據(jù)進行分析后居然能夠得知每個選民的政治傾向,,然后投放有針對性的廣告來引導他們的投票結果,,最終達到干擾政治選舉的目的。
?。?)開放共享過程安全風險
首先,,由于海量數(shù)據(jù)治理困難,以及對分析過程中新產(chǎn)生的數(shù)據(jù)很難及時制定開放共享策略,,使開放共享過程中存在不合規(guī)的開放和共享,,導致數(shù)據(jù)泄漏。其次,,在共享過程中,,數(shù)據(jù)已經(jīng)脫離所有者的控制,數(shù)據(jù)追蹤溯源技術并不成熟,,無法跟蹤數(shù)據(jù)的最終去向和使用情況,,使數(shù)據(jù)處于失控狀態(tài),。再次,由于數(shù)據(jù)脫敏技術不成熟,,脫敏后的數(shù)據(jù)會改變數(shù)據(jù)間原有的關系,,降低數(shù)據(jù)價值。部分組織為了實現(xiàn)數(shù)據(jù)價值最大化,,在未脫敏或脫敏不夠的情況下共享數(shù)據(jù),,導致數(shù)據(jù)面臨泄露的安全風險。最后,,由于數(shù)據(jù)融合技術的發(fā)展,,不同來源、不同維度的數(shù)據(jù)經(jīng)過匯聚融合后,,很可能把脫敏前的原始數(shù)據(jù)還原出來,。
(4)交易流通過程安全風險
交易流通是數(shù)據(jù)價值體現(xiàn)的基本途徑,,更是盤活數(shù)據(jù),、用好數(shù)據(jù)的關鍵環(huán)節(jié)。目前,,典型的數(shù)據(jù)交易模式是代理商模式,,由數(shù)據(jù)提供者、數(shù)據(jù)代理商(中介)和數(shù)據(jù)消費者等三個角色組成,。數(shù)據(jù)提供者擁有數(shù)據(jù)資源,,把數(shù)據(jù)賣給數(shù)據(jù)代理商。數(shù)據(jù)代理商既可以把交易的原始數(shù)據(jù)賣給數(shù)據(jù)消費者,,又可以把基于原始數(shù)據(jù)進行挖掘分析得到價值更高的分析結果數(shù)據(jù)賣給數(shù)據(jù)消費者,。在數(shù)據(jù)交易流通過程中,一方面,,數(shù)據(jù)提供者主要通過爬蟲等技術采集數(shù)據(jù),,可能侵犯用戶個人隱私。2019年9月,,魔蝎科技和同盾科技等多家第三方大數(shù)據(jù)公司因非法采集和向金融機構提供用戶數(shù)據(jù),侵犯用戶個人隱私而被公安機關調查,。另一方面,,數(shù)據(jù)已經(jīng)脫離數(shù)據(jù)擁有者的掌控,數(shù)據(jù)代理商取代數(shù)據(jù)擁有者,,成為數(shù)據(jù)的掌控者,。因此,數(shù)據(jù)代理商等第三方的數(shù)據(jù)安全防護能力和安全管理力度決定數(shù)據(jù)的安全性,。根據(jù)美國銀行信用卡發(fā)行商TCM Bank公開消息,,由于第三方供應商管理的網(wǎng)站存在配置錯誤問題,,導致信用卡申請人數(shù)據(jù)在2017年3月至2018年7月期間暴露在互聯(lián)網(wǎng)上長達16個月。
?。?)數(shù)據(jù)產(chǎn)品使用過程安全風險
目前,,隨著信息系統(tǒng)整合共享等一系列舉措的實施和推進,海量數(shù)據(jù)資源進一步共享和匯聚,,為數(shù)據(jù)產(chǎn)品的開發(fā)打好了堅實的基礎,,數(shù)據(jù)的下一站即是數(shù)據(jù)應用——數(shù)據(jù)產(chǎn)品。但是,,數(shù)據(jù)產(chǎn)品可能給個人,、組織和國家?guī)戆踩L險。一方面,,由于數(shù)據(jù)產(chǎn)品是基于用戶個人信息或者其它社會數(shù)據(jù)等開發(fā)出來的,,目前既缺乏相關法律法規(guī)和標準規(guī)范對數(shù)據(jù)產(chǎn)品的開發(fā)進行指導和約束,又缺乏數(shù)據(jù)產(chǎn)品相關的檢測評估機構和檢測技術手段,,在數(shù)據(jù)產(chǎn)品上市交易前沒辦法對其可能帶來的安全風險進行評估,。另一方面,由于數(shù)據(jù)產(chǎn)品作為商品在交易過程中存在再次轉手交易的情況,,以及數(shù)據(jù)產(chǎn)品具有易復制,、修改等特點,使數(shù)據(jù)產(chǎn)品在使用,、流通過程中面臨被非法復制,、非法傳播、非法篡改和知識產(chǎn)權竊取等安全風險,。
三,、建議
針對數(shù)據(jù)安全保護存在的問題,需要結合數(shù)據(jù)安全特點,,提高對數(shù)據(jù)安全的理解認識,,完善數(shù)據(jù)安全標準規(guī)范,建設以數(shù)據(jù)為中心的安全保障體系,。
1.正確理解認識數(shù)據(jù)安全保護
一方面,,需要把握數(shù)據(jù)的本質特征。數(shù)據(jù)不僅是資產(chǎn),,更是一種生產(chǎn)要素,,通過對數(shù)據(jù)進行分析挖掘,能夠產(chǎn)生新的數(shù)據(jù),,得到新的數(shù)據(jù)產(chǎn)品,。通過共享和交易,數(shù)據(jù)在碰撞、關聯(lián)和比對等過程中能夠最大化數(shù)據(jù)的價值,。而數(shù)據(jù)在分析挖掘,、共享交易等動態(tài)流轉過程中,更容易面臨隱私泄漏,、數(shù)據(jù)竊取,、數(shù)據(jù)誤用和濫用等安全風險。另一方面,,需要轉變數(shù)據(jù)安全保護理念,。數(shù)據(jù)使用場景多而復雜,應用環(huán)境開放,,傳統(tǒng)的安全防護措施難以適應新的應用場景,。需要結合數(shù)據(jù)安全具有的新特點,以數(shù)據(jù)為核心,,以生產(chǎn)過程中用戶對數(shù)據(jù)的操作,、訪問行為和被訪問的數(shù)據(jù)為分析對象,建立風險控制模型,,對數(shù)據(jù)的流向,、數(shù)據(jù)訪問頻次和數(shù)據(jù)體量等持續(xù)進行安全風險監(jiān)測,實現(xiàn)數(shù)據(jù)安全,、自由流動,。
2.加快完善數(shù)據(jù)安全標準規(guī)范
一方面,在全球層面需要統(tǒng)籌制定全球數(shù)據(jù)安全標準規(guī)范,。依據(jù)《全球數(shù)據(jù)安全倡議》提出的原則和內容,,聯(lián)合世界其他國家簽訂雙邊或多邊承諾協(xié)議,在普遍參與的基礎上達成國際共識,,制定相關標準規(guī)范,。另一方面,在國家層面需要制定與數(shù)據(jù)安全法等配套的標準規(guī)范與實施細則,。需要以《數(shù)據(jù)安全法(草案)》為指導,,統(tǒng)籌考慮現(xiàn)有數(shù)據(jù)安全標準,查漏補缺,。組織數(shù)據(jù)提供者,、數(shù)據(jù)代理商(中介)和數(shù)據(jù)消費者等數(shù)據(jù)參與單位,規(guī)劃涵蓋數(shù)據(jù)生產(chǎn)全生命周期的安全標準體系,,加快研制數(shù)據(jù)安全風險評估,、數(shù)據(jù)安全審計和數(shù)據(jù)安全應急響應等重點標準,支撐《數(shù)據(jù)安全法(草案)》的落地與實施,。
3.建設以數(shù)據(jù)為中心的安全保障體系
針對數(shù)據(jù)安全面臨的問題,需要構建以數(shù)據(jù)為中心的動態(tài)安全防控體系,,通過數(shù)據(jù)治理,、安全防護措施,、風險識別和審計溯源等手段重點識別和控制數(shù)據(jù)訪問、應用和流轉等動態(tài)過程中的安全風險,。第一,、數(shù)據(jù)治理。通過大數(shù)據(jù)治理實現(xiàn)數(shù)據(jù)分類分級,、數(shù)據(jù)溯源,,能夠從全域的角度“看得見、看得清”所有的數(shù)據(jù),,包括數(shù)據(jù)存儲,、使用流轉情況和對應的數(shù)據(jù)安全策略。掌握數(shù)據(jù)流動情況,,包括表與表之間的流動,、系統(tǒng)之間的流動、部門之間的流動,、單位之間的流動等等,;第二、部署安全防護措施,。在大數(shù)據(jù)基礎設施,、數(shù)據(jù)挖掘分析和共享交易等方面采取安全防護措施,保障數(shù)據(jù)安全,;第三,、主動識別和控制風險。通過收集基礎設施,、用戶操作,、數(shù)據(jù)流轉等方面的日志數(shù)據(jù),重點識別用戶對數(shù)據(jù)的異常操作風險和數(shù)據(jù)的異常流動風險,;第四,、安全審計與溯源分析。通過細粒度的數(shù)據(jù)行為審計與溯源能力建設,,形成事后可審計,、可溯源、可追責的威懾體系,。
(本文刊登于《中國信息安全》雜志2020年第11期)