這次開發(fā)出的數(shù)據(jù)保護工具,可確保關鍵數(shù)據(jù)集中的敏感個人信息通過嚴密檢查后再公開共享,比如用于跟蹤COVID-19疫情蔓延的數(shù)據(jù)集,。
澳大利亞國家科學機構(CSIRO)下轄Data61專家小組,、新南威爾士州政府、澳大利亞計算機協(xié)會(ACS)等多家機構合作開發(fā)了一款隱私保障工具,,被命名為個人信息因素(Personal Information Factor,,簡稱PIF),可評估任意數(shù)據(jù)集內的個人數(shù)據(jù)風險,,建立起有針對性的高效保護機制,。
傳統(tǒng)上,這類評估往往由領先的數(shù)據(jù)與隱私專家進行,。如今,,專家們可以使用計算機模型快速驗證數(shù)據(jù)敏感性評估結果。
自2020年以來,,澳大利亞國家科學機構一直與本國網(wǎng)絡安全合作研究中心(CSCRC)合作探索增強這款工具的方法,。
01 使用復雜的數(shù)據(jù)分析算法
PIF工具使用了一種復雜的數(shù)據(jù)分析算法,對數(shù)據(jù)集敏感信息的還原風險(已脫敏的個人信息是否還能與實際所有者重新匹配起來)做出評估,。
自2020年3月以來,,新南威爾士州政府一直使用這款工具的早期版本對州內的COVID-19疫情傳播數(shù)據(jù)集進行跟蹤,旨在保證數(shù)據(jù)內容公開發(fā)布前得到適當保護。
新南威爾士州政府首席數(shù)據(jù)科學家Ian Oppermann博士表示,,“目前,,PIF工具的作用可以說是獨一無二。它經(jīng)歷了長期的合作與發(fā)展,,源自各州,、聯(lián)邦政府以及行業(yè)從業(yè)者們的不懈努力?!?/p>
“每一天,,它都在幫助我們對新南威爾士州民眾的匿名COVID-19感染數(shù)據(jù)集進行安全性與隱私風險評估。在它的幫助下,,我們能夠在公開發(fā)布數(shù)據(jù)內容之前,,將敏感信息還原風險降至最低水平?!?/p>
Oppermann博士還提到,,COVID-19進一步增強了公眾對于數(shù)據(jù)隱私需求的認識。
Oppermann博士指出,,“考慮到社區(qū)對于不斷增長的COVID-19病例的強烈關注,,我們需要在細粒度層級上及時發(fā)布關鍵信息,詳細介紹何時,、何處確認了新的COVID-19病例,。這項工作要求我們在疫情流行初期推理出可能的感染原因,并確認感染者的年齡范圍,?!?/strong>
“我們希望相關數(shù)據(jù)盡可能詳盡精準,同時切實保護與這些數(shù)據(jù)集相關的個人隱私與身份信息,?!?/p>
02 數(shù)據(jù)去身份化方法可進一步提高隱私水平
澳大利亞國家科學機構Data61項目首席研究員兼高級研究科學家Sushmita Ruj博士表示,新的數(shù)據(jù)去身份化方法有望進一步提高隱私水平,,并保證個人私密數(shù)據(jù)得到嚴格保護,。
Ruj博士提到,“在研究了多種隱私指標之后,,研究小組決定采取一種統(tǒng)一的衡量方法,,用于評估對特定數(shù)據(jù)成功進行身份還原的風險水平?!?/p>
“PIF一直在探索新的方法,,考慮如何消除各類能夠實現(xiàn)身份還原的攻擊方法,并據(jù)此對不同數(shù)據(jù)集采用量身定制的保護手段,。以此為基礎,,該工具將為各個數(shù)據(jù)集做出一項PIF評分,。”
如果PIF高于所需的閾值,,則程序將提出如何提高框架安全水平,、證明數(shù)據(jù)集可以安全公開發(fā)布的相關建議。
澳大利亞網(wǎng)絡安全合作研究中心研究主任Helge Janicke教授表示,,最重要的目標是在信息共享需求與保護隱私之間找到平衡點,。Janicke教授提到,“在PIF的幫助下,,各方可以充分了解風險水平,這無疑補充了相關工具領域的空白,?!?/p>
“數(shù)據(jù)分析已經(jīng)成為一項廣為人知的技術方案,但我們以往很難把握共享輸出結果的具體質量,。正因為如此,,PIF在根據(jù)指標評估關鍵數(shù)據(jù)共享行為的道德保障與負責任水平方面,發(fā)揮著極為重要的作用,。借助這項技術,,數(shù)據(jù)所有者可以全面評估與數(shù)據(jù)共享相關的風險與后續(xù)影響?!?/p>
PIF工具還可用于檢查其他有待發(fā)布的數(shù)據(jù)集,,比如在COVID-19社交隔離期間收集到的家庭暴力數(shù)據(jù)與公共交通工具使用數(shù)據(jù)。CSIRO Data61與CSCRC將繼續(xù)開發(fā)PIF工具,,并規(guī)劃在2022年6月之前進入外部推廣階段,。