一、數據孤島阻礙數據發展
當今時代,信息技術日新月異,人類文明正經歷從信息科技(IT)時代向數據科技(DT)時代的飛速變革。數據作為基礎性戰略資源的地位日益凸顯。然而,數據孤島問題突出。出于對數據安全的傳統保護,數據流通的各方彼此難以互信,進而形成數據壟斷,阻礙了數據的共享和利用,使得不同數據擁有方彼此的數據相互分隔,就像海上一座座孤島,互不連通。數據只有流通才能充分釋放價值。在強化數據安全與保護個人隱私的前提下,追求數據價值的最大化釋放是這個時代應有之義。如何在保證數據安全的同時,實現數據“可用不可見”,這是數據安全發展亟需解決的課題。
二、隱私計算實現數據“可用不可見”
隱私計算技術為實現數據的“可用不可見”提供了解決方案,可破解數據保護和利用之間的矛盾,已在金融、醫療、政務等領域開始推廣應用。隱私計算是在保護數據本身不對外泄露的前提下實現數據分析計算的技術集合。隱私計算并不簡單屬于某一學科領域,而是一套包含密碼學、數據科學、人工智能等眾多領域交叉融合的跨學科技術體系。隱私計算技術包括安全多方計算(MPC)、可信執行環境(TEE)和聯邦學習(FL)等。
1. 安全多方計算(MPC)
安全多方計算(MPC)是隱私計算在密碼學領域的主流技術。安全多方計算技術旨在解決數據流通共享中的安全保密問題。安全多方計算問題數學模型是:假設有n個參與方P1、P2…Pn,分別擁有自己的秘密數據x1、x2、…xn,他們希望計算函數f(x1,x2,…xn),要求在不泄漏各自秘密數據的情況下各方協同計算。計算完成時,各方只能得到函數計算結果,而不能得到其他參與方的秘密數據。安全多方計算本身也不是單一技術,包括不經意傳輸、混淆電路、秘密分享和同態加密等多種技術。
不經意傳輸(OT) ,也稱茫然傳輸,是一種保證通信雙方隱私安全的通信協議。在一個n選k不經意傳輸協議中,發送方將n個消息加密后發送給接收方,接收方只能解密接收方所選取的k(k
混淆電路(GC),又稱姚氏電路,它的核心技術是將兩方參與的安全計算函數編譯成布爾電路的形式,并將真值表加密打亂,從而實現電路的正常輸出而又不泄露參與計算的雙方私有信息。由于所有計算都可以歸結為底層的電路運算,因此GC適應性強,可以用在所有可以用電路表示的計算中。但在與其他安全協議進行轉化時的代價較大,電路門數量大時,計算效率較低。
秘密分享(SS),也稱秘密分割或者秘密共享,是將秘密拆成多個份額或者分片(shares) 分給多個參與方。秘密分享根據其原理可以分為基于多項式的秘密分享和加性秘密分享。基于多項式的秘密分享的典型方案是Shamir門限秘密分享,加性秘密分享的典型方案是Beaver 三元組。SS是最早在商業環境中應用的安全多方計算技術之一,技術相對成熟。
同態加密是一種特殊性質的加密方案,支持密文計算。同態加密被譽為密碼學的圣杯。通過同態加密,數據擁有方可以將數據發送給云服務提供商進行處理,而不用擔心數據的原始信息被泄露,使其天然地與云計算具有極高的親和度,成為云計算安全技術體系的制高點。當然,同態加密方案的構造極具挑戰性。可以肯定,既高效又安全的全同態加密方案一旦構造出來,將會極大地推進隱私計算在各類實際場景的落地。
2.聯邦學習(FL)
聯邦學習(FL)基于聯邦架構和機器學習,是一種多個參與方在各數據不出本地的前提下共同完成某項機器學習任務的活動。通過聯邦學習,不同的數據擁有方可以在不交換數據的情況下,建立一個虛擬的共有模型,這個虛擬模型的效果等同于把數據聚合在一起建立的模型。利用聯邦學習構造的虛擬融合,采用“數據不動模型動”的思想,不用聚合原始數據,而是各自在本地進行訓練后交換中間因子,再對模型進行優化迭代。這樣,不同數據擁有方的數據可在本地控制,同時完成聯合建模,彼此之間實現數據“可用不可見”。
3. 可信執行環境(TEE)
可信執行環境,即TEE,是一種具有運算和儲存功能,能提供安全性和完整性保護的獨立處理環境。其基本思想是:在硬件中為敏感數據單獨分配一塊隔離的內存,所有敏感數據的計算均在這塊內存中進行,并且除了經過授權的接口外,硬件中的其他部分不能訪問這塊隔離的內存中的信息,以此來實現敏感數據的隱私計算。TEE的核心思想是隔離。隔離機制是TEE最主要的基礎。通過隔離的安全執行空間,提供對代碼和數據的機密性和完整性保護。目前最有代表、應用最多的技術方案是ARM的TrustZone和Intel的SGX。
小結
作為一類技術的集合,隱私計算技術體系的劃分并未統一。除了上述技術之外,零知識證明、差分隱私等也常被納入其中。伴隨著隱私計算一起出現的相關技術還包括數據脫敏、保留格式加密、區塊鏈等。在選擇技術方案時,只有結合具體場景在性能、安全性和通用性等方面的具體需求,從核心需求痛點入手,才能選擇最合適的技術路線。
三、海泰方圓隱私計算和數據安全產品線
1. 海泰方圓隱私計算技術產品
以安全多方計算、聯邦學習、TEE等為代表的隱私計算技術為流通過程中數據的“可用不可見”提供了解決方案。海泰方圓在安全多方計算、TEE、數據安全治理、數據脫敏、保留格式加密等方面有深入的研究,在秘密分享(密鑰分割)、不經意傳輸、匿名認證等方面均有技術專利授權,同時公司還參與隱私計算相關內容的國家標準和行業標準工作。2022年初公司設計完成基于同態加密的隱私計算服務系統,提供基于密文的數學運算能力和復雜場景的多方聯合計算能力,實現數據“可用不可見”。該系統包含數據方、隱私計算平臺方、計算結果獲取方等多種角色。數據方對數據進行加密后傳給隱私計算平臺,隱私計算平臺基于密文進行計算,將密文計算結果傳給計算結果獲取方,計算結果獲取方擁有解密私鑰,對密文計算結果進行解密得到明文結果。隱私計算服務系統可用于數據安全交易、數據安全出境等場景。
隱私計算服務系統
2. 海泰方圓數據安全產品
當前,數據安全技術領域不斷細分,技術體系不斷完善,而且還在不斷發展之中,可以說,沒有哪項技術是全能而完美的,不同技術和方法的應用往往需要相互融合。事實上,海泰方圓擁有豐富的數據安全類產品,近年推出的數據數據安全新品包括數據安全管控平臺、數據分類分級系統、數據脫敏系統等多種產品。
數據安全管控平臺是“數據安全”能力的底座。平臺關注于數據的安全保護,對數據安全能力進行集中化、標準化、規范化、常態化、場景化管理,全面掌握全域敏感數據資產分類分級及分布情況,有效監控敏感數據流轉路徑和動態流向,通過集中化數據安全管控策略管理,實現數據分布、流轉、訪問過程中的態勢呈現和風險識別。平臺能夠對分類分級后的敏感數據做進一步安全處理,支持數據脫敏、數據加解密和數據完整性保護等安全防護功能。
數據分類分級系統基于AI智能引擎和分類分級模板實現企事業單位數據資產中的敏感信息分類分級自動識別,集中管控敏感信息的靜態分布和動態變化,為數據脫敏、數據資產安全利用提供基礎支撐,輔助決策人員制定數據安全方案。數據分類分級系統適用于企業內部數據資產識別梳理、定位數據資產分布、滿足監管檢測等場景。
數據據脫敏系統是一套在保留原有數據的有效信息特征的情況下,通過對部分數據進行遮蔽、替換、混淆等方法,隱藏數據中敏感信息的系統。系統通過敏感數據發現和處理引擎自動掃描數據庫,智能識別敏感數據,系統默認支持地址脫敏、URL脫敏、身份信息脫敏、電話號碼脫敏等20種脫敏方式,支持自定義脫敏規則設置,支持保留格式加密,能夠應用在生產環境數據導入開發環境、數據跨單位共享等場景。
海泰方圓數據安全產品具有三大技術特色。一是采用專業的密碼技術,包括傳統密碼技術和隱私計算前沿技術。二是采用AI技術,包含NLP(自然語言處理)和知識圖譜等技術。三是采用符合國家標準的DSMM數據安全治理框架,平臺類產品參照國家標準GB/T 37988-2019《信息安全技術 數據安全能力成熟度模型》的DSMM模型構建數據安全治理框架。
海泰方圓以密碼全能力和可信數據治理為核心,提供商用密碼綜合解決方案和可信數據資產管理。海泰方圓愿與業界同仁一道,賦能共贏,推動隱私計算在數據安全治理中發揮更大的價值。
[1]. 深入淺出隱私計算:技術解析與應用實踐. 李偉榮著.機械工業出版社,2022.1.
[2]. 隱私計算:推進數據“可用不可見”的關鍵技術. 閆樹等著.電子工業出版社,2022.3.
[3]. 隱私計算. 陳凱,楊強著.電子工業出版社,2022.2
[4]. Secure Multiparty Computation (MPC).Yehuda Lindell Unbound Tech and Bar-Ilan University.2020.
[5]. A Pragmatic Introduction to Secure Multi-Party Computation.David Evans, Vladimir Kolesnikov and Mike Rosulek. 2018.
[6]. Applications of Secure Multiparty Computation. P.Laud and L.Kamm (Eds.).2015.
[7]. 安全多方計算技術與應用綜述.蘇冠通,徐茂桐,《信息通信技術與政策》2019年5月第5期.
[8]. 基于同態加密的安全多方計算協議及應用.陳立朝,西安科技大學碩士學位論文,2019.
[9]. 大數據隱私動態防護框架.劉孟旭,《軟 件》 2019, Vol. 40, No. 7.
[10]. 《隱私計算白皮書2021》.中國信息通信研究院 隱私計算聯盟,2021.
審核編輯黃昊宇
-
MPC
+關注
關注
2文章
36瀏覽量
21221 -
數據安全
+關注
關注
2文章
681瀏覽量
29939 -
TEE
+關注
關注
0文章
29瀏覽量
10256
發布評論請先 登錄
相關推薦
評論