Trias創始人阮安邦博士以及Trias CTO魏明博士受邀參加BlockMania 主辦的「博士大爆炸」第五期AMA直播,分享主題為「數據安全與數據確權」,他們為大家剖析了當前互聯網行業痛點—數據安全問題背后深層次的原因,并分享了Trias運用區塊鏈技術保障數據安全和承載數據確權的解決方案。
以下為AMA全程回顧
我們都知道區塊鏈有防篡改的特性,那么為何中心化的解決方案無法解決「防篡改」的問題呢?為何非得用區塊鏈的分布式方案?
Trias CTO魏明博士:
互聯網公司常用的關系型數據庫,例如mySQL,建一條數據記錄,將用戶的各種屬性值存在里面。
然而這樣的中心化數據庫是很難從技術角度來保證數據不可被篡改的。如果有外部攻擊者在后臺程序里留后門,注入一段代碼,修改了數據庫中的賬戶余額,或者公司內部成員有數據庫權限,直接登進數據庫修改賬戶余額。
在這兩種情況下,數據庫都被篡改了。我們在進行與客戶的技術交流時,客戶提出,遭遇到這樣的情況,他們可以通過備份還原器進行還原。但是如果黑客攻破了備份還原器呢?
如果使用區塊鏈來存儲數據資源,就不會發生這樣的情況,原因是所有區塊鏈上的節點都完整地保留一份交易的歷史記錄,任何單個節點想修改這些歷史記錄,其他節點都可以用自己保存的備份來證偽,并將作弊者踢出網絡,從而保證你的數據不被隨便地篡改或者是被刪除。
從更宏觀的角度來看,中心化的問題是顯而易見的。不但成本與網絡參與者的關系從正和變為零和。繼續增長的最簡單的方法是從用戶中提取數據,并在受眾和利潤方面與補充競爭。
此外,用戶放棄隱私以及對自己數據的控制權,并且容易遭受安全漏洞。中心化平臺存在的這些問題在未來可能會變得更加突出。在這種背景下,區塊鏈的解決方案會實現將數據權益真正還給產生數據的用戶。
但區塊鏈的特性中好像并沒有直接關于「確保數據防泄漏」的屬性,那么大家常說的區塊鏈可以確保數據安全,到底指的是什么呢?
Trias CTO 魏明博士:
數據安全其實主要是兩個維度,一是數據的不可篡改性;另外一個就是數據的隱私安全性。
其實許多人會混淆「可信」與「安全」,能不能嚴格按照給出的命令執行,這就是可信問題;至于這個命令對不對,數據隱私不隱私,這就是一個安全問題了。
而區塊鏈技術本身并不解決任何的安全問題,因此他還是需要搭配安全技術一起使用的,比如非對稱加密、安全隨機數等。
剛才我們聊了區塊鏈解決數據防篡改方案,但是又會遇到新的問題,隱私性怎么辦呢?
其實很多人在區塊鏈上進行交易時,都會發現一個問題。我可以通過查看你的地址,就能大概知道你有多少幣,其實這些信息用戶還是不希望被別人知道的。
從這個角度來說,區塊鏈上的數據在隱私安全方面還有很多事情要做。最近很多的項目,包括我們Trias,一直在解決一個問題,既要保證數據的不可篡改性,又要做到數據的隱私安全性。
我們的解決方案是,是基于可信硬件、可信程序的數據防泄露。在可信程序中保證數據或信息在網上與文件中不會被泄露。在隱私保護技術上,Trias主要使用了隱藏地址(Stealth Addresses)和zk-SNARKs(簡潔的,非交互的零知識證明)。
之所以選擇這樣的技術路徑,是因為:
(1)以我們現在落地的經驗來看,基于現在已有的傳統的安全技術比如DLP、AES加密、HTTPS加密、UEBA用戶行為畫像等等。其實對于數據泄露和非法篡改效果一直都不夠理想;而不論使用任何單一安全技術,比如XX加密,XX墻,XX人工智能分析,我們認為都不能很好的解決問題,得根據不同的安全技術特性和特點來選擇對應的組合來進行解決;
(2)在(1)的基礎上我們選擇了TEE+區塊鏈的方式。因為TEE可以解決可信運行環境,區塊鏈可以解決數據真實性不會被非法篡改,正好是非常好的互補組合。
首先,TEE的一個獨特之處是可以將任務與所有不可信的軟件隔離開來,甚至包括操作系統內核。因此,就連云服務提供商這樣的平臺所有者也無法訪問TEE中的數據。
其次,隱藏地址來源于BIP63,我們在工程上做了實現,隱藏地址的實現基于目前最為成熟和先進的橢圓加密ECC體系,具有很高的效率的同時又具有優良的性能。
最后,目前較為可行的數據隱私保護形式是零知識證明。零知識證明理論是一個非常重要的理論和思維方式,給我們提供了一種能向別人證明擁有某知識但不透漏該知識的一種思維和方法。由S.Goldwasser、S.Micali及C.Rackoff在20世紀80年代初提出的。
它指的是證明者能夠在不向驗證者提供任何有用的信息的情況下,使驗證者相信某個論斷是正確的。零知識證明實質上是一種涉及兩方或更多方的協議,即兩方或更多方完成一項任務所需采取的一系列步驟。證明者向驗證者證明并使其相信自己知道或擁有某一消息,但證明過程不能向驗證者泄漏任何關于被證明消息的信息。大量事實證明,零知識證明在密碼學中非常有用。如果能夠將零知識證明用于驗證,將可以有效解決許多問題。
Trias充分運用了「零知識證明」這一密碼學原理,在區塊鏈記錄中隱藏了交易者的信息,包括交易的金額等,因此除了密鑰所有者,即使別人獲取到了某錢包地址所對應的IP,也無法追溯整個交易鏈,以此確保隱私的安全,即匿名。
Facebook被曝出近7000頁內部機密文件被泄露,一方面展現了硬核高科技公司也會遭遇數據泄露問題,一方面從這些被泄露的文件中也能看出Facebook是如何將用戶數據作為談判籌碼來鞏固自己在互聯網世界的霸主地位的。然而普通用戶既沒有得到應有的保護,也沒有收到數據價值的收益,您怎么看待這個問題?
Trias CTO 魏明博士:
許多在歐洲有業務的國內公司都在詢問我們GDPR,因為國外客戶首先擔心的是數據如何獲取,盈利后是否把利益合理分配給數據貢獻者,如果沒有的話那就是在竊取。
而在充滿中小企業的國內市場,我們可以看到國內公司都宣傳擁有先進的AI技術可以分析數據得到模型。
如果按照GDPR的嚴格標準,可能國內大部分移動互聯網公司以及流量生意公司都會被罰。
好在隨著我國《網絡安全法》的實施,數據保護的現狀已經有所改善。從最近的幾次專項整治中可以看出,中國接下來對數據安全和隱私的要求一定會越來越高,包括獲取用戶數據的途徑和使用方式,未來中國數據隱私相關的市場會很大。
大家越來越認同數據是生產資料,與勞動力、土地、資金相提并論。因此趨勢一定是保護數據的所有權和使用權,讓數據產生的價值能夠被確權、被分享。
但現實也是很骨感,不光技術上還有待突破,其實更多問題是非技術問題。
比如從我們的技術應用落地實踐中看出,許多機構對于數據共享的意識仍然非常薄弱,對于如何實現數據共享的認知更少。
比如在醫院這個場景下,對于大醫院來說,即便信息化程度很低,每天仍有源源不斷的病人和收益。而小醫院則認為,即便提高了信息化程度,也并不會帶來病人和收益,相比之下多一些好的設備和藥物,多幾個主治醫生可能意義更大。
其中的核心問題就是:數據分享的重要性到底有多大?直接的經濟效益有多大?
剛剛咱們提到了「把數據價值分享給產生數據的人」,這件事情的前提是數據得到確權,您覺得數據確權對我們當前的互聯網生活會造成什么樣的影響?
Trias CEO 阮安邦博士:
目前,我們很多核心的機密數據都沒法放到云上去。就是因為數據確權問題沒有解決。我把數據丟給了云,怎么知道云上的某些有管理員權限的人或者程序,會不會偷偷的把我的數據拷走。
就是因為數據無法確權,導致了現在的云平臺還是無法覆蓋更大的應用場景,這當然是從這個云計算本身的這個角度出發的。
云計算其實是一個稍微久一點技術,因為現在的熱潮已經不是云計算。但是隨著人工智能、物聯網以及新的技術進入我們的生活,數據確權的重要性也越來越緊迫。
所以,如果數據確權的問題沒有被解決,我們其實是很難更深度的與機器進行交互,我們也很難去發揮我們的想象力去創造出方便于我們日常生活的更多的應用模式。
如何用區塊鏈做到「數據確權」呢?
Trias CEO 阮安邦博士:
我認為把原始數據上鏈來做確權,這并不是區塊鏈可以真正使用的地方。但我們可以用區塊鏈來記錄一個數據所有使用過程的日志,也就是說對數據訪問行為等這些所有的信息,我們可以把它保存下來。
換句話說,我們或許能用區塊鏈來對數據的使用情況做一個記賬,哪個程序在什么時候使用了哪些數據。如果把所有的行為都如實的記錄到區塊鏈上,一方面既可以保證這個行為本身的完整性,同時我們并不用太在乎它的私密性,也就是說誰訪問了什么數據,我們并不需要去保密。如果這種前提存在,那么我們就可以準確的知道任何一個數據到底被哪些程序使用了。
如果我們能獲得這樣一個很有意思的屬性,就可以用區塊鏈來為任何一段數據的使用記賬。現在的區塊鏈,大家都用它來做賬戶之間的數據轉移。如果把區塊鏈用來做數據之間使用權轉移的記賬,或許它可以幫助我們做數據確權。
數據在被傳輸的過程中可能會被轉移「所有權」,也就是當屬于A的數據被傳輸給B以后,A就無法再保證數據只屬于自己,不被第三方濫用。針對這個痛點,是否有解決方案?
Trias CEO 阮安邦博士:
數據確權、數據隱私保護、數據流轉在技術上還是難點,線下點對點傳輸等強中心化的解決方案不能滿足應用的需要,而零知識證明、同態加密在理論上可行但在公鏈上進行實操還有各種各樣的技術難點需要攻克。
在我看來所有基于密碼學的方案,是比我們日常基于工程或者從硬件角度做優化的方案更安全。因為密碼學,有嚴格的數學論證。比方說,零知識證明解決的問題就是:我如何在你不知道我是否知道這個事情的情況下,知道我確實知道這樣的事情。
同態加密也是類似的這個這樣的一個情況。它想要解決的問題就是如何在不知道被處理的數據是什么的情況下,用數學的辦法,正確的處理這些數據并且返回它應該有的結果。
我認為所有的基于密碼學的方案,它都會在一定程度上引入非常大的計算復雜度。一方面,這樣的計算復雜度是很難隨著這個硬件的提高而被消除的。因為,只要硬件的效率提高了,那些不用密碼學的方式來進行數據加密和數據處理的技術也在同樣的提高。從長遠來說,它們的效率永遠都會比另外一種不基于密碼學的方案要慢。
從另外的角度來說,現在有很多技術是在強調數據的傳輸、數據的存儲、數據在加密的過程中如何最大化的去縮小數據被解密的時間長。這些方式的根本問題在于:他們從頭到尾都是要求用戶把數據發給第三方。
接下來要介紹的Trias,會在這方面做的出一些創新。
單從一個數據擁有者來說,想把某份數據交給別人來處理。數據擁者就想知道他能否只做約定好的事情,為此,進行數據處理的那一方需要向用戶證明是如何處理用戶數據的。信任是一個傳遞的關系。如果A不相信B說的任何一句話,A就沒法相信B是安全的,同樣的,A也就沒法相信B的技術是可靠的。
在我看來,這其實就是一個信任問題。即便有一個非常強的以密碼學為基礎的算法或解決方案,它在理論上無懈可擊,效率也非常好。但在實現的過程中也可能出現漏洞。比如,因為程序員的某個BUG被人攻破導致數據泄露。當你把數據交給別人,這些都是不可避免的事情。
所以Trias從另一個方向來解決數據確權以及數據安全性的問題,就是不需要把數據發給別人,不需要讓別人拿著你的數據去在他們的機房做處理。
所以針對上述問題,Trias采用了TEE可信計算和零知識證明技術結合的方式來完成數據確權和安全保護。
通過零知識證明,使用戶只能通過非透明加密憑證確定其數據的運算結果和獲取權力,而無法獲知實際的數據運算過程與內容,從根本上杜絕了交易就會泄露隱私的情況。
然后通過TEE可信計算的加固,保證了雙方數據確權的時候不會監守自盜,使用惡意的內鬼程序破壞零知識證明的加解密環境,為客戶根本上的解決數據確權與安全的問題。
責任編輯:ct
評論
查看更多