今日數據保管方式
數據泄露被認為是正常的。
2017年,Equifax被黑了。1.48億人的信用卡信息被盜,包括客戶名稱,社會保險號,生日和地址。Equifax必須為數據泄露支付7億美元的罰款。2012年,有1.67億個LinkedIn帳戶被盜,從而可以訪問每個用戶的密碼。雅虎在2016年發生了數據泄露事件。Facebook在2018年發生了數據泄露事件。幾乎每周我們都會聽到另一起數據泄露事件。他們已經成為常態。根據Wikipedia的數據,到2020年,數據泄露的平均成本估計大于1.5億美元,而全球年度成本預測為2.1萬億美元。
是否不可以阻止事情的發生呢?
這是一個關于數據托管的挑戰——如何訪問數據,以及更有效的進行數據管理,包括訪問如何從一個實體轉移到另一個實體。
數據托管狀態
讓我們思考一下在典型的初創企業中如何管理客戶數據。它通常存儲在一些數據庫中,比如MongoDB,存儲在云中。任何軟件開發人員都可以在軟件開發過程中隨時訪問這些數據。市場營銷人員將使用這些數據來了解客戶增長率等關鍵績效指標。如果黑客可以入侵到任何開發者或營銷者的帳戶,他們可以訪問初創公司的所有客戶數據。
現在想象一下,創業公司發展得非常好。就像剛開始時有40,000個客戶,然后以十年的速度呈指數增長,獲得了超過10億的用戶一樣。這是Facebook。想象一下,所有開發人員和市場營銷人員仍然可以訪問這些數據。這也是Facebook:即使Facebook擁有超過10,000名員工,幾乎所有員工都可以訪問所有客戶數據。如果黑客入侵了任何員工的帳戶,則黑客可以訪問所有Facebook用戶的信息。
對于運行“企業級”數據軟件的老企業來說,并不一定會更好。 我們怎么知道? 這些公司也經常遭到黑客攻擊。
這是一個心理模型,用于描述正在發生的事情。數據托管和管理的傳統安全模型是“ M&M”模型。外面有一個硬糖殼來固定鑰匙。如果有人刺破了殼的任何部分,他們就可以接觸到里面的所有巧克力。情況只會越來越糟:現代的AI系統需要更多的數據,從而擴大了數據系統的范圍,使攻擊面更大。
未來的數據托管?
代幣數據托管
讓我們看看是否可以改善數據安全性??紤]一個與“ M&M”相反的思維模型:一個堅硬的中心用來握住鑰匙,周圍具有更具延展性的基礎設施。那就是區塊鏈的想法;堅如磐石的中心是交易列表,可在數十至數千個實體中復制數十,數百甚至數千次。事務可以保存訪問控制信息。
然后,讓我們考慮對數據訪問進行代幣化,以便可以將數據訪問作為代幣進行傳輸。實際上,在傳統的數據訪問代幣(請考慮OAuth 2.0)。 但是“代幣”只是一個字符串,“轉移”基本上就是復制和粘貼該字符串。這很難保證安全。
因此,這些現有的數據訪問代幣不是我們在區塊鏈領域中想到的“代幣”。 但是,如果他們是呢?區塊鏈代幣表示持有私鑰,這暗示所有權。您的私鑰就是您的代幣。
具體來說,請考慮是否ERC721“不可替代代幣”(NFT)持有控制數據訪問的信息。如果您擁有此“數據代幣”,則可以訪問數據集。如果您有數據代幣,則可以托管該數據。
數據令牌變異
以下是數據代幣(數據訪問代幣)的一些變異:
· 訪問可以是永久性的(您可以隨意訪問多次),也可以是一次(訪問后,代幣將被燒毀)。
· 數據訪問始終被視為數據服務。這可以是訪問靜態數據集(例如單個文件)或動態數據集(流)的服務。
· 在返回結果數據集之前,數據服務可能具有計算元素。在這種情況下,它看起來仍然像是數據訪問代幣。
除代幣之外,還有多種變異可用于數據訪問。這些包括:
· 讀取與寫入等訪問。本文重點介紹“讀取”訪問權限。但是有一些變體:Unix風格(讀,寫,執行;對于個人,組,全部);數據庫樣式(CRUD:創建,讀取,更新,刪除)或區塊鏈數據庫樣式(CRAB:創建,讀取,追加,刻錄)。
· 用于訪問計算服務的代幣(例如“將計算引入數據”)。
· 數據本身的物理表現形式(例如每個數據復制一個代幣)和計算的物理表現形式(例如一個CPU分鐘內一個代幣)。在許多情況下,硬件資源的位置以及硬件功能的影響很大。
數據代幣和許可證
擁有物理訪問數據的代幣意味著有權訪問數據。我們可以對此權利進行形式化:數據代幣通常具有使用該數據的許可證。特別是:數據將受版權保護(一種知識產權或IP形式),作為物理存儲設備上位的體現。許可證是使用特定形式的IP的合同?;蛘呖梢詫⒈A粼诜阑饓竺娴臄祿暈樯虡I秘密。
數據訪問傳輸
代幣的托管意味著轉讓代幣的權利(除非另有說明)。使用NFT,您只需將代幣發送給Alice,即可將數據訪問權限轉移到Alice。確切地說,如果您的***中有基于NFT的數據代幣,則只需按“發送”按鈕,選擇要發送到的地址,然后進行確認。而已!
NFT附帶了數據許可證,這意味著接收者也具有訪問數據的合法權利。
簡而言之:數據傳輸=代幣傳輸。
數據轉移?
考慮以下場景。
1. Alice有一個數據代幣X,用于永久訪問靜態數據集X。她下載了該數據集。
2. Alice將代幣轉讓給Bob。然后,Bob下載數據集。
3. 但是Alice仍然擁有數據集。
這可能被視為一個問題:數據已“轉移”,因為Alice仍然保留了數據,盡管不再擁有代幣。但是以下每個方面都以其自己的方式解決了此問題。
1. 許可(Licensing)Alice可能持有數據的位置,但她不再持有使用它的許可權利,當然不是為了盈利。相比之下,想象一下你有一本《波希米亞狂想曲》,也就是說,你拿著那些碎片信息。你不能任意變賣,因為你沒有得到許可。如果你忽視了這一點并將其出售,甚至未經允許上傳,你很可能會收到代表藝術家權利的律師的來信。
2. 一次性訪問(One-time access )(相對于永久訪問)。只有Alice可以一次使用該代幣訪問數據。許可證將反映這一點。
3. 動態訪問(Dynamic access)(相對于靜態)。最有價值的數據是最新的數據。Alice轉移代幣后,她將不再有權訪問最有價值的數據。
4. 將計算引入數據(Bring compute to the data)。數據永遠不會被刪除為前提。因此該數據被視為商業秘密。在這里列出的選項中;但它需要更多的設置和開銷。
5. 可轉讓(Transferable )(與否)。正如出于安全考慮,像機票通常不可轉讓一樣,對于特定類型的數據也是如此。
您的密鑰就是您的數據
安德烈亞斯·安東諾普洛斯(Andreas Antonopoulos)流行一句話:“您的密鑰就是您的比特幣。不是您的密鑰就不是您的比特幣” 。也就是說,要真正擁有您的比特幣,您需要擁有它的密鑰。 對于代幣而言,擁有密鑰意味著擁有這些代幣。這會影響到數據:
也就是說,要真正擁有您的數據,您需要擁有它的密鑰。 持有數據代幣時,您具有數據的密鑰(NFT的私鑰,后者又可以訪問數據)和數據的許可證。
數據代幣托管的基礎架構
用于數據托管的代幣錢包
一旦我們有數據標記作為Erc20或Erc721代幣,就可以利用現有的加密代幣基礎結構。該基礎架構可以直接用于數據托管。
移動和PC錢包。有數十個用于ERC20代幣的軟件錢包,至少有十二個用于ERC721代幣的軟件錢包。例如TrustWallet同時擁有ERC20和ERC721代幣存儲功能,其版本可在PC直接使用,iOS和Android中運行。它支持10個以上的網絡,包括以太坊和POA.Network。通過GitHub拉取請求將代幣添加到TrustWallet團隊。
或者用戶可以通過提供自定義網絡的url和代幣在網絡上的(基于以太坊的)智能合約地址,獲得Metamask以支持任意ERC20代幣。
考慮將數據代幣存放在比特幣,以太坊和諸如CryptoKitties和MetaCartel之類的不可替代物品旁邊的TrustWallet中。
硬件錢包,Trezor,Ledger等提供硬件錢包。在這些錢包中,私鑰位于錢包內;永遠不會丟失。錢包使用密鑰在錢包內簽署交易。只有已簽名的交易離開錢包。這樣可以使私鑰更安全,從而令代幣更安全。
下圖顯示了Riddle&Code提供的代幣托管解決方案的示例,該解決方案面向企業的代幣管理。這些相同的企業可以使用這些相同的錢包進行數據保管。比希望系統管理員和數十名其他有權訪問該數據的員工不會泄露寶貴的私有數據要安全得多。
?
多方數據代幣托管
多簽名數據錢包。像Gnosis Safe這樣的錢包具有“多重簽名”功能,n個參與者中的m個需要簽署交易才能通過。這可以用于管理公司中的寶貴數據。例如某些關鍵數據可能是公司5位高管中5位多重簽名中的3位。其他時間可能是5個multisig中的1個,需要任何主管人員的簽字。
數據DAO。我們如何將“多方”數據托管擴展到成百上千個方,在這些方中,對數據的管理可能比“ n中的n”更復雜。DAO(分散式自治組織)是一條有前途的道路。DAO可以協調全球許多人(例如傳統的在線社區),但它們也可以管理資源(例如傳統的公司)。在這里,由成百上千的人運行的DAO可以“擁有”數據令牌。稱之為“數據DAO”。DAO將管理數據令牌:要獲取的令牌,要持有的令牌以及要出售/許可的代幣。杰出的DAO創建工具包括Aragon和DAOstack;還有更多的輕量級DAO,例如MolochDAO及其衍生版本,例如MetaCartel。
數據代幣保管的其他方法
網絡瀏覽器。Brave的瀏覽器具有內置的***。有了數據代幣,它將成為安全的場所數據托管工具。
人工智能/數據科學工具?,F在有用于數據科學的集成開發環境(IDE),例如Azure ML Studio。這些可能具有內置的錢包,用于保存和傳輸用于訓練數據,作為數據的模型等的數據代幣。甚至具有非圖形界面的工具也可以與代幣錢包集成。例如與Web3錢包集成的TensorFlow python庫。
第三方監護權。就像有些人喜歡讓傳統的銀行來保存他們的錢,或者像Coinbase這樣的人來持有他們的代幣一樣,數據代幣可以由專門從事令牌或數據代幣存儲的第三方持有,稱為這些數據庫。優點是如果丟失了密鑰,恢復可能更容易。當然,信任這些第三方也是不利的(不是您的密鑰,不是您的數據。.)。
自定義錢包,已針對數據進行了調整。上面的示例直接使用現有的錢包基礎結構。還有很大的空間來制作自定義數據錢包,例如從頭開始或從頭開始,以解決數據代幣的特定功能。例如:
1. 長尾數據代幣。某人可能擁有成千上萬的數據集。您如何管理這些?
2. 數據集的可視化。錢包可能具有內置的數據瀏覽功能。
代幣保管不斷提高-就像每個人和公司的銀行級安全保護一樣。 使用標記化的數據,數據托管將能夠繼承所有出現的改進。
數據代幣使用
數據代幣很自然地適用于Ocean Protocol,因為Ocean已經有了使用區塊鏈基礎設施對數據服務進行訪問控制的機制。
這是在Ocean Protocol中實現數據代幣的高級方法。每個數據服務都有其自己的分散標識符(DID),該標識符可解析為其DID描述符對象(DDO)中DID的元數據。因此,訣竅是通過將DID放入NFT的元數據字段來將NFT與DID關聯。
還值得指出的是,即使技術成熟,僅基于區塊鏈的數據訪問托管/數據代幣也無法解決數據泄露問題。但是這可能會有所幫助,就像用于金融資產托管的區塊鏈技術有所幫助一樣。
結 論
在本文中,我們描述了數據泄露如何變得司空見慣,因為攻擊面非常廣泛。然后我們描述了區塊鏈如何減少攻擊面;以及數據代幣的特定作用。然后,我們描述了基于代幣的數據托管的變異,例如硬件錢包,多簽名錢包,甚至是數據DAO。數據代幣將是Ocean Protocol令人興奮的方面。
責任編輯:ct
評論
查看更多