區塊鏈能否保障數據庫的安全
大小:0.8 MB 人氣: 2017-09-30 需要積分:1
標簽:區塊鏈(104420)
大數據安全現在已經上升成為國家安全極為關鍵的組成部分。最近我們正在這方面做探索,比如與金融界合作,嘗試將分布式數據庫與區塊鏈技術結合在一起,這意味著可以即時發現數據庫中的數據進出狀況,從而真正保障數據安全。區塊鏈應用平臺的風險防范
從技術背景看,區塊鏈基于分布式網絡技術才得以誕生,在金融領域,區塊鏈就是分布式賬本。分布式賬本總賬的特點,將導致金融交易由凈額交收變成逐筆交收,它可以24小時全天候運轉。這使得金融服務可以離開銀行的物理網點直接進入到生活場景。同時也從根本上顛覆改變了金融機構的組織結構和業務結構。因此,現在華爾街的一些金融機構已經公開宣稱自己其實是一家科技公司。
區塊鏈作為一種分布式數據管理技術,受到了越來越多的關注。從金融業到政府部門、醫療業、零售業乃至新興制造業,區塊鏈幾乎成了能夠創造更多價值的神器。但最近基于區塊鏈技術全球最大眾籌項目The Dao被黑客攻擊,導致價值6000萬美元的360多萬以太幣被劫持,引起業內震動和高度關注。恰恰是該事件,除了反映出區塊鏈技術整體依然處于測試階段,去中心化的智能合約根本無法避免技術上的操作風險,和主觀上的道德風險等方面問題之外,這個事件最重要的啟示還在于:對區塊鏈技術應用平臺存在的風險,需建立一套嚴密追蹤規則,以確保大數據應用安全。
區塊鏈技術應用平臺的風險到底如何防范? The Dao被攻擊事件反映出基于區塊鏈技術應用平臺的技術風險可能將長期存在。由于區塊鏈所具有的不可篡改和不可逆性質,一旦遭到黑客攻擊,無論是硬分叉還是軟分叉的解決方案,其成本都相當高昂。因此,區塊鏈技術在金融等場景的應用上,更需要高度關注潛在的風險,而我們擁有的分布式內存數據庫技術,恰恰可以讓這樣的技術公司幫助制定相應的風控措施和應急預案。
在數字貨幣的發展中如何突破區塊鏈的技術障礙?區塊鏈是國家發行的加密數字貨幣的基礎設施,也是其發行、流通和結算的技術實施渠道。因此必須建立嚴謹的發展規劃和設計,盡量找到能使區塊鏈現有特征得到充分體現并且能突破區塊鏈發展障礙的運用案例。而減少“試錯成本”,是區塊鏈和國家發行數字貨幣的重要條件。在這方面,我們的分布式內存數據庫恰逢其時,能夠在數據安全保障方面做出貢獻。
分布式結構所具備的技術和經濟可行性表明,區塊鏈技術發展至今已經可以通過構建分布式結構體系和參與者共事協議,形成不需要中心的、大規模的數據庫系統,所有約定的參與者都參與數據的記錄和驗證,再通過分布式傳播發送給各個節點。即使部分節點受到攻擊或損害,也不會影響整個數據庫的完整性和信息更新,但任意點的變更都會被各個點記錄。
分布式聯盟鏈與計算集群的作用
從區塊鏈技術應用的可行性可以看出,分布式的概念更加貼切準確。中國大型金融機構目前已經建成超高速、大流量、中心化的信息技術系統,在區塊鏈技術應用中,各金融機構共同組建分布式的聯盟鏈,充分利用現有技術,可確保交易速度,實現合規控制的目的。
數據可能會泄露,也可能會透過某種方式滲透進入網絡,可以通過排序、機器學習,通過人工干預的半監督學習、深度學習,拼湊出某種完整圖景,以探索出并固定住某種經驗。人類過去從沒做到這一點。機器累積的這種認知能力,將大為提升人類使用知識的能力。
中國大陸做分布式數據庫的人很少,而做內存式數據庫的幾乎根本就沒有。上世紀90年代中期以后,中國大陸數據庫行業一直為美、德等國外廠商所壟斷。當時中國本土眾多軟件公司所追求的,可能更多的是短期效益,而不愿掙數據庫這樣的慢錢。再加上數據庫本身技術標準嚴苛,對算法穩定性要求很高,實現難度較大,是一種慢工出細活的領域,中國公司如果起步晚,積累少,在當時肯定就會顯得落后,所以這種支撐大數據核心發展的基礎技術真的需要國家的大力支持。
兩年前我即開始啟動流數據庫研究,那時國內還沒有人提這項研究。因為時勢都未到,但它所發生的必要條件均已具備。所以當我們做出這個數據庫后,今后將要充分發揮這些必要條件。中美專家包括中國工信部專家都對流數據庫在中國國內出現感到驚訝。我們柏睿數據撰寫的數據庫標準已被國際信息標準化委員會通過,成為國際認定的中國國家級標準,受到國內外同行的充分肯定。同時,國家也在根據這一國際標準制定國家標準,我們國家現在國際大數據標準領域已經擁有自己的發言權,美德日一統標準的時代已徹底成為了過去式。
下一代軟件開發技術趨勢可能會有很大變化。并行計算今后可能會要求很高,這其實也是我們正在做的事情之一。但對有些概念,國內存在混淆現象。比如我一直堅持說MPP內存數據庫,有的人卻說這是分布式數據庫。其實MPP也是一種分布式,而原則上,MPP是海量并行處理,算是一種分布式,但分布式并不見得是MPP。所謂并行處理是說每個處理單元與其它單元有關聯。最近兩年,并行計算確實出現了一些語言或軟件開發方法,這一趨勢比較明顯。尤其是當處理的數據量很多,則對之后的影響會很大。這方面,國內積累真的不多。
3年前,我曾認為,理想中一個分布式的MPP海量并行的內存數據庫就已足夠,我能處理的數據,比如說當時是64G內存有100個節點6個T的數據,就讓我覺得很大了。但去年很多用戶已開始問我,你們能不能處理256G內存的單節點數據。這個發展真是太快了。
下一個趨勢是,單節點可能至少要處理4個T的數據,4個T1000個節點就是4000T。在做好算法,系統穩定的條件下,4個T數據可在數分鐘之內處理完畢。這是一個比較漂亮的結果。就硬件而言,CPU自身速度在提高。而分布式計算集群現在越來越大。這在之前是很難預料的。
我們的內存數據庫內部測試現在已達到256個節點,下一步可能是512個節點,這是數據庫一個比較大的變化趨勢。3年前我開始考慮的流數據庫,去年這一想法已開始成熟,原以為可能要等候兩三年才能出成果。現在看,如果每個人手中的手機云端數據直接進入我的有數百臺機器組成的內存池子,進入流數據庫,做一些簡單查詢,或進入分布數據庫做非常復雜的分布查詢,這些過程都無需落地,只在內存里跑。這是一個比較完整的體系。之后,是深度學習的算法,也存于內存之中,而且要與數據庫緊密結合。也就是說,在只要有數據的地方,就有算法圍繞著它。今后朝著這個方向才是大數據發展的必然趨勢。
區塊鏈大數據安全應用關涉國家戰略
從區塊鏈所具有的分布式功能也可以看出,通過構建分布式數據庫系統和參與者共識協議,能夠保護數據的完整性。而區塊鏈的時間戳功能,可以通過生成一定時間段的信息區塊以及區塊之間的首尾相連數據鏈,形成不可偽造的數據。當每個參與者進入區塊時加蓋時間戳,就能夠證明原創性和所有權歸屬,這必然有利于保護信息的私密性。因為無論誰動過你的奶酪,都會留下痕跡,動你奶酪的人必然會謹慎對待。
雖然區塊鏈技術應用目前還處于實驗室階段,但人們已經迫不及待地希望區塊鏈技術能夠提供某種安全保證,以便將復雜的經濟生活變得簡單易行。比如便捷支付,比如在醫療保健等各種社會服務領域應用區塊鏈技術,可以提高效率,節約成本。盡管區塊鏈技術應用的潛在風險開始暴露,但與此同時,對區塊鏈技術應用風險的管控也越來越受到重視。
從移動互聯網到大數據、區塊鏈,當今時代,技術變化的潮流勢不可擋,以至于很多人一時竟難以明白和適應。但毫無疑問,區塊鏈正在讓大數據洶涌而來。區塊鏈的可信任性、安全性和不可篡改性,正在讓更多數據被釋放出來。
我們看到,數據的“看過、復制即被擁有”等特征,曾經嚴重阻礙數據流通。但基于去中心化的區塊鏈,卻能夠破除數據被任意復制的威脅,從而保障數據擁有者的合法權益。區塊鏈還提供了可追溯路徑,能有效破解數據確權難題。有了區塊鏈提供安全保障,大數據將更加活躍涌動。
大數據時代的來臨,為眾多企業帶來了全新的機遇和挑戰。隨著數據量、數據種類的增多,企業由歷史數據分析漸漸過渡到基于多源、海量數據的實時分析。我們都知道商場如戰場,誰能在企業運營中做出快速、高效的分析決策,誰就能日益激烈的市場競爭中立于不敗之地。RDP通過提供從海量數據存儲、分布式內存計算、分布式內存數據庫、內存數據分析挖掘以及數據可視化的整套支持,解決了企業在大數據和快數據存儲、分析、挖掘領域碰到的各種問題。作為企業級解決方案,可管理性是RDP的顯著優勢,用戶友好的管理界面提供了系統安裝、系統及集群配置、監控及預警等多方面的一站式支持。RDP架構具有高可用性和快速故障恢復能力,HDFS2作為其底層數據持久化存儲系統的支撐技術保證了數據的持久化和冗余復制,并具有數據自動檢測和修復的容錯功能;強大、高效的內存數據庫復制、持久化功能,保證內存數據安全可靠。在安全領域,與Kerberos/LDAP進行整合,支持細粒度訪問控制、應用程序安全及數據加密及解密等等。
當今從事大數據應用者很多,也有很多從事大數據交易的企業,如果能形成合力,整個大數據生態系統能夠良性循環,將是一件令人樂觀的前景,也將會為中國大數據應用發展積累經驗和人才。因此,政府需要在這方面積極加以引導。大數據應用不應只是一種熱潮,因為當熱潮散去,還會留下什么呢?如果形成生態系統,在數據庫和數據處理方面,包括中間件方面,也可能存在基礎軟件換代升級的問題要解決,以現有技術發展趨勢,而這很可能使中國出現一些大的基礎軟件公司,與甲骨文公司、SAP公司等國際巨頭競爭。大家拭目以待!
?
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%