大數(shù)據(jù)(Big data)和區(qū)塊鏈等新興技術(shù)被吹捧為下一件將徹底改變企業(yè)經(jīng)營方式的大事。我們大多數(shù)人的印象是,這些技術(shù)是相互排斥的——每一種技術(shù)都有自己獨(dú)特的路徑,并且是單獨(dú)使用的。然而,事實(shí)并非這樣。
當(dāng)數(shù)據(jù)科學(xué)處理使用數(shù)據(jù)進(jìn)行適當(dāng)?shù)墓芾頃r(shí),區(qū)塊鏈通過其分散的分類賬確保了數(shù)據(jù)的安全性。
這些技術(shù)具有巨大的未開發(fā)潛力,可以提高效率和生產(chǎn)力。問題是,這些技術(shù)是否可以結(jié)合到一起?當(dāng)區(qū)塊鏈和數(shù)據(jù)科學(xué)同時(shí)應(yīng)用時(shí),將會(huì)實(shí)現(xiàn)什么?為什么說區(qū)塊鏈?zhǔn)菙?shù)據(jù)科學(xué)的未來?
在回答這些問題之前,讓我們先單獨(dú)研究一下這些技術(shù),以便更好地理解它們。
什么是區(qū)塊鏈?
區(qū)塊鏈基本上是一個(gè)記錄每筆交易的數(shù)字分類賬。由于它是分散的,沒有一個(gè)單一的權(quán)力機(jī)構(gòu),這意味著沒有人能夠操縱發(fā)生在這個(gè)分類賬上的交易。存儲(chǔ)在區(qū)塊鏈數(shù)據(jù)結(jié)構(gòu)中的信息不能被篡改,因?yàn)楦囊粋€(gè)塊意味著更改它后面的所有其他塊。如果更改了一個(gè)過去的塊,則會(huì)更改所有下面的塊。因此,即使一個(gè)塊中的更改也不可能不被注意到。
隨著人們對加密貨幣和比特幣等數(shù)字貨幣的興趣日益濃厚,區(qū)塊鏈技術(shù)開始嶄露頭角。然而,今天,它不僅發(fā)現(xiàn)了記錄加密貨幣交易的相關(guān)性,而且還發(fā)現(xiàn)了記錄任何有價(jià)值東西的相關(guān)性。
Upwork進(jìn)行的一項(xiàng)研究發(fā)現(xiàn),區(qū)塊鏈技能是自由職業(yè)市場上最熱門的商品之一。該報(bào)告還強(qiáng)調(diào),區(qū)塊鏈的招聘職位近年來呈指數(shù)級(jí)增長。
區(qū)塊鏈的應(yīng)用遠(yuǎn)遠(yuǎn)超出了比特幣等貨幣用例。區(qū)塊鏈中的塊可以容納不同種類的信息,因此使區(qū)塊鏈非常的通用。可以存儲(chǔ)在區(qū)塊鏈中的東西包括醫(yī)療記錄、地契、汽車所有權(quán)等等。簡而言之,區(qū)塊鏈在任何情況下都是有價(jià)值的,在這種情況下,以透明、分散、安全和無篡改的方式記錄東西都是必不可少的。區(qū)塊鏈的更多用例如下:
· 創(chuàng)建數(shù)字身份系統(tǒng)
· 保存實(shí)體產(chǎn)品的記錄
· 開發(fā)各種金融工具
· 使投票更加透明
什么是數(shù)據(jù)科學(xué)?
數(shù)據(jù)科學(xué)是當(dāng)今技術(shù)發(fā)展的趨勢產(chǎn)業(yè)之一。該領(lǐng)域在預(yù)測分析、診斷分析和描述分析等子領(lǐng)域有很多創(chuàng)新。
數(shù)據(jù)科學(xué)的目標(biāo)是從結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中提取見解和其他信息。數(shù)據(jù)科學(xué)領(lǐng)域包括機(jī)器學(xué)習(xí)、數(shù)據(jù)分析、統(tǒng)計(jì)和其他高級(jí)方法,這些方法用于了解使用數(shù)據(jù)的實(shí)際過程。
Facebook、谷歌、蘋果和亞馬遜等企業(yè)巨頭每天都在挖掘海量數(shù)據(jù)。數(shù)據(jù)科學(xué)的廣闊領(lǐng)域刺激了對數(shù)據(jù)科學(xué)家的需求,他們的任務(wù)是從數(shù)據(jù)中獲得意義,并幫助解決現(xiàn)實(shí)世界的問題。這一需求還來自大數(shù)據(jù)領(lǐng)域,這是數(shù)據(jù)科學(xué)的一個(gè)先進(jìn)領(lǐng)域,處理的是傳統(tǒng)數(shù)據(jù)處理技術(shù)無法處理的海量數(shù)據(jù)。
區(qū)塊鏈和數(shù)據(jù)科學(xué)——它們是相關(guān)的嗎?
區(qū)塊鏈和數(shù)據(jù)科學(xué)之間的關(guān)系,如果有的話,還沒有太多的研究。簡單地看一下,這兩種技術(shù)的中心都有數(shù)據(jù)。當(dāng)區(qū)塊鏈驗(yàn)證和記錄數(shù)據(jù)時(shí),數(shù)據(jù)科學(xué)專注于從數(shù)據(jù)中獲得有意義的見解,以解決問題。這兩種技術(shù)都使用算法來控制與不同數(shù)據(jù)段的交互。在crux中,數(shù)據(jù)科學(xué)用于預(yù)測,而區(qū)塊鏈用于驗(yàn)證數(shù)據(jù)。
區(qū)塊鏈如何幫助大數(shù)據(jù)?
可以說,如果大數(shù)據(jù)是指數(shù)據(jù)的數(shù)量,那么區(qū)塊鏈就是指數(shù)據(jù)的質(zhì)量。
使用區(qū)塊鏈,實(shí)現(xiàn)一種處理數(shù)據(jù)的新方法是可能的。它消除了將數(shù)據(jù)集中在一起的需要,并為一種分散式的結(jié)構(gòu)鋪平了道路,在這種結(jié)構(gòu)中,數(shù)據(jù)分析可以直接從單個(gè)設(shè)備的邊緣進(jìn)行。此外,通過區(qū)塊鏈生成的數(shù)據(jù)是經(jīng)過驗(yàn)證的、結(jié)構(gòu)化的和不可變的。區(qū)塊鏈提供的數(shù)據(jù)保證了數(shù)據(jù)的完整性,增強(qiáng)了大數(shù)據(jù)。
如今,隨著數(shù)據(jù)變得更容易訪問和更健壯,大多數(shù)企業(yè)都在尋求更深入、更先進(jìn)的分析方法。目前,業(yè)務(wù)使用的數(shù)據(jù)大多是分散式的,需要幾周或幾個(gè)月的時(shí)間來整理。任何類型的人為錯(cuò)誤都可能極大地影響數(shù)據(jù)的完整性,從而影響最終的分析。當(dāng)數(shù)據(jù)存儲(chǔ)在一個(gè)集中的位置時(shí),它還面臨著被破壞的風(fēng)險(xiǎn)。數(shù)據(jù)中心也有可能被篡改并向公眾公布。每個(gè)人都想要需求,但要確保它是準(zhǔn)確和安全的,這是一項(xiàng)艱巨的任務(wù)。為了執(zhí)行數(shù)據(jù)分析和預(yù)測建模,數(shù)據(jù)科學(xué)需要一個(gè)功能強(qiáng)大的數(shù)據(jù)集。通過分散化的區(qū)塊鏈,數(shù)據(jù)科學(xué)家可以增強(qiáng)他們管理數(shù)據(jù)的能力,并設(shè)置一個(gè)堅(jiān)實(shí)的基礎(chǔ)設(shè)施。
你知道嗎,最近一個(gè)由47家日本銀行組成的財(cái)團(tuán)與一家名為Ripple的區(qū)塊鏈創(chuàng)業(yè)公司簽約,使用區(qū)塊鏈便利銀行賬戶間的轉(zhuǎn)賬。此舉背后的動(dòng)機(jī)是在執(zhí)行實(shí)時(shí)傳輸?shù)耐瑫r(shí)大幅降低成本。如你所知,傳統(tǒng)的實(shí)時(shí)轉(zhuǎn)賬在成本方面有點(diǎn)高,因?yàn)闈撛诘娘L(fēng)險(xiǎn)因素是巨大的。實(shí)時(shí)轉(zhuǎn)賬的問題之一是雙重支出。這可以通過使用區(qū)塊鏈技術(shù)加以控制。傳統(tǒng)的實(shí)時(shí)傳輸成本高昂的原因之一是潛在的風(fēng)險(xiǎn)因素。雙重支出(這是交易失敗的一種形式,同一安全代幣被使用兩次)是實(shí)時(shí)傳輸?shù)囊粋€(gè)真正問題。
除了銀行業(yè),許多行業(yè)也在考慮安全性的情況下采用了區(qū)塊鏈。從零售、醫(yī)療到公共管理,各行各業(yè)的公司都已開始了他們的區(qū)塊鏈之旅,以防止數(shù)據(jù)泄露和黑客攻擊。區(qū)塊鏈?zhǔn)菙?shù)據(jù)科學(xué)的未來。
區(qū)塊鏈將如何增強(qiáng)數(shù)據(jù)科學(xué)
使數(shù)據(jù)可追溯
區(qū)塊鏈促進(jìn)了對等關(guān)系。例如,如果發(fā)布的帳戶沒有正確地解釋任何方法,任何同行都可以檢查整個(gè)過程并確定結(jié)果是如何獲得的。
有了賬本透明的渠道,任何人都可以知道哪些數(shù)據(jù)是可靠的,如何存儲(chǔ),如何更新,從哪里來,以及如何正確使用。總之,區(qū)塊鏈技術(shù)將使用戶能夠跟蹤從入口到出口的數(shù)據(jù)。
使實(shí)時(shí)分析成為可能
實(shí)時(shí)數(shù)據(jù)分析是非常困難的。能夠?qū)崟r(shí)監(jiān)控變化被認(rèn)為是識(shí)別騙子最熟練的方法。然而,長期以來,實(shí)時(shí)分析是不可能的。今天,由于區(qū)塊鏈的分布式特性,公司能夠從一開始就檢測數(shù)據(jù)庫中的任何異常。
實(shí)時(shí)查看數(shù)據(jù)變化的能力是電子表格中的一個(gè)特性。就像區(qū)塊鏈也能讓兩個(gè)或更多的人同時(shí)處理同一種信息。
保證數(shù)據(jù)質(zhì)量
區(qū)塊鏈的數(shù)字分類賬中的信息存儲(chǔ)在不同的節(jié)點(diǎn)中,包括私有節(jié)點(diǎn)和公共節(jié)點(diǎn)。在添加到其他塊之前,在入口點(diǎn)本身對信息進(jìn)行交叉檢查和分析。這個(gè)過程本身就是驗(yàn)證數(shù)據(jù)的一種方法。
讓數(shù)據(jù)共享更容易
對于組織來說,如果有一個(gè)平穩(wěn)而容易的數(shù)據(jù)流,就會(huì)有很多優(yōu)勢。紙質(zhì)記錄非常困難。當(dāng)在其他地方需要其中的數(shù)據(jù)時(shí),這種困難就更加復(fù)雜了。這些文件確實(shí)會(huì)到達(dá)另一個(gè)部門,但這可能需要很長時(shí)間,而且還可能面臨在傳輸過程中丟失的風(fēng)險(xiǎn)。
如今,大多數(shù)數(shù)據(jù)科學(xué)家對區(qū)塊鏈非常著迷,因?yàn)樗梢宰寖蓚€(gè)人或更多的人同時(shí)實(shí)時(shí)訪問數(shù)據(jù)。
因此,當(dāng)信息不受任何限制地流動(dòng)時(shí),管理過程就會(huì)變得精簡。
確保信任
你必須意識(shí)到,當(dāng)只有一個(gè)權(quán)威時(shí),偏見往往是一個(gè)問題。過分信任一個(gè)人可能會(huì)被證明是危險(xiǎn)的。由于信任問題,許多公司不允許任何第三方訪問它們的數(shù)據(jù)。這使得信息共享幾乎是不可能的。使用區(qū)塊鏈技術(shù),信任問題不會(huì)妨礙信息共享。組織能夠通過共享他們所擁有的信息來有效地合作。
提高了數(shù)據(jù)的完整性
過去十年,各機(jī)構(gòu)的主要工作重點(diǎn)是提高數(shù)據(jù)存儲(chǔ)能力。在2017年底,這個(gè)問題得到了解決?,F(xiàn)在,大多數(shù)組織關(guān)心的新問題是保護(hù)和驗(yàn)證數(shù)據(jù)的完整性。
這主要是因?yàn)榻M織從不同的中心收集數(shù)據(jù)。甚至從政府辦公室或內(nèi)部獲取的數(shù)據(jù)也可能容易出錯(cuò)。此外,社交媒體等其他數(shù)據(jù)來源也可能被證明是不準(zhǔn)確的。
如今,數(shù)據(jù)科學(xué)家正在使用區(qū)塊鏈技術(shù)來確保數(shù)據(jù)的真實(shí)性,并跟蹤數(shù)據(jù)鏈上的每一點(diǎn)。其大規(guī)模采用的原因之一是其不可變的安全性。通過區(qū)塊鏈的分散式分類賬,數(shù)據(jù)在每一步都通過多個(gè)簽名得到保護(hù)。為了讓任何人都能訪問數(shù)據(jù),必須提供準(zhǔn)確的簽名。這樣做的結(jié)果是大大減少了數(shù)據(jù)入侵和泄漏的情況。
以下是區(qū)塊鏈的一些安全特性,對數(shù)據(jù)科學(xué)來說是無價(jià)的:
交易編碼
區(qū)塊鏈?zhǔn)褂脧?fù)雜的數(shù)學(xué)算法對發(fā)生在其分類賬中的每筆交易進(jìn)行加密。這些交易作為不可變和不可逆轉(zhuǎn)的雙方之間的數(shù)字合約而存在。
數(shù)據(jù)湖
數(shù)據(jù)科學(xué)家通常在數(shù)據(jù)湖中記錄他們組織的細(xì)節(jié)。當(dāng)區(qū)塊鏈用于跟蹤數(shù)據(jù)的起源時(shí),它被記錄在具有特定加密密鑰的特定塊中。這意味著,任何使用這些數(shù)據(jù)的人都擁有來自原始數(shù)據(jù)者的正確密鑰,這意味著這些信息是準(zhǔn)確的、高質(zhì)量的和真實(shí)的。
結(jié)論
數(shù)據(jù)科學(xué)是一個(gè)不斷發(fā)展的領(lǐng)域。隨著區(qū)塊鏈技術(shù)的集成,透明的記錄保存和健壯的安全性將成為現(xiàn)實(shí),因此,數(shù)據(jù)科學(xué)家將能夠?qū)崿F(xiàn)一些以前認(rèn)為不可能實(shí)現(xiàn)的里程碑。雖然區(qū)塊鏈?zhǔn)且豁?xiàng)相對較新的技術(shù),但一些已經(jīng)在其上進(jìn)行試驗(yàn)的公司的初步結(jié)果證明,它們可以有效地使用。
目前,區(qū)塊鏈還處于萌芽階段;由于圍繞它的大肆宣傳,這一點(diǎn)并不十分明顯。隨著技術(shù)的成熟和更多的創(chuàng)新的發(fā)生,將會(huì)出現(xiàn)更多的具體用例,而數(shù)據(jù)科學(xué)將會(huì)是一個(gè)從中受益良多的領(lǐng)域。盡管如此,關(guān)于其在數(shù)據(jù)科學(xué)領(lǐng)域的影響,特別是在需要處理大量數(shù)據(jù)的大數(shù)據(jù)領(lǐng)域,還是有人提出了一些問題。一個(gè)主要的擔(dān)憂是在這方面實(shí)現(xiàn)區(qū)塊鏈應(yīng)用程序?qū)⑹前嘿F的。這是因?yàn)榕c傳統(tǒng)的數(shù)據(jù)存儲(chǔ)方式相比,在區(qū)塊鏈中存儲(chǔ)數(shù)據(jù)的成本更高。相對較小的數(shù)據(jù)量可以存儲(chǔ)在塊中,這可能會(huì)造成一些障礙,因?yàn)榇髷?shù)據(jù)和數(shù)據(jù)分析任務(wù)每秒需要收集大量數(shù)據(jù)。
區(qū)塊鏈將如何演變,以解決這些問題,并繼續(xù)顛覆數(shù)據(jù)科學(xué)領(lǐng)域,還有待觀察??梢钥隙ǖ氖?,這項(xiàng)技術(shù)在改變數(shù)據(jù)處理和使用方式方面具有巨大的潛力。
來源: 區(qū)塊網(wǎng)
評(píng)論
查看更多