數據中臺是中國本土誕生的一個名詞,很多企業在“什么是數據中臺”和“我要上XX中臺”徘徊。其炒作程度跟當年的“大數據” 一詞有的一拼,如果用Gartner的炒作周期圖來看,數據中臺目前已經逼近炒作的頂峰。
與其不斷地討論什么是數據中臺,企業更應該了解建設數據中臺的目的是讓企業高效的數據驅動,減少重復的架構建設。如果要用一張圖來描繪Gartner如何看待數據中臺的建設方向,可以如下圖所示。
數據中臺的建設方向應該處于企業數字化平臺的核心,即Gartner定義的數據和分析平臺(紅色虛線部分),幫助企業的數字化平臺(客戶體驗平臺,生態系統平臺,物聯網平臺和內部信息系統)的業務用戶做出更好的決策,并在各個數字化平臺的合作孵化下形成可復用的數據分析能力。數據分析能力應該在業務端無處不在且高度自助,最終助力數字化平臺實現Gartner定義的封裝的業務能力 (Packaged Business Capability)。
以下是Gartner對于想建設數據中臺企業的建議。
數據中臺中數據管理策略的平衡
上文提到的這么一個“大而全“的方向聽起來是挺美好,但很多企業在建設初期是沒有考慮過各個數字平臺對數據資產的可復用性或自服務性的(這也是很多企業為了建立數據中臺的初衷)。原因很簡單,一次性完成所有平臺的數字化本來就是不現實的,很多公司都是分階段進行的,特別是傳統企業,很多業務干脆還沒有完成數字化,別說建設數據中臺了。阿里,騰訊這樣的數字化原生的企業建設中臺是十分有優勢的,或者說數據中臺是這些企業在業務指數級增長的同時自然生長出來的產物。
另外數據作為數字業務的核心資產的價值被廣泛接受,企業最直 接的反應就是試圖在建立數字化平臺時將數據收集(Collect)起來,仿佛這才是實現業務價值的關鍵。例如,過去非常流行的數據湖,會將收集數據作為核心能力。但收集數據不一定能帶來商業價值,企業也沒有可能一口氣收集好全部數據。
以物聯網平臺為例,數據分布在網絡上、邊緣設備上、網關上、云端和傳統系統中。例如,需要自主行為的 "物"(如聯網汽車或風力發電機)必須有板載或網關上的數據和處理,以便對變化的情況做出即時反應。面向消費者的IoT解決方案(如用于健身追蹤的可穿戴設備)通常將數據存儲在云端進行分析。而且幾乎所有的IoT解決方案還必須與傳統業務應用共享和整合數據,以執行客戶服務和長時間的性能分析。
另外,對實時(或 "近乎實時")集成的需求不斷增加引入了一個交付時間的要求,這讓最快的數據收集策略也無法滿足。在采取響應之前,操作流程在 "邊緣 "對數據采取行動與事先將所有的數據收集到集中存儲的位置的要求是不相容的。試圖收集所有這些物聯網數據再后續處理和使用,既不實際也不可行。
同時,保護個人身份信息的隱私法規也將阻礙數據的整體收集。因此,一些數據用例將需要連接(Connect)到數據,而不僅僅是收集數據。
企業建設數據中臺絕不是把所有的數據全部收集在一個地方了再開始應用數據,隨著數據的不斷涌入,用一種連接(Connect)的方式在數據原本存放的介質中重復利用數據才是數據中臺也該有的手段。收集數據和連接數據的平衡是現代化數據管理的的必要條件。數據虛擬化能力會是企業需要在保留已有數據庫,數據湖投入但又想建立數據中臺必須考慮的元素。重復或冗余的數據始終會存在,企業要建立的不是“single source of truth”而是“single source of trust”。
企業可以進一步參考Gartner提出的新一代數據管理設計原則Data Fabric去用于實現可復用和增強的數據集成服務、數據管道和語義層,以實現靈活的數據交付。
定位數據中臺為一個組織戰略促進合作
企業在漸進式數字化轉型時面臨的一個共同問題,他們各自為政,分別構建類似的解決方案,例如針對不同業務目的的數據分析模型,而這些模型具有共同的元素。在最好的情況下,這樣做會造成重復,但更多的情況下,這也會增加復雜性,因為這樣做會產生不同的點式解決方案,即使在單個業務內也無法溝通,更不用說在全公司的業務價值鏈上了。從這個角度來看,Gartner更推薦企業把數據中臺定性成一個組織戰略,把數據分析團隊作為數字化平臺建設必備的一個元素。Gartner也在2019年的《Gartner 數字化業務團隊問卷》中發現,數據分析/商業智能是融合團隊(Fusion team)中除IT以外最常見的功能。
一個好的數據分析團隊是由集中的團隊和各條業務線上的分散團隊組成的。很多企業過分的關注于技術架構的建設而不是業務人員基于數據的合作,在一味追求新的數據分析技術棧的過程,忽略了對于組織戰略的調整以解決實際業務用戶的問題,把原來遺留的問題從數據倉庫移到了數據湖,再移到現在的津津樂道數據中臺,而不是解決它們,一個現代化的數據分析團隊應該是數據分析能力的賦能者,從管控數據能力到促進基于數據的合作。
業務場景出發整理已有的數據分析能力
企業在不斷建設自己數字化平臺時,早已投入了各種數據分析資產,這個時候為了數據中臺這個新詞而放棄已經建立的數倉,數據湖,數據整合平臺是沒有必要的,企業需要做的是把數據中臺作為一個組織戰略去聯合各個部門共同建設可復用且自服務性高的數據分析能力,通過業務流程到數字化平臺,自上而下(紅線)的去整理已有的數據分析能力。
大多數企業其實都已在做自下而上(藍線)的數據分析平臺,這本沒有錯,尤其是企業集中式的IT團隊已部署數倉,設計了ETL流程和報表系統。但是作為前線的業務獲得這些能力是被動的,久而久之,并不會存在業務主動要求提升自己的數據分析能力,畢竟業務作為企業內部的甲方,只提需求還是很爽的。
然而為了讓企業變得更數據驅動,或者說讓企業建的的數據中臺能被真正用起來,逼著業務從業務場景開始做數據分析是一條必經之路,尤其在業務端才是能提出業務問題發起分析時刻(Analytics Moments)的一群人。
下圖就是一個典型的電商的業務場景,從業務端定義并梳理分析時刻,從技術棧尋找相對應的數據分析能力的過程。
分析時刻是Gartner定義的一種數據分析流程,通過對數據進行可視化、探索和應用算法,支持業務成果的交付,從而做出更好或更快的決策,實現業務流程的自動化。在這個例子中,數據分析能力(最右側)是被逐步建立起來的,他們的背后有大量的廠商可以被選擇,這些能力可以多大程度的被其他分析時刻復用,多低的門檻可以被業務應用,直接決定了數據中臺的成功。其中廠商的能力可以通過Gartner每年數據分析領域的九張《魔力象限(Magic Quadrant)》及配套的《關鍵能力(Critical Capability)》報告進行評估。
分析時刻的梳理往往是一個數據中臺建設最為棘手的部分,他一方面依賴供應商是否有業務咨詢的能力將業務場景梳理清楚,另外一方面也依賴企業自身的數據素養去不斷優化對于數據分析能力的要求。企業可以借著建立數據中臺這個機會,分類整理已有的數據分析能力或試行新的數據分析能力,Gartner每年出的《Gartner Analytics Atlas》報告就可以像能力字典一樣去幫助企業分類與挑選。
數據分析能力整合到復用是一個創新的過程
通過剛才的例子我們也可以看見,電商場景的業務邏輯是很成熟且明確的,其背后數據分析能力也能很快的被重復應用上,然而可復用的數據分析能力是個非常主觀的概念,不一樣數據素養的團隊對于數據分析能力的要求是非常不同的,越簡單易用,也容易被別的業務場景給重復利用,不一樣的地方是數據的情景和用戶情景。如果數據中臺的輸出能力僅僅只是Data as a Service,即API的形式是遠遠無法讓業務可以直接使用的,從而降低了企業對數據分析應用的廣度。企業應該通過整合復用以豐富數據分析能力的輸出,隨著新技術的引入和融合團隊的建立,這無疑是個創新的過程。
例如,由機器學習為基礎的增強型數據分析和管理工具,就可以大大降低用戶的使用門檻(自然語言驅動的分析)并減少數據管理的工作量(主動利用元數據學習獲得用戶行為)。企業應該了解到利用增強型能力是為減少數據分析手動的部分,從而給用戶給多時間去構思業務如何使用數據。
圖譜分析(Graph)的引入也會更進一步幫助企業去探知利用率嚴重不足的數據,圖譜可以發現企業數據與數據之間以及不同部門使用數據中被忽視或難以察覺的聯系,從而讓需要可復用的能力有據可尋,圖譜已經變成了很多數據分析產品的基礎性技術。企業建立數據中臺,缺少的可能既不是數據的量(Quantity)也不是數據的質(Quality),而是數據之間的聯系。
如果企業建的數據中臺需要在技術的角度進一步讓企業減少重復開發的工作量但是提高數據分析的利用率,這些技術都是值得進一步去研究的。增強型數據管理和圖譜技術也是今年Gartner的十大數據分析技術之一。
最后可能要問各位企業高管的是,如果你真的擁有一個完美的數據中臺滿足您所有的技術期待,您企業員工的數據素養跟上了么?
責任編輯:xj
原文標題:Gartner對于建設數據中臺的建議
文章出處:【微信公眾號:工業4俱樂部】歡迎添加關注!文章轉載請注明出處。
-
Gartner
+關注
關注
1文章
106瀏覽量
20997 -
數據中心
+關注
關注
16文章
4761瀏覽量
72035 -
數據分析
+關注
關注
2文章
1445瀏覽量
34050
原文標題:Gartner對于建設數據中臺的建議
文章出處:【微信號:industry4_0club,微信公眾號:工業4俱樂部】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論