在了解oneID前,先來看一下阿里的oneDate體系。其實OneID在整個數據服務體系中,也只是起點不是終點或者說是手段,我們最終的目的是為了建設統一的數據資產體系。
沒有建設統一的數據資產體系之前,我們的數據體系建設存在下面諸多問題
- 數據孤島:各產品、業務的數據相互隔離,難以通過共性ID打通
- 重復建設:重復的開發、計算、存儲,帶來高昂的數據成本
- 數據歧義:指標定義口徑不一致,造成計算偏差,應用困難
在阿里巴巴 OneData 體系中,OneID 指統一數據萃取,是一套解決數據孤島問題的思想和方法。數據孤島是企業發展到一定階段后普遍遇到的問題。各個部門、業務、產品,各自定義和存儲其數據,使得這些數據間難以關聯,變成孤島一般的存在。
OneID的做法是通過統一的實體識別和連接,打破數據孤島,實現數據通融。簡單來說,用戶、設備等業務實體,在對應的業務數據中,會被映射為唯一識別(UID)上,其各個維度的數據通過這個UID進行關聯。
各個部門、業務、產品對業務實體的UID的定義和實現不一樣,使得數據間無法直接關聯,成為了數據孤島。基于手機號、身份證、郵箱、設備ID等信息,結合業務規則、機器學習、圖算法等算法,進行 ID-Mapping,將各種 UID 都映射到統一ID上。通過這個統一ID,便可關聯起各個數據孤島的數據,實現數據通融,以確保業務分析、用戶畫像等數據應用的準確和全面。下面就來介紹一下主數據和OneID。
— 01 —
OneID 和主數據到底是不是一回事?
在阿里巴巴 OneData 體系中,OneID 指統一數據萃取,是一套解決數據孤島問題的思想和方法。
如果單看這個定義,你一定也會和我一樣懵逼,啥是數據萃取?解決數據孤島問題,主數據不也是干這個事情的嗎?
別急,我們慢慢分解,先來看 OneID 到底是干啥的。
OneID 也叫 ID-Mapping,就是將設備 ID(例如手機 MAC、IMEI、IMSI 等),手機號、身份證號、郵箱地址、PC 端的 Cookie,用戶名等信息,結合標簽體系、知識圖譜、機器學習等技術和算法,將各種 ID 都映射到統一的 ID 上。也就是說不論用戶用什么 ID 登陸,不論登陸的是 PC 端還是手機 APP,都能識別到他的一個唯一身份。
OneID 干的這個事情是不是和主數據有點類似?主數據也是給數據對象賦予一個唯一的編碼(身份)。
但是,不得不承認,OneID 和主數據還是有很大區別的,如下:
第一,解決問題的環境不同。OneID 主要是解決 ToC 業務,不同渠道、不同數據來源的用戶身份的統一映射和識別問題,例如:PC 端、移動 APP,微信小程序、相關應用系統等。而主數據是對相同數據對象進行標準化定義并賦予唯一編碼,更多的是用 ToB 業務中,解決企業內部異構系統之間數據不一致問題。
第二,解決問題的“地點”不同。OneID 是把各類 UID 信息匯聚在一起,在一個地方進行加工和處理,最后形成統一的 Mapping 關系,阿里管這個地方叫做“數據中臺”。而主數據強調的是從源頭統一標準,定義唯一編碼,各異構系統都依據統一的標準執行,映射關系是建立在各異構系統中的。
第三,解決問題的技術不同。OneID 是典型的 OLAP 技術,是在產生數據之后通過大數據分析、人工智能算法等技術將各種 UID 都映射到統一的 ID 上。而主數據是典型的 OLTP 技術,其本身是對數據的增刪改查操作,例如客戶主數據的定義和編碼。
— 02 —
數據中臺為什么需要 OneID?
接觸過企業數據平臺的人都會知道,數據孤島是企業發展到一定階段后普遍會遇到的問題。企業內部的各個部門、業務、產品,各自定義和存儲其數據,使得這些數據間都是相互割裂、難以關聯,從而真正變成“孤島”一般的存在,在業務價值上很難發揮出更多作用。
普遍存在的數據孤島現象,各部門用的平臺不同,且數據不相通
OneID的建立,就是為了打通這種數據孤島的現狀,通過打通分散在各個平臺的用戶數據,整合客戶全生命周期旅程,實現各平臺存儲的數據通融,從而提升業務效率和用戶體驗。
** ONEID的業務價值和數據管理價值**
業務價值:通過OneID貫穿客戶生命周期,精準識別客戶行為(瀏覽、留資、到店等行為軌跡),相當于為每一位用戶量身定制了屬于自己的完整的“身份和行為”的“名片”,為營銷場景的落地(廣告定投、精準推送、個性化推薦、增換購、流失預警等場景)和精益化運營的需要(精準客戶數據分析、精準人群定位、精準圈層運營、經銷商客戶信息溯源等)提供支持。
數據管理價值:業務價值主要傾向于OneID對外為企業帶來的營銷便利、利潤增長,數據管理價值主要傾向于對內形成的“互助”作用。OneID的構建有助于數據資產的沉淀,便于企業的數據管理、數據資產的可視化和可評估化等,同時,OneID還可滿足其他平臺的一些需求,如CDP平臺、數據中臺等,為其提供一定的支持。
總而言之,OneID的構建,是為了支撐各業務方管理決策及應用落地,從而達到提升業務效率及客戶體驗,且數據應用準確而全面的最終目的。
— 03 —
OneID 和主數據的實現原理
OneID 是對不同渠道、不同來源的的“ID”進行統一拉齊和打通,其實現原理如下:
為了方便理解,這里給出的例子是比較簡單的,但在實際實施過程中,其應用要復雜很多,例如:相同 ID 的值不一致怎么辦,重復的 ID 如何合并,ID 信息發生變化如何更新,Mapping 表的更新頻率如何設置等等,這些問題就需要結合具體場景解決了。
我們再來看看主數據管理(MDM)的工作原理:
主數據管理強調在源頭治理,即:在數據源系統定義實現主數據的標準化,生成唯一主數據編碼,并通過主數據系統分發標準數據到相關消費系統進行使用,消費系統只有查詢和使用權不能對主數據進行“增刪改”。另外,不同主數據的來源系統不同,如在這個例子中的客戶主數據來源為 CRM,物料主數據的來源為 MDM,ERP 系統和數據倉庫是主數據的消費系統。
— 04 —
有了數據中臺,還需要主數據嗎?
在很多數據中臺的解決方案中,主數據是數據中臺的一個組成部分。例如在 SAP 的數字平臺解決方案中,數據中臺是由數據集成、數據存儲、數據倉庫、開發建模、數據資產管理、數據管控、人工智能與行業模版等多個部分組成。其中,數據管控模塊中就包含了主數據治理,如下圖:
很多人都有個疑問,數據中臺中既包含了數據采集/數據移動的能力,也包含數據服務共享的能力,同時還具備元數據、數據質量、數據安全等數據治理能力,有了數據中臺,為什么還需要主數據管理?
數據中臺通過數據采集、清洗、治理,再以標準接口服務的形式提供出去,供其他系統調用,這確實是數據中臺的核心能力。從功能的角度,主數據管理也的確有類似的功能,例如:主數據采集、主數據清洗、主數據服務等。
但是,我們之前也說過,主數據與數據中臺解決的問題并不相同。
數據中臺是在有了數據之后,在中臺進行數據治理,形成數據資產并提供數據服務。而主數據更強調在數據產生之前定義數據標準,建立數據管理流程,并在數據產生的過程中對數據質量進行校驗,從源頭進行數據治理。
因此,相對于數據中臺來講,主數據管理是一個后臺系統,它可以作為數據中臺的一個數據源為數據中臺供應高質量的數據。
設想一下:如果沒有主數據管理,從各個異構系統中采集到數據中臺的主數據(如:客戶、產品、供應商等)將有不同的定義和編碼,這就需要在數據中臺對這些不一致的數據進行統一治理,這將是一件非常痛苦的事情,而且不能從源頭上解決問題。因此在筆者看來,站在整體解決方案的角度,將主數據治理提前,對于傳統企業來講可能是不錯的解決方案。
— 05 —
有了數據中臺,還需要主數據嗎?
主數據的核心目的是在單一業務領域中,各系統進行核心數據的統一,兩個關鍵詞: 業務系統和統一 。
One ID的核心目的是跨業務領域的數據連通,兩個關鍵詞:跨業務領域、連通。
所以,OneID是放大版的主數據,主數據可以作為OneID的輸入。
-
數據倉庫
+關注
關注
0文章
61瀏覽量
10446 -
阿里
+關注
關注
6文章
438瀏覽量
32828
發布評論請先 登錄
相關推薦
評論