00
引言
前段時(shí)間上了一個用戶畫像的課程,授課老師是《用戶畫像:方法論與工程化解決方案》的作者趙宏田老師;另外也研讀了一些講述用戶畫像的文章。
基于對上述學(xué)習(xí)內(nèi)容的理解,同時(shí)結(jié)合工作實(shí)踐,通過本文和大家分享下有關(guān)用戶畫像的認(rèn)知、建設(shè)方法、產(chǎn)品化和應(yīng)用。
01
初識用戶畫像
1.1 用戶畫像
隨著用戶的一切行為數(shù)據(jù)可以被企業(yè)追蹤到,企業(yè)的關(guān)注點(diǎn)日益聚焦在如何利用大數(shù)據(jù)為經(jīng)營分析和精準(zhǔn)營銷服務(wù),而要做精細(xì)化運(yùn)營,首先要建立本企業(yè)的用戶畫像。
提到用戶畫像的概念,我們區(qū)分下用戶角色(Persona)和用戶畫像(Profile):
1.1.1 用戶角色(Persona)
用戶角色本質(zhì)是一個用以溝通的工具,當(dāng)我們討論產(chǎn)品、需求、場景、用戶體驗(yàn)的時(shí)候,為了避免在目標(biāo)用戶理解上的分歧,用戶角色應(yīng)運(yùn)而生。用戶角色建立在對真實(shí)用戶深刻理解,及高精準(zhǔn)相關(guān)數(shù)據(jù)的概括之上,虛構(gòu)的包含典型用戶特征的人物形象。如下是一個典型的用戶角色:
1.1.2 用戶畫像(Profile)
用戶畫像更多被運(yùn)營和數(shù)據(jù)分析師使用,精準(zhǔn)營銷、經(jīng)營分析、個性化推薦都是基于用戶畫像的應(yīng)用。用戶畫像是各類描述用戶數(shù)據(jù)的變量集合,能夠準(zhǔn)確描述任何一個真實(shí)用戶。如下是一個簡化的用戶畫像:
{ "ID": 123456,
"姓名": "張建國",
"性別": "男",
"出生年月": 631123200,
"籍貫": "北京",
"居住地": "北京",
"教育背景":
{ "學(xué)校":"北京大學(xué)",
"專業(yè)": "CS",
"入學(xué)年月":1220198400
}
}
1.2 用戶標(biāo)簽和用戶畫像
1.2.1 用戶標(biāo)簽
用戶標(biāo)簽,即對用戶某個維度屬性的描述,具有相互獨(dú)立、可枚舉窮盡的特點(diǎn)。采集業(yè)務(wù)、日志、埋點(diǎn)等數(shù)據(jù)后,經(jīng)過不同統(tǒng)計(jì)方式計(jì)算出用戶屬性、用戶行為、用戶消費(fèi)、風(fēng)險(xiǎn)控制、社交等維度標(biāo)簽。例如:性別、年齡、近30日訪問次數(shù)、購買水平、經(jīng)常活躍時(shí)間段等。有關(guān)用戶標(biāo)簽體系建設(shè)的詳細(xì)描述,見「2 建設(shè)標(biāo)簽和標(biāo)簽體系」章節(jié)。
1.2.2 用戶畫像
構(gòu)建用戶畫像,就是給用戶打上各種維度的標(biāo)簽。從業(yè)務(wù)價(jià)值來說,標(biāo)簽和畫像是類似中間層的系統(tǒng)模塊,為數(shù)據(jù)驅(qū)動運(yùn)營奠定了基礎(chǔ),可以幫助大數(shù)據(jù)“走出”數(shù)據(jù)倉庫,針對用戶進(jìn)行個性化推薦、精準(zhǔn)營銷等多樣化服務(wù)。有關(guān)用戶畫像系統(tǒng)、落地應(yīng)用的詳細(xì)描述,見「3 用戶畫像產(chǎn)品化」「4 用戶畫像應(yīng)用」「5 用戶畫像實(shí)踐案例」章節(jié)。
1.3 用戶群組和用戶標(biāo)簽
用戶標(biāo)簽和用戶群組是兩個容易混淆、具有迷惑的概念,下面嘗試區(qū)分:
1.3.1 用戶群組
需要用戶屬性和行為組合,才能圈選出全面的目標(biāo)群體。只有行為數(shù)據(jù),只能看到這個人做過什么事,但這個人是男是女、年齡多大、注冊多久 、購買能力如何等信息都不知道,這樣圈選出的用戶群是有缺陷的,一般不會直接應(yīng)用于精準(zhǔn)營銷場景。
1.3.2 用戶標(biāo)簽
建立用戶標(biāo)簽,不用非要組合用戶屬性和行為事件,單用用戶屬性可以,單用行為事件也可以。基于用戶屬性、行為事件計(jì)算出的用戶標(biāo)簽,本質(zhì)也是用戶屬性,或者說用戶屬性本身就是標(biāo)簽。
1.3.3 群組是標(biāo)簽的一種應(yīng)用方式
標(biāo)簽作為一個中間層系統(tǒng)模塊,在精準(zhǔn)營銷場景,往往不會只使用一個標(biāo)簽進(jìn)行推送,更多情況下需要組合多個標(biāo)簽來滿足業(yè)務(wù)上對人群的定義,見下圖:
這里通過一個場景來介紹基于用戶標(biāo)簽圈選用戶群組的應(yīng)用。某女裝大促活動期間,渠道運(yùn)營人員需要篩選出平臺上的優(yōu)質(zhì)用戶,并通過短信、郵件、Push等渠道進(jìn)行營銷。
第1步:通過圈選“瀏覽”“收藏”“加購”“購買”“搜索”與該女裝相關(guān)品類的標(biāo)簽來篩選出可能對該女裝感興趣的潛在用戶
第2步:組合其他標(biāo)簽(如“性別”“消費(fèi)金額”“活躍度”等)篩選出對應(yīng)的高質(zhì)量用戶群,推送到對應(yīng)渠道。
因此,將用戶屬性、行為事件數(shù)據(jù)抽象成標(biāo)簽后,可通過組合標(biāo)簽方式找到目標(biāo)潛在用戶人群。從這個角度理解,用戶群組是用戶標(biāo)簽應(yīng)用的一種方式。
02
建設(shè)標(biāo)簽和標(biāo)簽體系
2.1 標(biāo)簽的分類
標(biāo)簽本身會有很多分類方式,但從標(biāo)簽的實(shí)現(xiàn)規(guī)則來看,大致可以分為以下3種類型:① 統(tǒng)計(jì)類標(biāo)簽、② 規(guī)則類標(biāo)簽、③ 機(jī)器學(xué)習(xí)挖掘類標(biāo)簽。
2.1.1 統(tǒng)計(jì)類標(biāo)簽
這類標(biāo)簽是最為基礎(chǔ)也最為常見的標(biāo)簽類型,例如,對于某個用戶來說,其性別、年齡、城市、星座、近7日活躍時(shí)長、近7日活躍天數(shù)、近7日活躍次數(shù)等字段可以從用戶注冊數(shù)據(jù)、用戶訪問、消費(fèi)數(shù)據(jù)中統(tǒng)計(jì)得出。該類標(biāo)簽構(gòu)成了用戶畫像的基礎(chǔ)。
2.1.2 規(guī)則類標(biāo)簽
該類標(biāo)簽基于用戶行為、用戶屬性和確定的規(guī)則產(chǎn)生。例如,對平臺上“消費(fèi)活躍”用戶這一口徑的定義為“近30天交易次數(shù)≥2”。在實(shí)際開發(fā)畫像的過程中,由于運(yùn)營人員對業(yè)務(wù)更為熟悉,而數(shù)據(jù)人員對數(shù)據(jù)的結(jié)構(gòu)、分布、特征更為熟悉,因此規(guī)則類標(biāo)簽的規(guī)則由運(yùn)營人員和數(shù)據(jù)人員共同協(xié)商確定。
2.1.3 機(jī)器學(xué)習(xí)挖掘類標(biāo)簽
該類標(biāo)簽通過機(jī)器學(xué)習(xí)挖掘產(chǎn)生,用于對用戶的某些屬性或某些行為進(jìn)行預(yù)測判斷。例如,根據(jù)一個用戶的行為習(xí)慣判斷該用戶是男性還是女性、根據(jù)一個用戶的消費(fèi)習(xí)慣判斷其對某商品的偏好程度。該類標(biāo)簽需要通過算法挖掘產(chǎn)生。
在項(xiàng)目工程實(shí)踐中,一般統(tǒng)計(jì)類和規(guī)則類的標(biāo)簽即可以滿足應(yīng)用需求,在開發(fā)中占有較大比例。機(jī)器學(xué)習(xí)挖掘類標(biāo)簽多用于預(yù)測場景,如判斷用戶性別、用戶購買商品偏好、用戶流失意向等。一般地,機(jī)器學(xué)習(xí)標(biāo)簽開發(fā)周期較長,開發(fā)成本較高,因此其開發(fā)所占比例較小。
事實(shí)上,最終標(biāo)簽體系中是以用戶視角定義的,需要結(jié)合具體的業(yè)務(wù)。比如某電商業(yè)務(wù)標(biāo)簽分類,用戶屬性維度標(biāo)簽、用戶行為維度標(biāo)簽、用戶消費(fèi)維度標(biāo)簽、風(fēng)險(xiǎn)控制維度標(biāo)簽、社交屬性維度標(biāo)簽。
2.2 標(biāo)簽建設(shè)流程
下圖是一個標(biāo)簽建設(shè)流程,會側(cè)重產(chǎn)品經(jīng)理視角,主要描述需求的分析過程和產(chǎn)出文檔,同時(shí)對標(biāo)簽的開發(fā)原理進(jìn)行簡單總結(jié)。
2.2.1 需求收集與分析
在需求收集與分析環(huán)節(jié),可以按還原業(yè)務(wù)流程——明確商業(yè)目的——從策略推標(biāo)簽——匯聚標(biāo)簽的步驟開展。
某服裝零售商,通過布局線上商城和線下實(shí)體店來擴(kuò)大經(jīng)營。線上的話,主要是通過微信公眾號引流到小程序,然后在小程序完成交易。下面通過該服裝零售案例,具體描述下,如何進(jìn)行標(biāo)簽需求的收集與分析:
1、識別分析業(yè)務(wù)流程和業(yè)務(wù)場景觸點(diǎn)
用戶畫像是基于業(yè)務(wù)的,因此,構(gòu)建標(biāo)簽的第一個步驟就是識別與分析用戶的決策流程和業(yè)務(wù)場景,以便快速熟悉業(yè)務(wù)。參考下方案例業(yè)務(wù)流程的還原:
首先是通過各種場景被吸引來的微信用戶關(guān)注公眾號成為了粉絲,然后公眾號運(yùn)營人員會給微信粉絲推送圖文消息進(jìn)行粉絲運(yùn)營,同時(shí)把粉絲引流到小程序商城,公眾號粉絲最終會在小程序商城成交轉(zhuǎn)化。在整個過程中,公眾號運(yùn)營人員會持續(xù)進(jìn)行微信粉絲的維護(hù)和流失粉絲的挽回等運(yùn)營工作。
此處推薦:
《有效需求分析》中詳細(xì)需求篇業(yè)務(wù)功能支持主線需求分析方法
2、明確每個業(yè)務(wù)場景觸點(diǎn)的商業(yè)目的
這一步基于之前對業(yè)務(wù)流程的梳理,洞察業(yè)務(wù)問題,明確想要達(dá)到什么商業(yè)目的,并對商業(yè)目的進(jìn)行拆分。參考下方案例從明確整體商業(yè)目標(biāo),到商業(yè)目標(biāo)拆解和量化的過程:
O:假設(shè)該服裝零售商線上的布局已經(jīng)比較完善,現(xiàn)階段的首要商業(yè)目的就是提升銷售金額,因此“提升銷售金額”就是該零售電商的北極星指標(biāo),那么提升流量、提升轉(zhuǎn)化率、提升客單價(jià)、提升復(fù)購率就是拆解后的核心指標(biāo)。
S:此處假設(shè)想要提升進(jìn)入小程序商城的流量,可以采取的策略也很多。比如,通過掃碼關(guān)注后推送優(yōu)惠券方式吸引更多的微信用戶關(guān)注成為粉絲;再比如,產(chǎn)出更高質(zhì)量微信圖文,更好的運(yùn)營微信私域流量。
M:緊接上一步,針對推送優(yōu)惠券吸引用戶關(guān)注公眾號這個策略,我們可以重點(diǎn)關(guān)注通過掃碼方式關(guān)注公眾號比率、取關(guān)的比率,新舊粉絲的比率。
此處推薦:
OSM模型(Objective、Strategy、Measurement)
銷售公式=流量*轉(zhuǎn)化率*客單價(jià)*復(fù)購率
3、從商業(yè)目的導(dǎo)向運(yùn)營策略設(shè)計(jì)及用戶標(biāo)簽需求
針對不同商業(yè)目的,對標(biāo)簽體系的建設(shè)也是不一樣的,因此要從運(yùn)營策略推導(dǎo)出標(biāo)簽。比如業(yè)務(wù)部門要做個性化推薦,做關(guān)于物或者人的興趣、偏好的標(biāo)簽會比較有價(jià)值;但是如果要做精細(xì)化運(yùn)營,關(guān)于用戶的留存、活躍標(biāo)簽會更有價(jià)值。參考下方用戶標(biāo)簽選用的案例:
把提升掃碼方式關(guān)注率作為量化的目標(biāo),選用的運(yùn)營策略是通過推送優(yōu)惠券方式吸引微信用戶掃碼,新粉絲掃碼關(guān)注后推送100元優(yōu)惠券,老粉絲掃碼后推送50元優(yōu)惠券,那么執(zhí)行運(yùn)營策略過程中需要用到“是否新粉絲”這個標(biāo)簽。
在此階段,可以準(zhǔn)備一個簡單的記錄溝通內(nèi)容的Excel模板,列表頭包括標(biāo)簽名、標(biāo)簽規(guī)則、使用場景等,和業(yè)務(wù)方一起把溝通內(nèi)容記錄下來。
4、組織標(biāo)簽
關(guān)于組織標(biāo)簽,需要基于對業(yè)務(wù)和策略的理解,以用戶視角進(jìn)行分類管理。下面是一個參考框架:
(1)用戶屬性類標(biāo)簽:性別、年齡、省份、城市、注冊日期、手機(jī)號碼等
(2)用戶行為類標(biāo)簽:近30日訪問次數(shù)、近30日客單價(jià)、近30日活躍天數(shù)、近30日訪問時(shí)長、平均訪問深度等
(3)用戶消費(fèi)類標(biāo)簽:收入狀況、購買力水平、已購商品、購買渠道偏好、最后購買時(shí)間、購買頻次等
(4)商品品類類標(biāo)簽:高跟鞋、靴子、襯衫、法式連衣裙、牛仔褲等
(5)社交屬性類標(biāo)簽:經(jīng)常活躍的時(shí)間段、活躍地點(diǎn)、單身、評價(jià)次數(shù)、好評度等
2.2.2 產(chǎn)出標(biāo)簽需求文檔
經(jīng)過前面的需求收集與分析,已明確了業(yè)務(wù)方的標(biāo)簽需求。為了順利交付研發(fā),接下來還需要:撰寫標(biāo)簽體系文檔——根據(jù)標(biāo)簽規(guī)則確定埋點(diǎn)——撰寫數(shù)據(jù)需求文檔。
1、撰寫標(biāo)簽體系文檔
在此環(huán)節(jié),數(shù)據(jù)產(chǎn)品經(jīng)理需要根據(jù)前期和業(yè)務(wù)方的溝通內(nèi)容,產(chǎn)出具體的標(biāo)簽體系文檔:
(1)標(biāo)簽ID:例如, ATTRITUBE_U_01_001, 其中“ATTRITUBE”為人口屬性主題,“_”后面的”U”為userid維度,“_”后面“01”為一級歸類,最后面的“001”為該一級標(biāo)簽下的標(biāo)簽明細(xì)
(2)標(biāo)簽名稱:英文格式名稱,例如,famale
(3)標(biāo)簽漢語:女
(4)標(biāo)簽主題:描述標(biāo)簽所屬的主題,例如,用戶屬性維度標(biāo)簽、用戶行為維度標(biāo)簽、用戶消費(fèi)維度標(biāo)簽
(5)標(biāo)簽層級ID:標(biāo)簽所屬的層級,一般會分為2級
(6)名稱:與ID對應(yīng)的名稱
(7)標(biāo)簽類型:統(tǒng)計(jì)類標(biāo)簽、規(guī)則類標(biāo)簽、機(jī)器學(xué)習(xí)算法類標(biāo)簽
(8)更新頻率:實(shí)時(shí)更新、離線T+1更新、單次計(jì)算
(9)標(biāo)簽算法規(guī)則:
需要描述選擇哪張數(shù)據(jù)表中的具體哪個字段,若需要多張表做關(guān)聯(lián),還需要說明通過什么字段進(jìn)行join
具體的算法邏輯和統(tǒng)計(jì)周期,比如“近7天支付次數(shù)”,就是需要統(tǒng)計(jì)近7天支付的總次數(shù)。
(10)使用場景描述
(11)排期
(12)開發(fā)人
(13)需求方
(14)優(yōu)先級
2、根據(jù)標(biāo)簽規(guī)則確定埋點(diǎn)
前面已經(jīng)明確了標(biāo)簽的算法規(guī)則,接下來要進(jìn)一步確定應(yīng)該埋哪些點(diǎn)來采集所需的數(shù)據(jù),下面是一個具體案例:
針對“購買商品品類偏好”這個標(biāo)簽,會用到點(diǎn)擊下單按鈕事件數(shù)據(jù),以及商品名稱、商品分類等事件屬性數(shù)據(jù),那么就需要對點(diǎn)擊下單按鈕事件進(jìn)行埋點(diǎn)。
3、撰寫數(shù)據(jù)需求文檔
埋點(diǎn)取哪些數(shù)據(jù)已經(jīng)確定了,就需要產(chǎn)出具體的數(shù)據(jù)需求文檔,交付負(fù)責(zé)埋點(diǎn)的開發(fā)同事進(jìn)行埋點(diǎn)取數(shù)了。在數(shù)據(jù)需求文檔,應(yīng)該明確以下內(nèi)容:
(1)埋點(diǎn)名:click_order
(2)埋點(diǎn)顯示名:點(diǎn)擊下單按鈕
(3)上報(bào)時(shí)機(jī):根據(jù)實(shí)際情況,選擇是何時(shí)進(jìn)行上報(bào)。比如對于點(diǎn)擊下單事件,可以選擇點(diǎn)擊了下單按鈕時(shí)就進(jìn)行上報(bào)
(4)埋點(diǎn)形式:根據(jù)實(shí)際情況,選擇是客戶端埋點(diǎn),還是服務(wù)端埋點(diǎn)。比如“購買商品品類偏好”標(biāo)簽的下單按鈕點(diǎn)擊事件,因?yàn)橹皇窍肱袛嘤脩魧徺I商品的偏好,用戶點(diǎn)擊按鈕后已經(jīng)能說明是否有偏好了,不需要等服務(wù)端返回是否成功的提醒,因此適合采用客戶端埋點(diǎn)形式
(5)屬性名:事件屬性的名稱,比如點(diǎn)擊下單按鈕事件的商品名稱屬性
(6)屬性值:比如襯衫
(7)備注
實(shí)際工作中,撰寫標(biāo)簽體系文檔、根據(jù)標(biāo)簽規(guī)則確定埋點(diǎn)、撰寫數(shù)據(jù)需求文檔,會是一個互相完善補(bǔ)充的過程。
2.2.3 標(biāo)簽的開發(fā)
在整個工程化方案中,系統(tǒng)依賴的基礎(chǔ)設(shè)施包括Spark、Hive、HBase、Airflow、MySQL、Redis、Elasticsearch。除去基礎(chǔ)設(shè)施外,系統(tǒng)主體還包括ETL作業(yè)、用戶畫像主題建模、標(biāo)簽結(jié)果數(shù)據(jù)在應(yīng)用端的存儲3個重要組成部分。如圖所示是用戶畫像數(shù)倉架構(gòu)圖,下面對其進(jìn)行簡單介紹。
1、Hive數(shù)據(jù)倉庫ETL作業(yè)
下方虛線框中為常見的數(shù)據(jù)倉庫ETL加工流程,也就是將每日的業(yè)務(wù)數(shù)據(jù)、日志數(shù)據(jù)、埋點(diǎn)數(shù)據(jù)等經(jīng)過ETL過程,加工到數(shù)據(jù)倉庫對應(yīng)的ODS層、DW層、DM層中。
2、Hive數(shù)據(jù)倉庫用戶畫像主題建模
中間的虛線框即為用戶畫像建模的主要環(huán)節(jié),會對基于數(shù)據(jù)倉庫ODS層、DW層、DM層中與用戶相關(guān)數(shù)據(jù)進(jìn)行二次建模加工。
3、標(biāo)簽結(jié)果數(shù)據(jù)在應(yīng)用端的存儲
在用戶畫像主題建模過程中,會將用戶標(biāo)簽計(jì)算結(jié)果寫入Hive,由于不同數(shù)據(jù)庫有不同的應(yīng)用場景,下面分別進(jìn)行描述:
(1)MySQL
作為關(guān)系型數(shù)據(jù)庫,在用戶畫像中可用于元數(shù)據(jù)管理、監(jiān)控預(yù)警數(shù)據(jù)、結(jié)果集存儲等應(yīng)用中。下面詳細(xì)介紹這3個應(yīng)用場景:
元數(shù)據(jù)管理:
MySQL具有更快的讀寫速度,平臺標(biāo)簽視圖中(Web端產(chǎn)品)的標(biāo)簽元數(shù)據(jù)可以維護(hù)在MySQL關(guān)系數(shù)據(jù)庫中,便于標(biāo)簽的編輯、查詢和管理。
監(jiān)控預(yù)警數(shù)據(jù):
在對畫像的數(shù)據(jù)監(jiān)控中,調(diào)度流每跑完相應(yīng)的模塊,就將該模塊的監(jiān)控?cái)?shù)據(jù)插入MySQL中,當(dāng)校驗(yàn)任務(wù)判斷達(dá)到觸發(fā)告警閾值時(shí),就觸發(fā)告警。
結(jié)果集存儲:
存儲多維透視分析用的標(biāo)簽、圈人服務(wù)用的用戶標(biāo)簽、當(dāng)日記錄各標(biāo)簽數(shù)量等。
(2)HBase
與Hive不同的是,HBase能夠在數(shù)據(jù)庫上實(shí)時(shí)運(yùn)行,而不是跑MapReduce任務(wù),適合進(jìn)行大數(shù)據(jù)的實(shí)時(shí)查詢。下面通過一個案例來介紹HBase在畫像系統(tǒng)中的應(yīng)用場景和工程化實(shí)現(xiàn)方式:
某渠道運(yùn)營人員為促進(jìn)未注冊的新安裝用戶注冊、下單,計(jì)劃通過App首頁彈窗發(fā)放紅包或優(yōu)惠券的方式進(jìn)行引導(dǎo)。每天畫像系統(tǒng)的ETL調(diào)度完成后對應(yīng)人群數(shù)據(jù)就被推送到廣告系統(tǒng)(HBase數(shù)據(jù)庫進(jìn)行存儲)。滿足條件的新用戶來訪App時(shí),由在線接口讀取HBase數(shù)據(jù)庫,在查詢到該用戶時(shí)為其推送該彈窗。
(3)Elasticsearch
是一個開源的分布式全文檢索引擎,可以近乎實(shí)時(shí)地存儲、檢索數(shù)據(jù)。對于用戶標(biāo)簽查詢、用戶人群計(jì)算、用戶群多維透視分析這類對響應(yīng)時(shí)間要求較高的場景,也可以考慮選用Elasticsearch進(jìn)行存儲。
2.2.4 標(biāo)簽發(fā)布與效果追蹤
通過開發(fā)測試,上線后需要持續(xù)追蹤標(biāo)簽應(yīng)用效果及業(yè)務(wù)方反饋,調(diào)整優(yōu)化模型及相關(guān)權(quán)重配置。
03
用戶畫像產(chǎn)品化
從業(yè)務(wù)價(jià)值來說,標(biāo)簽和畫像類似一個為前臺服務(wù)提供數(shù)據(jù)支持的中間層系統(tǒng)模塊。開發(fā)完畫像標(biāo)簽數(shù)據(jù),如果只是“躺在”數(shù)據(jù)倉庫中,并不能發(fā)揮更大的業(yè)務(wù)價(jià)值。只有將畫像數(shù)據(jù)產(chǎn)品化后才能以標(biāo)準(zhǔn)方式提升數(shù)據(jù)處理鏈路上各個環(huán)節(jié)的效率,同時(shí)也更便于業(yè)務(wù)方使用。下面分別從產(chǎn)品化后涵蓋的標(biāo)簽生產(chǎn)架構(gòu)和功能模塊兩個角度進(jìn)行總結(jié):
3.1 用戶畫像產(chǎn)品系統(tǒng)架構(gòu)
下圖是一個用戶畫像產(chǎn)品系統(tǒng)的結(jié)構(gòu)圖,數(shù)據(jù)是從左到右的,主要包括數(shù)據(jù)采集、數(shù)據(jù)接入、數(shù)據(jù)整合/標(biāo)簽計(jì)算、標(biāo)簽應(yīng)用4個層級。下面嘗試對其進(jìn)行簡單描述:
3.1.1 數(shù)據(jù)采集
在數(shù)據(jù)采集模塊,主要通過客戶端/服務(wù)端SDK、導(dǎo)入、對接第三方應(yīng)用3種埋點(diǎn)方式進(jìn)行日志數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、第三方數(shù)據(jù)的采集。
1、SDK
(1)客戶端SDK:通過客戶端SDK埋點(diǎn),可以采集iOS、Android、小程序、網(wǎng)站等各種客戶端的用戶行為數(shù)據(jù)和用戶屬性信息。
(2)服務(wù)端SDK:若數(shù)據(jù)已經(jīng)存在數(shù)據(jù)庫、數(shù)據(jù)倉庫,比如訂單信息,可以使用對應(yīng)開發(fā)語言的服務(wù)端SDK進(jìn)行數(shù)據(jù)的采集。
2、Importer
可以根據(jù)運(yùn)行環(huán)境、源數(shù)據(jù)格式、導(dǎo)入數(shù)據(jù)量的大小等影響因素,選擇不同大導(dǎo)入方式,把歷史文件數(shù)據(jù)導(dǎo)進(jìn)用戶畫像產(chǎn)品系統(tǒng)。
3、Link
針對不同第三方產(chǎn)品OpenAPI的特點(diǎn),采用接收事件消息推送、或主動輪詢方式采集用戶在不同第三方應(yīng)用系統(tǒng)的個人屬性和行為事件數(shù)據(jù)。
3.1.2 數(shù)據(jù)接入
埋點(diǎn)數(shù)據(jù)先大量進(jìn)入Kafka,然后慢慢消費(fèi)接入后續(xù)的數(shù)據(jù)整合存儲系統(tǒng)。
3.1.3 數(shù)據(jù)整合/標(biāo)簽計(jì)算
在用戶畫像系統(tǒng)中,主要使用Hive作為數(shù)據(jù)倉庫,進(jìn)行ETL處理,開發(fā)相應(yīng)的用戶屬性表和用戶行為表,以及標(biāo)簽的計(jì)算。
1、數(shù)據(jù)整合
各種渠道接進(jìn)來的數(shù)據(jù),存在孤立、空值、格式不對應(yīng)、超過極限范圍等數(shù)據(jù)質(zhì)量問題,因此需要進(jìn)行臟數(shù)據(jù)清洗、格式轉(zhuǎn)換、用戶識別與合并等整合工作:
(1)Clean/Transform
Clean:
比如,某個用戶的出生年月時(shí)間是未來的某個日期時(shí)刻,因此就需要把這類臟數(shù)據(jù)給過濾掉
Transform:
比如,通過某個第三方應(yīng)用API獲取到的所有用戶的地區(qū)信息是IPB標(biāo)準(zhǔn)編碼形式,為了能和其他渠道的信息一起進(jìn)行分析,就需要根據(jù)IPB標(biāo)準(zhǔn)編碼轉(zhuǎn)換成標(biāo)準(zhǔn)的省、市格式
(2)Id Mapping
各個渠道接進(jìn)來的用戶屬性數(shù)據(jù)、行為事件數(shù)據(jù)等都是孤立的,為了能計(jì)算用戶的全方位的綜合標(biāo)簽,就需要做用戶的識別合并,比如通過unionID,識別合并綁定在同一微信開放平臺的公眾號、小程序、網(wǎng)站的同一個用戶的信息。
經(jīng)過數(shù)據(jù)整合處理,數(shù)據(jù)會進(jìn)入下面的數(shù)據(jù)模型中:
2、標(biāo)簽計(jì)算
在用戶畫像系統(tǒng),會做一套批量離線的標(biāo)簽處理引擎,依賴的是底層比較穩(wěn)定的數(shù)據(jù)結(jié)構(gòu)。這個標(biāo)簽引擎一邊讀事件數(shù)據(jù),一邊讀用戶的屬性數(shù)據(jù),再配合上特定的標(biāo)簽規(guī)則,做一個批量計(jì)算,最后生成用戶標(biāo)簽。
3.1.4 標(biāo)簽應(yīng)用
標(biāo)簽的應(yīng)用主要分為前端畫像展示、通過API接入其他系統(tǒng)兩大類應(yīng)用方式,通過下面的「3.2 用戶畫像產(chǎn)品化功能模塊」章節(jié)具體描述。
3.2 用戶畫像產(chǎn)品功能模塊
3.2.1 系統(tǒng)看板
通常用戶畫像系統(tǒng)的數(shù)據(jù)看板,以可視化形式展示企業(yè)的核心用戶數(shù)據(jù)資產(chǎn)情況或者重點(diǎn)關(guān)注的人群數(shù)據(jù)。旨在建立和統(tǒng)一使用者對企業(yè)數(shù)據(jù)資產(chǎn)或者核心人群數(shù)據(jù)的基礎(chǔ)認(rèn)知,主要分成以下幾類:
1、用戶量級及變化趨勢:不同設(shè)備類型ID量級、不同類型用戶量級(如注冊與非注冊用戶、付費(fèi)與非付費(fèi)用戶等);
2、標(biāo)簽資產(chǎn):按主要類目統(tǒng)計(jì)標(biāo)簽個數(shù)等;
3、核心用戶標(biāo)簽:展示固有或自定義人群的關(guān)鍵標(biāo)簽畫像數(shù)據(jù)等;
3.2.2 標(biāo)簽管理
供業(yè)務(wù)人員進(jìn)行標(biāo)簽的增、刪、改、查等操作,包含:標(biāo)簽分類、新建標(biāo)簽、標(biāo)簽審核、標(biāo)簽上下架、標(biāo)簽覆蓋人數(shù)監(jiān)控等。
基于用戶行為數(shù)據(jù)、用戶屬性數(shù)據(jù),通過設(shè)置標(biāo)簽規(guī)則創(chuàng)建標(biāo)簽:
3.2.3 單用戶畫像
主要能力包含通過輸入用戶ID,來查看單用戶畫像的詳情數(shù)據(jù),如用戶的屬性信息、用戶行為等數(shù)據(jù)。
3.2.4 用戶分群和用戶群畫像
1、用戶分群
用戶分群功能主要是面向業(yè)務(wù)人員使用。產(chǎn)品經(jīng)理、運(yùn)營、客服等業(yè)務(wù)人員在應(yīng)用標(biāo)簽時(shí),可能不僅僅只查看某一個標(biāo)簽對應(yīng)的人群情況,更多地可能需要組合多個標(biāo)簽來滿足其在業(yè)務(wù)上對人群的定義。例如:組合“過去7天領(lǐng)取優(yōu)惠券次數(shù)大于1次”、“活動活躍度等于高和極高”、“女性”用戶這3個標(biāo)簽定義目標(biāo)人群,查看該類人群覆蓋的用戶量。
2、用戶群畫像
和用戶分群功能相似,用戶群畫像功能首先也需要組合標(biāo)簽圈定用戶群體,不同之處在于用戶群畫像功能支持從多個維度去分析圈定用戶群體的特征,而用戶分群功能側(cè)重的是將篩選出來的用戶群推送到各業(yè)務(wù)系統(tǒng)中,提供服務(wù)支持。
3.2.5 BI分析
BI平臺和這些數(shù)據(jù)打通后,可以豐富數(shù)據(jù)的維度,支持通過多種分析模型進(jìn)行更加豐富和深層的分析及對比。
3.2.6 OpenAPI
OpenAPI能夠保障畫像系統(tǒng)數(shù)據(jù)與各系統(tǒng)之間打通,如push推送系統(tǒng)、營銷系統(tǒng)、廣告系統(tǒng)、推薦系統(tǒng)、BI等平臺,并且保證各系統(tǒng)數(shù)據(jù)的實(shí)時(shí)更新,避免同源不同數(shù)的問題。
04
用戶畫像應(yīng)用
前面提到過用戶畫像主要有:經(jīng)營分析、精準(zhǔn)營銷、個性化推薦與服務(wù)3個方面的應(yīng)用。具體又可以分為:
4.1 經(jīng)營分析
用戶畫像系統(tǒng)的標(biāo)簽數(shù)據(jù)通過API進(jìn)入分析系統(tǒng)后,可以豐富分析數(shù)據(jù)的維度,支持進(jìn)行多種業(yè)務(wù)對象的經(jīng)營分析。下面總結(jié)的是一些市場、運(yùn)營、產(chǎn)品人員分析時(shí)會關(guān)注的指標(biāo):
4.1.1 流量分析
1、流量來源
2、流量數(shù)量:UV、PV
3、流量質(zhì)量:瀏覽深度(UV、PV)、停留時(shí)長、來源轉(zhuǎn)化、ROI(投資回報(bào)率,return on investment)
4.1.2 用戶分析
1、用戶數(shù)量:新用戶數(shù)、老用戶數(shù)、新/老用戶數(shù)量比
2、用戶質(zhì)量:新增用戶數(shù)(App啟動)、活躍用戶數(shù)(App啟動)、用戶留存(App啟動-App啟動)、用戶參與度、沉睡、客單價(jià)
4.1.3 商品分析
1、商品動銷:GMV、客單價(jià)、下單人數(shù)、取消購買人數(shù)、退貨人數(shù)、各端復(fù)購率、購買頻次分布、運(yùn)營位購買轉(zhuǎn)化
2、商品品類:支付訂單情況(次數(shù)、人數(shù)、趨勢、復(fù)購)、訪購情況、申請退貨情況、取消訂單情況、關(guān)注情況
4.1.4 訂單分析
1、訂單指標(biāo):總訂單量、退款訂單量、訂單應(yīng)付金額、訂單實(shí)付金額、下單人數(shù)
2、轉(zhuǎn)化率指標(biāo):新增訂單/訪問UV、有效訂單/訪問UV
4.1.5 渠道分析
1、用戶活躍
(1)活躍用戶:UV、PV
(2)新增用戶:注冊量、注冊同環(huán)比
2、用戶質(zhì)量
(1)留存:次日/7日/30日留存率
3、渠道收入
(1)訂單:訂單量、日均訂單量、訂單同環(huán)比
(2)營收:付費(fèi)金額、日均付費(fèi)金額、金額同環(huán)比
(3)用戶:人均訂單量、人均訂單金額
4.1.6 產(chǎn)品分析
1、搜索功能:搜索人數(shù)/次數(shù)、搜索功能滲透率、搜索關(guān)鍵詞
2、關(guān)鍵路徑漏斗等產(chǎn)品功能設(shè)計(jì)分析
4.2 精準(zhǔn)營銷
4.2.1 短信/郵件/push營銷
日常生活中我們經(jīng)常會從許多渠道接收到營銷來的信息。一條關(guān)于紅包到賬的短信消息推送可能會促使用戶打開已經(jīng)很久沒訪問的App,一條關(guān)于心愿單里面圖書降價(jià)的郵件消息推送可能會刺激用戶打開推送鏈接直接下單購買。具體有哪些類型的營銷方式呢?大致可以分為以下4類:
1、基于行為營銷:產(chǎn)品瀏覽、加入購物車、門店掃碼、訂單取消、訂單退貨等
2、基于位置營銷:周邊門店、周邊活動、常去區(qū)域等
3、基于節(jié)日營銷:生日、春節(jié)、雙十一、雙十二、圣誕等
4、基于會員營銷:歡迎入會、卡券提醒、積分變更、等級變化、會員禮遇等
4.2.2 客服話術(shù)
當(dāng)我們在向某平臺的客服部門投訴、咨詢或反饋意見時(shí),客服人員可以準(zhǔn)確的說出我們在平臺的購買情況,上一次咨詢問題的處理結(jié)果等信息,針對性的提出解決方法,對于高價(jià)值用戶提供VIP客服通道等專項(xiàng)服務(wù)。
4.3 個性化推薦與服務(wù)
應(yīng)用的運(yùn)營者,可以通過個推用戶畫像中的性別、年齡段、興趣愛好、瀏覽購買行為等標(biāo)簽,給用戶推薦不同的內(nèi)容。如今日頭條上的個性化文章內(nèi)容推薦、抖音上基于用戶畫像做的個性化視頻內(nèi)容推薦、淘寶上基于用戶瀏覽行為等畫像數(shù)據(jù)做的個性化商品推薦等。
05
用戶畫像實(shí)踐案例
基于畫像系統(tǒng)去做多方面的數(shù)據(jù)分析、觸達(dá)用戶的運(yùn)營方案,可以快速地將標(biāo)簽數(shù)據(jù)應(yīng)用到服務(wù)層(T+1、實(shí)時(shí)應(yīng)用),通過效果分析得到用戶反饋后,幫助迭代營銷策略或產(chǎn)品設(shè)計(jì)。下面通過一些實(shí)踐案例來場景化復(fù)現(xiàn)用戶畫像的應(yīng)用點(diǎn)和應(yīng)用方式。
5.1 A/B人群效果測試
5.1.1 案例背景
某零食類快消商品為在大促活動期間獲得較好的銷量,計(jì)劃通過消息推送的方式種草新上市產(chǎn)品、產(chǎn)品的保健功能等系列文章,為大促活動造勢,激發(fā)銷量轉(zhuǎn)化。為了精準(zhǔn)定位目標(biāo)人群流量,渠道運(yùn)營人員現(xiàn)在計(jì)劃做兩個A/B人群效果測試:
1、不同內(nèi)容標(biāo)題對流量的影響;
2、精準(zhǔn)推送相比普通推送帶來的流量提升。
5.1.2 用戶畫像切入點(diǎn)
整個項(xiàng)目中需要梳理清楚如何切分AB組流量,如何設(shè)計(jì)好AB組人群規(guī)則和效果監(jiān)測。下面分步驟介紹畫像系統(tǒng)如何切入AB人群測試中。
1、對AB組用戶做切分
為了做A/B組測試,首先需要做好流量的切分,可以使用A/B分配隨機(jī)分流的形式,將用戶劃分為A/B人群。
2、測試文案標(biāo)題對流量影響的方案
某平臺渠道運(yùn)營人員為在大促活動期間召回更多用戶來訪App,計(jì)劃在活動預(yù)熱期選取少量用戶做一版文案標(biāo)題的AB效果測試。
在該測試方案中,控制組A選取了A路徑、近x天來訪過,且近x天內(nèi)瀏覽/收藏/加購過該零食的用戶群,給該批用戶推送零售文案A;對照組B選取了B路徑、近x天來訪過,且近x天內(nèi)瀏覽/收藏/加購過該零食的用戶群,給該批用戶推送零食文案B。控制組和對照組的用戶量相同,但文案不同,后續(xù)監(jiān)控兩組人群的點(diǎn)擊率大小,進(jìn)而分析不同文案對用戶點(diǎn)擊的影響。
例如,通過用戶群組功能圈選出A組的用戶,見下圖:
3、精準(zhǔn)推送相比普通推送帶來的流量提升的測試方案
在使用畫像系統(tǒng)精細(xì)化推送人群前,某平臺對用戶采用無差別推送消息的形式進(jìn)行推送。為了測試精細(xì)化運(yùn)營人群相比無差別運(yùn)營帶來的流量提升,渠道運(yùn)營人員決定在近期重點(diǎn)運(yùn)營的零食營銷會場做一個AB效果測試。
該測試方案中,控制組A選取了A路徑、近x天來訪過,近x天內(nèi)瀏覽/收藏/加購過該零食的用戶群;對照組B選取了B路徑、近x天來訪過,且沒有類目偏好的用戶群。對AB組用戶群都消息推送相同的文案,后續(xù)監(jiān)控兩組人群的點(diǎn)擊率大小,進(jìn)而分析精準(zhǔn)營銷推送帶來的增長點(diǎn)大小。
5.1.3 效果分析
在AB組人群消息推送上線后,后續(xù)需要搭建監(jiān)控報(bào)表來監(jiān)測控制組和測試組的流量和轉(zhuǎn)化情況,主要關(guān)注下方列表中的指標(biāo):
例如,使用事件分析模型搭建的AB人群的GMV對比報(bào)表,見下圖:
5.2 女神節(jié)定向營銷
5.2.1 案例背景
某主打女士商品的品牌商,計(jì)劃在女神節(jié)對不同品類偏好的女神進(jìn)行定向營銷。營銷信息會分兩次推送,首次是在當(dāng)天的10:00推送促銷信息,第二次是在當(dāng)天晚上的10:00再統(tǒng)一來一波促銷提醒。最后通過追蹤目標(biāo)受眾的當(dāng)日支付訂單完成率來評估營銷效果。
5.2.2 實(shí)現(xiàn)邏輯
首先基于用戶性別標(biāo)簽、年齡標(biāo)簽圈選出18~40歲,女性的用戶。然后統(tǒng)一延時(shí)至2020-03-08 上午 10:00,根據(jù)用戶品類偏好標(biāo)簽定向推送不同的營銷內(nèi)容,比如給品類偏好=彩妝護(hù)膚的人群推送春日美妝節(jié)類的營銷信息。第二波推送會延時(shí)至2020-03-08 下午 10:00 進(jìn)行推送,推送信息為統(tǒng)一的促銷提醒。
5.3 新安裝未注冊用戶實(shí)時(shí)營銷
5.3.1 案例背景
某零食商城App運(yùn)營人員為促進(jìn)未注冊的新安裝用戶注冊、下單,制定了運(yùn)營規(guī)則:新安裝未注冊用戶打開App時(shí),通過App彈窗方式為其推送優(yōu)惠券進(jìn)行營銷。比如,用戶安裝App后未進(jìn)行注冊,用戶改天打開后立馬對其推送App彈窗優(yōu)惠券,以更好地引導(dǎo)用戶完成注冊、下單。
5.3.2 用戶畫像切入點(diǎn)
渠道運(yùn)營人員通過組合用戶標(biāo)簽(如“未注冊用戶”和“安裝距今天數(shù)”小于××天)篩選出對應(yīng)的用戶群,然后選擇將對應(yīng)人群推送到“廣告系統(tǒng)”。這樣每天畫像系統(tǒng)的ETL調(diào)度完成后對應(yīng)人群數(shù)據(jù)就被推送到HBase數(shù)據(jù)庫進(jìn)行存儲。滿足條件的新用戶來訪App時(shí),由在線接口讀取HBase數(shù)據(jù)庫,在查詢到該用戶時(shí)為其推送該彈窗。
5.4 某電商再營銷廣告
5.4.1 案例背景
某電商App的商品運(yùn)營團(tuán)隊(duì)欲提升電子產(chǎn)品的老客復(fù)購率、新客下單率,于是選擇了和頭條合作投放再營銷廣告。比如,某用戶在該電商App看了vivo手機(jī),第二天刷今日頭條的時(shí)候,就看到了對應(yīng)手機(jī)的廣告信息。
5.4.2 實(shí)現(xiàn)邏輯
首先需要保證該電商App和今日頭條的API已經(jīng)打通,然后基于用戶在App內(nèi)行為(瀏覽、收藏、加購、搜索等)進(jìn)行算法挖掘產(chǎn)生用戶商品偏好的標(biāo)簽。當(dāng)今日頭條捕獲用戶設(shè)備信息后,就會向該電商發(fā)送一個請求,詢問是否需要對這個用戶展示廣告。這個時(shí)候電商平臺會判斷該用戶是否是自己的用戶,如果是自己用戶,就會對今日頭條返回一個推薦結(jié)果,那么用戶就會在今日頭條看到之前瀏覽過的商品信息了,點(diǎn)擊后就可以跳轉(zhuǎn)到電商App內(nèi)的商品詳情頁了。
06
總結(jié)
1、首先,描述了有關(guān)用戶畫像、用戶標(biāo)簽、用戶群組的認(rèn)知性概念;
2、然后,闡述了標(biāo)簽體系的分類、標(biāo)簽建設(shè)的流程和方法;
3、為了說明如何讓“躺在”數(shù)據(jù)倉庫中的畫像標(biāo)簽數(shù)據(jù)發(fā)揮更大的業(yè)務(wù)價(jià)值,接下來從系統(tǒng)架構(gòu)、應(yīng)用層功能兩個角度簡單總結(jié)了用戶畫像系統(tǒng)的建設(shè);
4、最后,從經(jīng)營分析、精準(zhǔn)營銷、個性化推薦3個角度總結(jié)了用戶畫像的應(yīng)用,并在實(shí)踐案例部分列舉幾個用戶畫像實(shí)際應(yīng)用的案例。
責(zé)任編輯:lq
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8424瀏覽量
132763 -
標(biāo)簽
+關(guān)注
關(guān)注
0文章
137瀏覽量
17895 -
用戶畫像
+關(guān)注
關(guān)注
0文章
7瀏覽量
2424
原文標(biāo)題:一文從0到1掌握用戶畫像知識體系
文章出處:【微信號:DBDevs,微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論