色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

埋點實踐過程中遇到的一些問題

數據分析與開發 ? 來源:一個數據人的自留地 ? 作者:數據人創作者聯盟 ? 2021-10-22 16:33 ? 次閱讀

埋點本身現在已經有太多的集成解決方案,神策、諸葛IO、GIO,但是在實踐的過程中仍然還是會碰都很多問題,這些問題都是躺過的坑。

01

梳理當前業務,未來業務發展問題,目的是給埋點預留空間

① 業務兼容的問題

前期規范執行之后,后續隨著業務的拓展,已有數據字段滿足不了業務的分析需求;

產品兼容的問題

埋點從應用端來區分,web/ios/android,小程序,公眾號,然后還要區分一下是否是原生,還是H5,新老版本之間肯定會帶來一些模塊化的差異;

③ 前后端埋點不一致的問題

前端請求服務端的數據大多是存在binlog里面的,數據日志同步解析的過程里面可能會存在丟包的可能性,數倉的穩定性也會影響數據質量;后端服務信息存儲的數據是存在mysql,表字段結構化,分多表存儲,需要靠主鍵進行關聯,有大量的ETL過程。兩者之間可能因為數據清洗、處理、實時技術等原因,造成數據差異化;

③ 自埋點和第三方應用統計口徑的問題

自埋點一般都會定義一個唯一id作為區分用戶的標志,但是第三方是缺少用戶屬性信息的判斷,一般會以設備號uuid/imse,或者IP地址段、mac地址段作為區分標志,從而造成統計數據上的差異化,對于留存分析、轉化分析、流失分析需要用到明細數據的場景,可兼容性不是很友好;

④ 埋點開發技術執行不到位的問題

絕大多數情況下我們說埋點,一般都是說前端埋點,前端開發工程師在做埋點的時候又多是人為埋點,在開發過程中,會造成部分信息冗余、重復、記錄不完整的情況存在;

⑤ 多產品之間的模塊差異化問題

埋點不能夠只有一套標準規范,多生態應用下,業務繁瑣,在產品、技術的架構上有明顯的差異,不同的產品、模塊、坑位、點擊事件的定義也可能有一定的區別,這時候可能需要根據場景劃分不同的埋點標準;

⑥ 自定義埋點信息的鍵對設計問題

往往會在埋點里面增加一個json的字段(bdata),在埋點的時候寫入自定義的業務信息進行場景識別,譬如活動id、業務信息、用戶快照的基本信息等,不同開發寫入的自定義字段格式可能會有差異;

02

埋點應用場景,對應初期埋點預留

基于業務分析框架,梳理常規分析案例中需要用到的埋點數據集,核心指標必須要有埋點;

基于算法模型框架,梳理算法所需要構建的數據特征需要用到的字段信息;

基于業務訴求,梳理非常規,當前沒需求未來有應用場景的字段信息;

舉個例子,譬如供需匹配、資源調度、智能選址,所對應的幾個信息主體分別是:用戶需求方、用戶供給方、商品信息、時間信息、空間信息、行為信息、業務信息;

03

標簽預留場景,反推埋點預留

基于用戶畫像的標簽建設,需要考慮畫像的多層屬性,社會屬性、基本屬性、市場屬性、交易屬性、行為屬性等,通過畫像篩選人群的時候,可能需要通過數據模型建立用戶分層的過程,所需要用到的輔助數據;

基于智能運營的標簽建設,運營策略、活動、方案的數據需求收集,哪些標簽需要用到埋點中的信息;

基于營銷系統的標簽建設,涉及到渠道分配、廣告投放、點擊預測等,可能需要對曝光、點擊、轉化進行全鏈路的埋點建設,或者基于某一個產品使用鏈路,埋點數據要完備;

標簽管理,沒有一套產品來支撐,多標簽你怎么對外提供;海量的標簽,又要怎么做標簽管理;

04

后面做推薦抓到核心指標,前期做埋點預設

推薦算法中需要用到的數據特征中包含哪些數據指標,其中埋點的部分所需要的數據格式是怎樣的;

推薦算法的設計方案,基于用戶、基于物品、協同過濾、基于規則、基于融合模型,不同的方案下,對數據底層的要求可能也會有一定的差異;

05

數倉庫表的開發成本

埋點數據落到數倉后,需要預先建立哪些表,如何做埋點數據的分層;

畢竟埋點的數據體量是非常大的,TB級數據的存儲本身就是一個比較大的成本,再加上調度系統、計算資源、運行性能等方面,就需要數倉團隊在一開始就要把數據模型提前建立好,做好ods層到dw層、ads層的劃分,維度和事實之間的建設;

06

數倉性能,時間問題(hive)

因為埋點數據的體量問題,落表的時候,一定會存在大量的冗余字段,如果集群資源比較緊張,對于常規數據的統計、計算都會帶來性能上的問題;

在數據團隊的架構中,有對外提供數據應用服務,對于數據的實時計算就有一定的要求,什么場景下應該是T+1,什么場景下應該是偽實時,避免數據調度任務影響前臺應用產出;

07

產品全埋點還是分塊埋點?分塊兒埋點的話有什么響應機制?應用措施?

全埋點和分模塊埋點,直接的影響是數據存儲成本的問題,作為一個數據分析,這也是不得不考慮的問題,如果數據結構優化不做好,每年浪費的存儲成本可能會是百萬級的消耗。隨著周期的增加,成本浪費會更嚴重。

所以說,企業數據的分析,不僅局限在數據本身,而應該是全面的剖析,多場景的結合。凡事都不簡單,如果簡單為什么那么多人都沒有做成功,只不過是層次還到而已。

- EOF -

推薦閱讀 點擊標題可跳轉

1、萬字長文說透分布式鎖

2、pandas 與 GUI 界面的超強結合,爆贊!

3、面試,MySQL 搞透這 20 道就穩了

看完本文有收獲?請轉發分享給更多人

推薦關注「數據分析與開發」,提升數據技能

點贊和在看就是最大的支持

原文標題:干貨分享:埋點實踐過程中碰到的坑點集合

文章出處:【微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。

埋點本身現在已經有太多的集成解決方案,神策、諸葛IO、GIO,但是在實踐的過程中仍然還是會碰都很多問題,這些問題都是躺過的坑。

01

梳理當前業務,未來業務發展問題,目的是給埋點預留空間

① 業務兼容的問題

前期規范執行之后,后續隨著業務的拓展,已有數據字段滿足不了業務的分析需求;

② 產品兼容的問題

埋點從應用端來區分,web/ios/android,小程序,公眾號,然后還要區分一下是否是原生,還是H5,新老版本之間肯定會帶來一些模塊化的差異;

③ 前后端埋點不一致的問題

前端請求服務端的數據大多是存在binlog里面的,數據日志同步解析的過程里面可能會存在丟包的可能性,數倉的穩定性也會影響數據質量;后端服務信息存儲的數據是存在mysql,表字段結構化,分多表存儲,需要靠主鍵進行關聯,有大量的ETL過程。兩者之間可能因為數據清洗、處理、實時技術等原因,造成數據差異化;

③ 自埋點和第三方應用統計口徑的問題

自埋點一般都會定義一個唯一id作為區分用戶的標志,但是第三方是缺少用戶屬性信息的判斷,一般會以設備號uuid/imse,或者IP地址段、mac地址段作為區分標志,從而造成統計數據上的差異化,對于留存分析、轉化分析、流失分析需要用到明細數據的場景,可兼容性不是很友好;

④ 埋點開發技術執行不到位的問題

絕大多數情況下我們說埋點,一般都是說前端埋點,前端開發工程師在做埋點的時候又多是人為埋點,在開發過程中,會造成部分信息冗余、重復、記錄不完整的情況存在;

⑤ 多產品之間的模塊差異化問題

埋點不能夠只有一套標準規范,多生態應用下,業務繁瑣,在產品、技術的架構上有明顯的差異,不同的產品、模塊、坑位、點擊事件的定義也可能有一定的區別,這時候可能需要根據場景劃分不同的埋點標準;

⑥ 自定義埋點信息的鍵對設計問題

往往會在埋點里面增加一個json的字段(bdata),在埋點的時候寫入自定義的業務信息進行場景識別,譬如活動id、業務信息、用戶快照的基本信息等,不同開發寫入的自定義字段格式可能會有差異;

02

埋點應用場景,對應初期埋點預留

基于業務分析框架,梳理常規分析案例中需要用到的埋點數據集,核心指標必須要有埋點;

基于算法模型框架,梳理算法所需要構建的數據特征需要用到的字段信息;

基于業務訴求,梳理非常規,當前沒需求未來有應用場景的字段信息;

舉個例子,譬如供需匹配、資源調度、智能選址,所對應的幾個信息主體分別是:用戶需求方、用戶供給方、商品信息、時間信息、空間信息、行為信息、業務信息;

03

標簽預留場景,反推埋點預留

基于用戶畫像的標簽建設,需要考慮畫像的多層屬性,社會屬性、基本屬性、市場屬性、交易屬性、行為屬性等,通過畫像篩選人群的時候,可能需要通過數據模型建立用戶分層的過程,所需要用到的輔助數據;

基于智能運營的標簽建設,運營策略、活動、方案的數據需求收集,哪些標簽需要用到埋點中的信息;

基于營銷系統的標簽建設,涉及到渠道分配、廣告投放、點擊預測等,可能需要對曝光、點擊、轉化進行全鏈路的埋點建設,或者基于某一個產品使用鏈路,埋點數據要完備;

標簽管理,沒有一套產品來支撐,多標簽你怎么對外提供;海量的標簽,又要怎么做標簽管理;

04

后面做推薦抓到核心指標,前期做埋點預設

推薦算法中需要用到的數據特征中包含哪些數據指標,其中埋點的部分所需要的數據格式是怎樣的;

推薦算法的設計方案,基于用戶、基于物品、協同過濾、基于規則、基于融合模型,不同的方案下,對數據底層的要求可能也會有一定的差異;

05

數倉庫表的開發成本

埋點數據落到數倉后,需要預先建立哪些表,如何做埋點數據的分層;

畢竟埋點的數據體量是非常大的,TB級數據的存儲本身就是一個比較大的成本,再加上調度系統、計算資源、運行性能等方面,就需要數倉團隊在一開始就要把數據模型提前建立好,做好ods層到dw層、ads層的劃分,維度和事實之間的建設;

06

數倉性能,時間問題(hive)

因為埋點數據的體量問題,落表的時候,一定會存在大量的冗余字段,如果集群資源比較緊張,對于常規數據的統計、計算都會帶來性能上的問題;

在數據團隊的架構中,有對外提供數據應用服務,對于數據的實時計算就有一定的要求,什么場景下應該是T+1,什么場景下應該是偽實時,避免數據調度任務影響前臺應用產出;

07

產品全埋點還是分塊埋點?分塊兒埋點的話有什么響應機制?應用措施?

全埋點和分模塊埋點,直接的影響是數據存儲成本的問題,作為一個數據分析,這也是不得不考慮的問題,如果數據結構優化不做好,每年浪費的存儲成本可能會是百萬級的消耗。隨著周期的增加,成本浪費會更嚴重。

所以說,企業數據的分析,不僅局限在數據本身,而應該是全面的剖析,多場景的結合。凡事都不簡單,如果簡單為什么那么多人都沒有做成功,只不過是層次還到而已。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7006

    瀏覽量

    88947

原文標題:干貨分享:埋點實踐過程中碰到的坑點集合

文章出處:【微信號:DBDevs,微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    ldc1614使用過程中會有尖峰的存在,怎么解決?

    我購買了該公司的ldc1614,在使用過程中發現了一些問題,如果能為我解答,我將非常感謝。 問題1:為什么我的ldc1614上面LED是紅色但是顯示已連接。有正常數據讀取,這個現象大概發生在我取下
    發表于 12-16 06:53

    使用AFE4403和SFH7050采集脈搏波信號,在設置寄存器參數的時候遇到一些問題求解答

    最近在使用AFE4403和SFH7050采集脈搏波信號,在設置寄存器參數的時候遇到一些問題,有個參數Ambient-cancellation current我理解為環境光消除電流,它是可以spi
    發表于 12-05 07:27

    PLC數據采集在實施過程中存在的問題及解決方案

    PLC數據采集在工業自動化領域的實施過程中,遇到系列顯著的挑戰與痛,這些痛直接影響了數據采集的效率、準確性和成本效益。
    的頭像 發表于 11-30 14:38 ?195次閱讀

    用ADS8698做項目時遇到一些問題求解答

    您好,最近在用ADS8698做項目時遇到一些問題,想請教下: 問題描述:我們使用該芯片的5個輸入通道采集模擬量,兩路采集0-5V電壓信號,路采集4-20mA電流信號,兩路采集溫度信號
    發表于 11-19 06:38

    使用ADS1299的過程中遇到的疑問求解

    我在使用ADS1299的過程中一點疑問,需要您的幫助。 這是張關于BIAS反饋回路的示意圖,在我的理解里這可以看作個加減運算電路,我想知道的是,只關注它的反向輸入時,且暫時忽略
    發表于 11-15 06:35

    電能質量治理產品如何解決分布式光伏電站運行過程中一些問題

    安科瑞徐赟杰 18706165067 1. 概述 隨著全球對可再生能源需求的增加,分布式光伏電站的建設和發展迅速。然而,分布式光伏電站的運行過程中面臨著系列問題,比如導致企業關口計量功率因數
    的頭像 發表于 11-13 10:19 ?137次閱讀
    電能質量治理產品如何解決分布式光伏電站運行<b class='flag-5'>過程中</b>的<b class='flag-5'>一些問題</b>

    鎧裝光纜可以直接地嗎

    ,鎧裝光纜的直接地也需要考慮一些問題: 地下環境:鎧裝光纜敷設的地下環境需要優良,應避免有大量雜物、根系等,以免擠壓和毀損光纜。 施工質量和工藝:鎧裝光纜的直接地需要采用專業工具和施工工藝,確保安裝質量,
    的頭像 發表于 11-06 10:09 ?210次閱讀

    TAS5766開發遇到一些問題 請幫忙解決

    TAS5766遇到一些問題 ,請能幫忙解決。 1, 正常情況,不加EQ時,用DC15V供電4歐姆負載,喇叭端輸出最大有9V左右開始有失真。 2,當加了EQ,其它條件相同,喇叭端輸出最大2V多就
    發表于 10-09 10:05

    Profinet遠程IO模塊的常見問題

    Profinet遠程IO模塊在工業自動化扮演著重要的角色,但使用過程中也可能會遇到一些問題。
    的頭像 發表于 09-18 14:14 ?528次閱讀

    使用VCA810過程中遇到一些問題求解

    我在使用VCA810過程中遇到一些問題,請各位大神指點,具體如下: 1、控制電壓最小只能加到-1.7V,再減小的話輸出信號消失或者放大倍數驟然減小。 2、輸入端出現個疊加在信號上的
    發表于 08-30 07:11

    使用AD8495芯片+K型熱電偶搭建溫度采樣電路時遇到一些問題求解

    您好,我在使用AD8495芯片+K型熱電偶搭建溫度采樣電路時遇到一些問題,希望能得到您的幫助,問題如下: 我們制作的溫度采樣電路的原理圖如下所示:前端采用建議的濾波電路,在AD8495輸出端連接二階
    發表于 06-03 08:50

    編寫個任務調度程序,在上下文切換后遇到一些問題求解

    大家好, 我正在編寫個任務調度程序,在上下文切換后遇到一些問題。 為下個任務恢復上下文后: __builtin_tricore_mtcr_by_name(\"pcxi\&quo
    發表于 05-22 07:50

    USB to CAN分析儀的常見故障盤點

     USB to CAN分析儀在使用過程中可能會遇到一些問題,以下是USB to CAN分析儀常見的十個問題及其簡要描述。
    的頭像 發表于 04-28 12:23 ?688次閱讀
    USB to CAN分析儀的常見故障盤點

    做FPGA向FX3寫數據的過程中遇到一些問題求解

    你好我在做FPGA向FX3寫數據的過程中遇到一些問題想要明確下: (緩沖區的大小設置為16kB,數據總線位寬為32位,水印值為6) 1、如果以16kB為單位寫,這時候pktend_
    發表于 02-28 07:45

    使用ADUC843BSZ62-5替換ADUC831的過程中出現的疑問求解

    請問:使用ADUC843BSZ62-5替換ADUC831的過程中出現一些問題。外部晶振更換為32.768KHZ。系統上電后發現,PSEN引腳始終為0V,CREF電壓為0.32V。VREF電壓在1V波動。使用WSD下載程序時,無法識別芯片型號。
    發表于 01-11 07:07
    主站蜘蛛池模板: 陈红下面又紧又小好爽| 亚洲黄色录像片| 午夜福利免费视频921000电影| 在线播放免费人成视频| 河南老太XXXXXHD| 亚洲H成年动漫在线观看不卡| 国产99久久久欧美黑人刘玥| 日韩性大片| 国产成人高清精品免费5388密 | 日本高清免费一本在线观看| 99久久伊人一区二区yy5099| 欧美ⅹxxxx18性欧美| aaa级黄影片| 人人艹人人| 国产第一页在线视频| 亚洲AV怡红院影院怡春院| 国产熟妇无码一区二| 亚洲AV午夜精品麻豆AV| 精品国产在天天线在线麻豆| 亚洲一区二区免费看| 久久理论片| japanese from色系| 色人阁影视| 国产亚洲AV精品无码麻豆| 亚洲永久精品ww47app| 两性午夜刺激爽爽视频| 99在线这精品视频| 日日干日日操日日射| 国产精品视频免费视频| 亚洲午夜精品一区二区公牛电影院 | 深爱激情站| 国产综合在线视频| 又色又爽又黄gif动态视频| 美女教师朝桐光在线播放| XXXchinese国产HD| 无码AV免费精品一区二区三区 | 亚洲野狼综合网站| 美女也烦恼主题曲| 闺蜜扒开我尿口使劲揉| 亚洲欧美日韩精品自拍| 免费国产午夜理论不卡|