色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從不均勻性角度淺析AB實(shí)驗(yàn)

OSC開源社區(qū) ? 來源:OSCHINA 社區(qū) ? 2023-05-12 14:55 ? 次閱讀

本篇的目的是從三個不均勻性的角度,對 AB 實(shí)驗(yàn)進(jìn)行一個認(rèn)知的普及,最終著重講述 AB 實(shí)驗(yàn)的一個普遍的問題,即實(shí)驗(yàn)準(zhǔn)確度問題。

一、AB 實(shí)驗(yàn)場景

在首頁中,我們是用紅色基調(diào)還是綠色基調(diào),是采用門店小列表外 + 商品 feed(左圖),還是采用門店大列表囊括商品 feed(右圖),哪種更吸引用戶瀏覽下單呢,簡單來處理讓 50% 的用戶看到左圖效果,讓 50% 的用戶看到右圖效果,最終通過點(diǎn)擊量,單量等指標(biāo)進(jìn)行比對得出結(jié)論,這是典型的 AB 實(shí)驗(yàn)場景

f4d0b890-f089-11ed-90ce-dac502259ad0.png

f5119d06-f089-11ed-90ce-dac502259ad0.png

二、AB 實(shí)驗(yàn)的定義

A/B 實(shí)驗(yàn)就是針對想迭代的產(chǎn)品功能,提供兩種不同的備選解決方案,然后讓一部分用戶使用方案 A,另一部分用戶使用方案 B,最終通過實(shí)驗(yàn)數(shù)據(jù)對比來確定最優(yōu)方案。 從定義里我們就可以看出來,最直觀的一個概念,就是用戶的分流,此時就涉及到分流人數(shù)是否均勻的問題,即人數(shù)比例的均勻性。

三、AB 中的三個不均勻

1、人數(shù)比例的不均勻

目前 AB 實(shí)驗(yàn)的分流核心算法是通過的哈希算法,假設(shè)我們按用戶名做為分流因子,使用 murmurhash 算法,以 100 桶制為例,確定一個人的位置的算法就是

//將用戶名通過hash算法計算出一個整數(shù) int hashNum = MurmurHash3.murmurhash3_x86_32(useName) //整數(shù)值對100取模 int bucket = hashNum % 100;當(dāng)我們定義一個實(shí)驗(yàn)兩個策略的人數(shù)均為 50% 時,那么 bucket 為 0-49 的用戶由 AB 系統(tǒng)標(biāo)記為 A, 業(yè)務(wù)系統(tǒng)根據(jù) A 標(biāo)記,使得用戶使用方案 A bucket 為 50-99 的用戶由 AB 系統(tǒng)標(biāo)記為 B, 業(yè)務(wù)系統(tǒng)根據(jù) B 標(biāo)記,使得用戶使用方案 B。 可是我們都知道哈希算法并不是絕對均勻的,當(dāng) 100 人時,基本上不會出現(xiàn)有 50 個人走 A,50 個人走 B,但是 1 萬個人的時候,兩部分流量可能就接近了 1:1,10 萬人的時候可能更接近 1:1。 之前有位運(yùn)營的同學(xué)問過,為什么不能用一種很均勻的算法,比如第一個人來了,放入 A,第二個人來了放入 B,第三個人來了放入 A,第四個人來了放入 B....,這樣一天 1W 個人來,5000 個取 A 策略,5000 個取 B 策略。 假設(shè)我們真的這么做了,第一天是 OK 的,第二天進(jìn) A 只來了 4000 人,這樣還是不均勻的,如果你第二天仍然按第一天的規(guī)則重新分配,這樣會有一部分人亂了策略,不符合我們固定人群走固定策略的實(shí)驗(yàn)?zāi)康摹?所以說這個不均勻是無解的,HASH 算法是目前最理想的解決方案,前提是你需要一定的流量,流量越大,分流相對就比較準(zhǔn)確。

2、人群素質(zhì)的不均勻

我們假設(shè)流量足夠大,人數(shù)比例很均勻了,但是還有個問題就是人群素質(zhì)的均勻問題。這里的素質(zhì)包括消費(fèi)能力,活躍度,年齡等各種人群因素。 假設(shè)現(xiàn)在我們的活動統(tǒng)一采用的 A 策略(現(xiàn)狀),我們想驗(yàn)證一下 B 策略(新策略)會不會帶來客單價的提升,就直接做了 AB 實(shí)驗(yàn),還按 1:1 比例來分流,發(fā)現(xiàn)使用 A 方案的人群客單價是 100,使用客單價 B 的人群是 96,此時我們能認(rèn)為原有 A 方案優(yōu)于 B 方案嗎?其實(shí)是不能的,怎樣確定這種人群素質(zhì)的差異呢,可以采用 AA 實(shí)驗(yàn),就是兩部分人都走 A,進(jìn)行分開統(tǒng)計,可能會發(fā)現(xiàn),位于 0-49 桶的人群本身客單價就是 100,而位于 50-99 桶的人群可能只有 94,這么看來 B 方案是能提升客單價的,因?yàn)槲挥?50-99 桶的人群本身指標(biāo)就差一些。 當(dāng)然 AA 不是必須的,可能你有整體的客單價指標(biāo),上了 B 策略后發(fā)現(xiàn)整體提升了,這種情況相當(dāng)于灰度驗(yàn)證了,但實(shí)際情況是比較復(fù)雜的,整體指標(biāo)你是不清楚的(因?yàn)檫@里的整體可能只是你取的業(yè)務(wù)中的一部分流量)。 所以解決素質(zhì)不均勻的手段就是采用 AA 提前確定差異性,再在這個差異性基礎(chǔ)上看差異的變化。

3、實(shí)驗(yàn)間影響的不均勻

這個不均勻性是最復(fù)雜的,一般做實(shí)驗(yàn)我們走兩種極端: 第一種是完全不復(fù)用人群,每個實(shí)驗(yàn)人群都是獨(dú)立的,這樣的話效果比較準(zhǔn)確,但是弊端是,當(dāng)所有流量都被用去后,不能有新實(shí)驗(yàn)開始,必須等待有結(jié)束的實(shí)驗(yàn)后才能繼續(xù)做。 第二種,所有實(shí)驗(yàn)都用全部流量,此時我們認(rèn)為實(shí)驗(yàn)雖然互相之間有影響,但是這種影響是正交的,量大的時候應(yīng)該是均勻的,如下圖所示,P 實(shí)驗(yàn)的兩個策略人群,到 Q 實(shí)驗(yàn)時,對 Q 的兩個策略影響是均勻的。

f52fc89e-f089-11ed-90ce-dac502259ad0.png

這種可以滿足無限個實(shí)驗(yàn),想做多少實(shí)驗(yàn)都可以,但弊端是,實(shí)驗(yàn)太多,必然有影響不均勻的,且我們無法消除這種不均勻。 所以我們想能不能結(jié)合以上兩種情況來處理呢,結(jié)合 google 的 Overlapping Experiment Infrastructure 文章我們設(shè)計出分層的實(shí)驗(yàn)管理模型

f5e23b6e-f089-11ed-90ce-dac502259ad0.png

首先我們將總流量分成兩部分,正交域,垂直域(含對比區(qū)) 我們假設(shè)如圖取 80% 的流量用做正交閾,20% 用作垂直域,垂直域中有 5% 用做對比區(qū)。 上圖正交域下 4 個層,層內(nèi)實(shí)驗(yàn)流量互斥,層間實(shí)驗(yàn)流量正交,我們將可能會互相影響的實(shí)驗(yàn)放到同一層內(nèi)進(jìn)行流量互斥,而影響不大的實(shí)驗(yàn)可以放到不同層內(nèi)。 垂直域中的實(shí)驗(yàn)流量只能互斥,且不與任何實(shí)驗(yàn)正交,可以理解用最純正的流量做實(shí)驗(yàn),可以 I1 和 I2 兩個策略間對比,也可以 I1 或 I2 和對比域(現(xiàn)狀)比對。 那此時有一個很重要的問題需要解決,我們怎么確定哪些實(shí)驗(yàn)互相影響較大,需要放到同一層下。 有一些簡單標(biāo)準(zhǔn),比如入口不一樣,目標(biāo)不一樣等等,這種可以放到不同層,我們可以忽略正交不均勻的問題,反之就不行。 比如活動頁劵對單量提升度的實(shí)驗(yàn)和會員頁面入會效果的實(shí)驗(yàn),就可以放到不同層。 而首頁上滿減活動實(shí)驗(yàn)對客單價提升的實(shí)驗(yàn)和同樣首頁買贈活動對客單價提升的實(shí)驗(yàn),最好是不共用用戶,放到同層比較合適。 但對于很多實(shí)驗(yàn)是不太容易通過簡單規(guī)則來確定的,需要大數(shù)據(jù)的同學(xué)和產(chǎn)品,甚至研發(fā)來共同決定實(shí)驗(yàn)放到哪些層和哪些實(shí)驗(yàn)互斥,這確實(shí)在實(shí)際的運(yùn)作中是最難的點(diǎn)。 總之采用這種策略,可以復(fù)用流量的同時還可以降低不必要的互相影響,比較綜合考慮了流量和準(zhǔn)確度問題。

四、總結(jié)

現(xiàn)在我們對以上問題進(jìn)行總結(jié),從問題到解決方案上來認(rèn)識 ab 實(shí)驗(yàn) 1、人群做不到絕對的均勻,只能通過 HASH 算法,結(jié)合一定的流量來解決。 2、通過 AA 實(shí)驗(yàn),來提前確定人群素質(zhì)的不均勻。最終的實(shí)驗(yàn)數(shù)據(jù)結(jié)合 AA 實(shí)驗(yàn)數(shù)據(jù)來確定最終效果。 3、設(shè)計出正交垂直域,正交閾內(nèi)多個層,每個層內(nèi)放可能相互影響的實(shí)驗(yàn),層內(nèi)互斥,層間正交,保留垂直域,為要求精準(zhǔn)的實(shí)驗(yàn)留出流量,來解決實(shí)驗(yàn)間相互影響的問題。 本篇從核心分流與實(shí)驗(yàn)間相互影響角度講解 ab 實(shí)驗(yàn),希望能引起大家在做實(shí)驗(yàn)前能有更多的思考,來更準(zhǔn)確的驗(yàn)證自己想要的效果,希望大家有興趣的可以留言討論。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4607

    瀏覽量

    92840
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3226

    瀏覽量

    48809

原文標(biāo)題:從不均勻性角度淺析AB實(shí)驗(yàn)

文章出處:【微信號:OSC開源社區(qū),微信公眾號:OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    不均勻的定義 PPT學(xué)習(xí)資料

    不均勻的定義可以這樣說:組成系統(tǒng)是由傳輸線+功能電路,這中間會遇到大量的不均勻或者說不連續(xù)。對于
    發(fā)表于 11-02 17:13

    矩陣式LED的顯示亮度不均勻

    亮的效果(比如點(diǎn)亮LED2 LED 4 LED6 LED8 LED11 LED12)刷新6次;然后,發(fā)現(xiàn)亮度不夠,并且顯示起來亮度不均勻,然后又嘗試了行列式點(diǎn)亮,也是亮度不均勻,其實(shí)單獨(dú)做個LED顯示
    發(fā)表于 12-17 08:41

    在同步設(shè)計中使用占空比不均勻的時鐘是否可行

    喜 在同步設(shè)計中使用占空比不均勻的時鐘是否可行,我使用這些時鐘在上升沿和下降沿執(zhí)行操作。我使用這些脈沖作為總是塊的時鐘。請建議。謝謝,維沙爾以上來自于谷歌翻譯以下為原文hi
    發(fā)表于 01-30 08:03

    VHDL小源程序平均頻率輸出不均勻

    一.積分分頻(小數(shù)分頻)注:只是對平均頻率,輸出不均勻。library ieee; use ieee.std_logic_1164.all; use
    發(fā)表于 02-20 06:35

    如何解決厚銅PCB電路板銅厚度不均勻的問題呢?

    如何解決厚銅PCB電路板銅厚度不均勻的問題呢?
    發(fā)表于 04-11 14:31

    基于不均勻密度的自動聚類算法

    針對基于密度的聚類算法不能自動處理密度分布不均勻的數(shù)據(jù)問題,提出一種基于不均勻密度的自動聚類算法。該算法既保持了一般基于密度算法的優(yōu)點(diǎn),也能有效地處理分布不均
    發(fā)表于 04-09 09:39 ?16次下載

    照度不均勻圖像的自動Gamma灰度校正

    照度不均勻圖片分辨率較差,許多信息被掩蓋,為了較好地去除光照影響,真實(shí)再現(xiàn)原場景,本文提出了一種改進(jìn)的Gamma非線性灰度矯正函數(shù),實(shí)現(xiàn)了對不同像素進(jìn)行不同程度的灰度修正,另
    發(fā)表于 03-01 14:31 ?26次下載

    為什么數(shù)碼管亮度不均勻

    為什么數(shù)碼管亮度不均勻?  關(guān)于亮度一致的問題是一個行業(yè)內(nèi)的常見問題。  有二個大的因素影響到亮度一致。  一是使用原材料芯片的選
    發(fā)表于 11-06 11:44 ?6279次閱讀

    RTC 計秒不均勻

    STM32F103RCT6的RTC 計秒不均勻
    發(fā)表于 12-07 18:13 ?0次下載

    抑制永磁體局部溫升最高點(diǎn)的不均勻軸向分段技術(shù)

    抑制永磁體局部溫升最高點(diǎn)的不均勻軸向分段技術(shù)_陳萍
    發(fā)表于 01-07 18:12 ?0次下載

    為什么光纖激光打標(biāo)機(jī)打標(biāo)效果不均勻

    因?yàn)槊恳粋€聚焦鏡都有對應(yīng)的焦深范圍,而采用偏離焦點(diǎn)的辦法會容易導(dǎo)致大范圍標(biāo)刻圖案時,邊緣處在焦深臨界點(diǎn)或者超出焦深范圍,這樣就比較容易造成效果的不均勻。因此,偏焦標(biāo)刻的方法須考慮激光能量的問題。
    的頭像 發(fā)表于 01-22 17:47 ?2511次閱讀

    簡單分析光纖激光打標(biāo)機(jī)打標(biāo)效果不均勻的原因

    光纖激光打標(biāo)機(jī)打標(biāo)效果不均勻的原因分析。
    的頭像 發(fā)表于 12-25 13:15 ?798次閱讀

    機(jī)器人靜電噴涂不均勻的原因有哪些

    因種種原因機(jī)器人靜電噴涂有時候也有噴涂不均勻的情況,下面分享一下機(jī)器人靜電噴涂不均勻的原因。
    發(fā)表于 12-26 08:27 ?812次閱讀

    淺談連接器電鍍不均勻的原因

    很多連接器都需要電鍍,但是有些連接器電鍍后會出現(xiàn)電鍍不均勻的情況。我們來看看原因。
    的頭像 發(fā)表于 12-07 14:18 ?1474次閱讀

    DataParallel里為什么會顯存不均勻以及如何解決

    DataParallel里為什么會顯存不均勻以及如何解決
    的頭像 發(fā)表于 12-14 10:36 ?1198次閱讀
    主站蜘蛛池模板: 美女裸露100%奶头视频| 樱桃BT在线观看| 福利视频久久| 秋霞电影网午夜鲁丝片无码| 18禁无遮遮挡羞漫画免费阅读 | 亚洲精品久久久久AV无码林星阑| 阿v天堂2017在无码| 嫩草伊人久久精品少妇AV网站| 真人裸交有声性动态图| 久草在线在线精品观看99| 受坐在攻腿上H道具PLAY| 大桥未久与黑人中出视频| 青柠电影高清在线观看| FREECHINESE东北女人真爽| 免费人成网站永久| 97成人碰碰在线人妻少妇| 老师的丝袜脚| 6080yy 久久 亚洲 日本| 啦啦啦WWW在线观看免费高清版| 一二三四高清中文版视频| 久久99热这里只频精品6| 亚洲伊人久久大香线蕉综合图片 | 女教师の诱惑| DASD-700美谷朱里| 欧美巨大xxxx做受高清| QVOD在线播放| 日本特黄的免费大片视频| 纯肉高H放荡受BL文库| 日韩午夜影院| 国产成人自产拍免费视频| 性一交一乱一色一视频| 国产在线精品一区二区在线看 | 76人遣返航班上71人呈阳性| 久久九九亚洲精品| 99久久久久国产精品免费| 免费啪视频观试看视频| gratis videos欧美最新| 在线播放一区二区精品产| 古风一女N男到处做高H| 色欲久久99精品久久久久久AV| 国产超碰人人爱被IOS解锁|