色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

統計假設測試、多臂老虎機方法,揭示了多臂老虎機在實踐中的優勢

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-08-17 09:14 ? 次閱讀

編者按:Cheng-Tao Chu簡要概述了統計假設測試、多臂老虎機(湯普森采樣)方法后,揭示了多臂老虎機在實踐中的優勢。

隨著精益創業和大數據的興起,越來越多的公司開始擁抱A/B測試。盡管業界開始基于數據統計測試特性這一點很是振奮人心,但很少有公司意識到多臂老虎機這一優于傳統統計假設測試的替代方案。本文將概述為何在大多數應用中,多臂老虎機優于假設測試。不熟悉為何基于數據測試特性很重要的讀者,可以看看我之前寫的博客文章 Bridging the gap between lean startup in theory and in practice。需要社會認同的讀者,Google Analytics用的就是多臂老虎機方案。

統計假設測試概述

A/B測試的假設測試的目標是查明觀測到的轉化率差異是否有運氣以外的解釋。標準方法如下:

計算零假設(null hypothesis)下的采樣分布

計算采樣分布下觀測到的似然,并

將概率與預先確定的閾值比較

盡管初看起來很直觀,實際上它需要不少統計學知識來恰當地設計試驗及解釋結果。例如:

如何約束第二類錯誤?

如何同時測試兩個以上的實驗組?

需要多少項觀測?

正確的閾值是多少?

能不能提前查看結果并及早終止試驗?

多臂老虎機概述

“多臂老虎機”這一名稱描述了這樣一個場景:一名賭徒面對著幾臺“單臂老虎機”,每臺老虎機的期望返水不同。目標是最大化一系列拉桿操作的總回報。為了達成這一目標,多臂老虎機動態平衡通過拉動不確定的搖桿收集信息的代價(探索)和拉動已知回報豐厚的拉桿的累計回報(利用)。

在A/B測試的語境下,每臺老虎機代表試驗中的一個實驗組,每次拉動搖桿代表一個實驗組的一次曝光,累計回報代表累計轉化。多臂老虎機問題有很多不同的算法,比如UCB、Epsilon-Greedy等,本文將聚焦于一種名為“湯普森采樣”的算法。

湯普森采樣概述

湯普森采樣的思路非常簡單。該算法維護每臂的返水率的后驗分布,按照在該后驗分布下給定臂最優的概率,成比例地拉動拉桿,接著根據新觀測更新后驗。例如,對兩個觀測到轉化率為10/150和5/100(轉化數/曝光)的實驗組而言,其后驗轉化率分布為Beta(10, 140)和(5, 95)。根據轉化率,后續的測試應該在第一個實驗組上進行,因為該組的轉化率較高。但湯普森采樣并不采用這種確定的方法,而是基于當前的后驗轉化率分布隨機取樣,決定在哪個實驗組上進行,兩者的概率分別為P(第一組是最佳實驗組)和P(第二組是最佳實驗組)。最后,根據新觀測數據更新后驗分布。致不熟悉貝葉斯統計的讀者,貝塔分布經常用作伯努利分布(用來建模轉化率)的共軛先驗分布。

比較

現在我們已經基本了解統計假設測試和多臂老虎機(湯普森采樣),讓我們比較一下兩者。

湯普森采樣更簡單。要恰當地解釋統計假設測試,從業者需要對基本的統計學測試具有良好的理解,例如,提前查看結果需要了解功效分析、偏差修正,處理多實驗組同樣需要了解偏差修正,等等。另一方面,從業者只需理解基本的貝葉斯統計就可以理解湯普森采樣。解釋結果時,較簡單的概念不容易出錯。

湯普森采樣直接估計哪個臂最優的概率。統計假設測試試圖回答“假定所有實驗組轉化率相同的極端情形下,觀測到當前狀況的概率”。而湯普森采樣則試圖回答“給定這些觀測,給定的每個臂最優的概率”。盡管這兩個問題都是合理的,湯普森采樣要容易理解得多,并自然而然地折衷第一類錯誤和第二類錯誤。

多臂老虎機通常更快收斂。由于多臂老虎機方案是自適應的,識別最佳臂(如果它存在)所需的試驗數通常遠低于統計假設測試所需的試驗數。然而,它也意味著,當所有實驗組一樣的時候,需要一個單獨的停止標準。

多臂老虎機可以自然地推廣至多實驗組。這是多臂老虎機真正出彩之處。由于多臂老虎機是自適應的,它可以很快決定哪個臂不太可能是最優的,并以較低的概率拉動這些較差的拉桿。另一方面,在統計假設測試中,每個實驗組分配到的試驗數目是一樣的(由試驗之前的功效分析決定)。

總結一下,在實踐中,相比傳統統計假設測試,多臂老虎機有許多優勢。它通常更快收斂,誤解的空間更小,能更好地推廣至多實驗組,需要調節的參數也較少。向認真對待A/B測試的創業公司強烈推薦多臂老虎機方法。

如果你喜歡這篇博客文章,可以在Twitter上關注我(chengtao_chu)或者訂閱我的博客ML in the Valley。另外,特別感謝 Ian Wong(ihat)和Bob Ren (bobrenjc93) 審閱本文草稿。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4607

    瀏覽量

    92840
  • 大數據
    +關注

    關注

    64

    文章

    8882

    瀏覽量

    137403

原文標題:A/B測試:對比統計假設測試與多臂老虎機

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    模擬老虎機程序分享

    自己做了個模擬老虎機,還有很多不足,請各位高手點評
    發表于 01-13 22:29

    請問sst89e516rd插在51開發板上卻不能下載,請問這是為什么?如何才能使用?

    前幾天在路上揀到一老虎機主板,上有sst89e516rd,把它插在51開發板上卻不能下載,求教大俠告訴我怎么才能使用它
    發表于 07-13 04:16

    老虎機源程序

    點擊下載
    發表于 04-29 09:40

    CAD建筑制圖入門加老虎

    `下面具體介紹CAD建筑制圖入門加老虎窗,建筑設計有不同窗,有一種老虎窗是經常使用到,浩辰CAD軟件里面專門提供此功能,下面具體介紹一下CAD制圖初學入門加老虎窗具體操作步驟。CAD
    發表于 03-26 16:53

    【社區之星】王培瑞:電子人的成長之路——注重在實踐中學習

    嘉賓介紹:王培瑞 2013年7月畢業于西安工程大學自動化專業!參加工作后一直從事于自動化相關專業!擁有豐富的軟硬件開發測試經驗,注重在實踐中學習,善于應用不同的開發工具完成不同業務需求!曾就職于臺達
    發表于 02-16 11:10

    【Start_DSC28034PNT湖人開發板免費體驗】(開源)控制機械小游戲3

    一個選項。根據規則判斷誰是獲勝者或平局。規則如下: 老虎吃雞 雞吃蟲 蟲拱杠子 杠子打老虎 玩家和計算機做出選擇后,會自動根據游戲規則進行判斷并輸出相應的結果,不同的結果機械就會有不同的動作。根據
    發表于 07-30 14:48

    基于單片并行通信設計

    單片串行通信應用十分廣泛,但在串行口被占用又要進行通信時就要采取其它措施。本文介紹
    發表于 10-27 15:00 ?2192次閱讀
    基于單片<b class='flag-5'>機</b>的<b class='flag-5'>多</b><b class='flag-5'>機</b>并行通信設計

    表面電容式觸摸屏讓老虎機和桌游更有趣

    在全球范圍內,人們已經習慣用觸摸屏來實現與各種電子設備之間的互動了。雖然觸摸屏技術從多年前開始就已被應用于老虎機,但隨著游戲行業對大型個性化顯示的需求,觸摸屏技術在這個行業內的應用得到了更大的發展
    發表于 09-13 20:03 ?0次下載

    蒙特卡洛模擬方法

    蒙特卡洛是摩納哥大公國的一座知名賭城,里面遍布輪盤賭、擲骰子和老虎機等游戲,類似的,蒙特卡洛方法的建模機制也基于隨機數和統計概率。
    的頭像 發表于 06-05 11:13 ?9683次閱讀

    基于假設跟蹤框架的攝像多目標跟蹤方法

    為提高攝像目標跟蹤精度,提岀基于假設跟蹤(MH)框架的采用軌跡樹層次關系模型攝像多目標跟蹤方法
    發表于 04-12 16:05 ?38次下載
    基于<b class='flag-5'>多</b><b class='flag-5'>假設</b>跟蹤框架的<b class='flag-5'>多</b>攝像<b class='flag-5'>機</b>多目標跟蹤<b class='flag-5'>方法</b>

    中型C形X光的應用及優勢

    C形X光大家對于這款放射科設備,估計都不太陌生,可是C形的種類較多,主要分為:大C、C和小C等,針對不同的類型的C形,其主要的臨床
    發表于 07-20 09:52 ?2115次閱讀

    平板小C優勢特點是怎樣的

    小C又稱C形X光、骨科C,是指機架為C型的X線影像設備,用于手術的實時動態成像。說起平板小C
    發表于 01-20 10:14 ?2687次閱讀

    MindSpore 首發:隱私保護的 Bandit 算法,實現電影推薦

    老虎機(Bandit)問題是強化學習中一類重要的問題,由于它定義簡潔且有大量的理論分析,因此被廣泛應用于新聞推薦,醫學試驗等實際場景...
    發表于 01-25 18:07 ?0次下載
    MindSpore 首發:隱私保護的 Bandit 算法,實現電影推薦

    帶渦輪開關的插槽車控制器電路

    電子愛好者和愛好者通常喜歡拼搭和玩玩具車。如果您是其中之一,這里有一個可以控制老虎機車的電路。“老虎機車”使用軌道上的插槽和汽車下方的銷來幫助引導它們在賽道上行駛。他們通常有兩輛車。這個老虎機汽車
    的頭像 發表于 07-02 10:43 ?849次閱讀
    帶渦輪開關的插槽車控制器電路

    使用Arduino實現老虎機自動化

    電子發燒友網站提供《使用Arduino實現老虎機自動化.zip》資料免費下載
    發表于 07-06 11:47 ?0次下載
    使用Arduino實現<b class='flag-5'>老虎機</b>自動化
    主站蜘蛛池模板: 亚洲综合久久一本伊伊区| 别停好爽好深好大好舒服视频| 十九禁啊啪射视频在线观看 | 一本之道高清在线观看一区| 无套暴躁白丝秘书| 少妇大荫蒂毛多毛大| 青草国产超碰人人添人人碱| 嗯别插太快好深再深点| 毛片基地看看成人免费| 久久中文字幕乱码免费| 九色PORNY丨视频入口| 国产一区二区波多野结衣| 国产三级在线免费| 国产亚洲精品久久久999蜜臀| 国产美女久久久久久久久久久| 国产产乱码一二三区别免费| 国产成久久免费精品AV片天堂 | 中文字幕人成人乱码亚洲影视S| 亚洲欧洲日产国码久在线| 亚洲精品国产在线网站| 亚洲精品久久99蜜芽尤物TV| 亚洲精品蜜夜内射| 亚洲乱码在线卡一卡二卡新区| 亚洲免费一| 孕妇泬出白浆18P| 2022国产精品不卡a| A级韩国乱理伦片在线观看| Y8848高清私人影院软件优势| 成人无码国产AV免费看| 国产精品第一综合首页| 国产视频www| 久久精品成人免费看| 免费国产午夜理论不卡| 欧洲-级毛片内射八十老太婆| 日本久久久久久久做爰片日本| 色欲AV无码乱码精品国产| 羞羞漫画在线播放| 永久免费毛片| qvod12| 父亲猜女儿在线观看| 果冻传媒色AV国产播放|