色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

XGBoost原理概述 XGBoost和GBDT的區別

WpOh_rgznai100 ? 來源:網絡整理 ? 2019-07-16 18:54 ? 次閱讀

作者 |梁云1991

一、XGBoost和GBDT

xgboost是一種集成學習算法,屬于3類常用的集成方法(bagging,boosting,stacking)中的boosting算法類別。它是一個加法模型,基模型一般選擇樹模型,但也可以選擇其它類型的模型如邏輯回歸等。

xgboost屬于梯度提升樹(GBDT)模型這個范疇,GBDT的基本想法是讓新的基模型(GBDT以CART分類回歸樹為基模型)去擬合前面模型的偏差,從而不斷將加法模型的偏差降低。相比于經典的GBDT,xgboost做了一些改進,從而在效果和性能上有明顯的提升(劃重點面試???/strong>)。第一,GBDT將目標函數泰勒展開到一階,而xgboost將目標函數泰勒展開到了二階。保留了更多有關目標函數的信息,對提升效果有幫助。第二,GBDT是給新的基模型尋找新的擬合標簽(前面加法模型的負梯度),而xgboost是給新的基模型尋找新的目標函數(目標函數關于新的基模型的二階泰勒展開)。第三,xgboost加入了和葉子權重的L2正則化項,因而有利于模型獲得更低的方差。第四,xgboost增加了自動處理缺失值特征的策略。通過把帶缺失值樣本分別劃分到左子樹或者右子樹,比較兩種方案下目標函數的優劣,從而自動對有缺失值的樣本進行劃分,無需對缺失特征進行填充預處理。

此外,xgboost還支持候選分位點切割,特征并行等,可以提升性能。

二、XGBoost原理概述

下面從假設空間,目標函數,優化算法3個角度對xgboost的原理進行概括性的介紹。

1,假設空間

2,目標函數

3,優化算法

基本思想:貪心法,逐棵樹進行學習,每棵樹擬合之前模型的偏差。

三、第t棵樹學什么?

要完成構建xgboost模型,我們需要確定以下一些事情。

1,如何boost? 如果已經得到了前面t-1棵樹構成的加法模型,如何確定第t棵樹的學習目標?

2,如何生成樹?已知第t棵樹的學習目標的前提下,如何學習這棵樹?具體又包括是否進行分裂?選擇哪個特征進行分裂?選擇什么分裂點位?分裂的葉子節點如何取值?

我們首先考慮如何boost的問題,順便解決分裂的葉子節點如何取值的問題。

四、如何生成第t棵樹?

xgboost采用二叉樹,開始的時候,全部樣本都在一個葉子節點上。然后葉子節點不斷通過二分裂,逐漸生成一棵樹。

xgboost使用levelwise的生成策略,即每次對同一層級的全部葉子節點嘗試進行分裂。對葉子節點分裂生成樹的過程有幾個基本的問題:是否要進行分裂?選擇哪個特征進行分裂?在特征的什么點位進行分裂?以及分裂后新的葉子上取什么值?葉子節點的取值問題前面已經解決了。我們重點討論幾個剩下的問題。

1,是否要進行分裂?

根據樹的剪枝策略的不同,這個問題有兩種不同的處理。如果是預剪枝策略,那么只有當存在某種分裂方式使得分裂后目標函數發生下降,才會進行分裂。但如果是后剪枝策略,則會無條件進行分裂,等樹生成完成后,再從上而下檢查樹的各個分枝是否對目標函數下降產生正向貢獻從而進行剪枝。xgboost采用預剪枝策略,只有分裂后的增益大于0才會進行分裂。

2,選擇什么特征進行分裂?

xgboost采用特征并行的方法進行計算選擇要分裂的特征,即用多個線程,嘗試把各個特征都作為分裂的特征,找到各個特征的最優分割點,計算根據它們分裂后產生的增益,選擇增益最大的那個特征作為分裂的特征。

3,選擇什么分裂點位?

xgboost選擇某個特征的分裂點位的方法有兩種,一種是全局掃描法,另一種是候選分位點法。

全局掃描法將所有樣本該特征的取值按從小到大排列,將所有可能的分裂位置都試一遍,找到其中增益最大的那個分裂點,其計算復雜度和葉子節點上的樣本特征不同的取值個數成正比。

而候選分位點法是一種近似算法,僅選擇常數個(如256個)候選分裂位置,然后從候選分裂位置中找出最優的那個。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • GBDT
    +關注

    關注

    0

    文章

    13

    瀏覽量

    3893
  • XGBoost
    +關注

    關注

    0

    文章

    9

    瀏覽量

    2216

原文標題:30分鐘看懂XGBoost的基本原理

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    如何通過XGBoost解釋機器學習

    本文為大家介紹用XGBoost解釋機器學習。 這是一個故事,關于錯誤地解釋機器學習模型的危險以及正確解釋所帶來的價值。如果你發現梯度提升或隨機森林之類的集成樹模型具有很穩定的準確率,但還是需要對其
    發表于 10-12 11:48 ?1813次閱讀
    如何通過<b class='flag-5'>XGBoost</b>解釋機器學習

    PyInstaller打包xgboost算法包等可能出現問題是什么

    PyInstaller 打包 xgboost算法包等可能出現問題
    發表于 07-16 14:35

    基于xgboost的風力發電機葉片結冰分類預測 精選資料分享

    xgboost中文叫做極致梯度提升模型,官方文檔鏈接:https://xgboost.readthedocs.io/en/latest/tutorials/model.html2018年9月6日筆記
    發表于 07-12 06:58

    基于xgboost的風力發電機葉片結冰分類預測 精選資料下載

    xgboost中文叫做極致梯度提升模型,官方文檔鏈接:https://xgboost.readthedocs.io/en/latest/tutorials/model.html2018年9月6日筆記
    發表于 07-12 06:44

    通過學習PPT地址和xgboost導讀和實戰地址來對xgboost原理和應用分析

    關于xgboost的原理網絡上的資源很少,大多數還停留在應用層面,本文通過學習陳天奇博士的PPT和xgboost導讀和實戰地址,希望對xgboost原理進行深入理解。
    的頭像 發表于 01-02 10:18 ?6530次閱讀
    通過學習PPT地址和<b class='flag-5'>xgboost</b>導讀和實戰地址來對<b class='flag-5'>xgboost</b>原理和應用分析

    面試中出現有關Xgboost總結

    介紹 Xgboost是GB算法的高效實現,xgboost中的基學習器除了可以是CART(gbtree)也可以是線性分類器(gblinear)
    發表于 03-20 16:48 ?4472次閱讀

    基于遺傳算法和隨機森林的XGBoost改進方法

    回歸預測是機器學習中重要的研究方向之一,有著廣闊的應用領域。為了進一步提升回歸預測的精度,提出了基于遺傳算法與隨機森林的 Gboost改進方法( GA Xgboost_RF)。首先利用遺傳算法
    發表于 04-26 15:44 ?10次下載
    基于遺傳算法和隨機森林的<b class='flag-5'>XGBoost</b>改進方法

    基于XGBoost的樹突狀細胞算法綜述

    樹突狀細胞算法(DCA)要求輸入3類信號,需要通過人工選取或統計學等方式提前進行特征提取。為準確、高效地提取特征,提岀一種基于 Xgboost的DCA。通過使用ⅹ Gboost算法迭代生成決策樹
    發表于 06-09 14:48 ?3次下載

    基于Xgboost算法的高錳鋼表面粗糙度預測

    基于Xgboost算法的高錳鋼表面粗糙度預測
    發表于 06-19 15:09 ?14次下載

    在幾個AWS實例上運行的XGBoost和LightGBM的性能比較

    XGBoost(eXtreme Gradient Boosting)是一個在Gradient Boosting Decision Tree(GBDT)框架下的開源機器學習庫(https://github.com/dmlc/xgboost
    的頭像 發表于 10-24 10:24 ?1406次閱讀

    XGBoost超參數調優指南

    對于XGBoost來說,默認的超參數是可以正常運行的,但是如果你想獲得最佳的效果,那么就需要自行調整一些超參數來匹配你的數據,以下參數對于XGBoost非常重要
    的頭像 發表于 06-15 18:15 ?825次閱讀
    <b class='flag-5'>XGBoost</b>超參數調優指南

    詳細解釋XGBoost中十個最常用超參數

    對于XGBoost來說,默認的超參數是可以正常運行的,但是如果你想獲得最佳的效果,那么就需要自行調整一些超參數來匹配你的數據
    的頭像 發表于 06-19 17:31 ?1472次閱讀
    詳細解釋<b class='flag-5'>XGBoost</b>中十個最常用超參數

    XGBoost中無需手動編碼的分類特征

    XGBoost 中無需手動編碼的分類特征
    的頭像 發表于 07-05 16:30 ?647次閱讀

    XGBoost 2.0介紹

    XGBoost是處理不同類型表格數據的最著名的算法,LightGBM 和Catboost也是為了修改他的缺陷而發布的。近日XGBoost發布了新的2.0版,本文除了介紹讓XGBoost的完整歷史以外
    的頭像 發表于 11-03 10:12 ?474次閱讀
    <b class='flag-5'>XGBoost</b> 2.0介紹

    詳解XGBoost 2.0重大更新!

    另外還有一點是基于樹的模型可以輕松地可視化和解釋,這進一步增加了吸引力,特別是在理解表格數據結構時。通過利用這些固有的優勢,基于樹的方法——尤其是像XGBoost這樣的高級方法——非常適合處理數據科學中的各種挑戰,特別是在處理表格數據時。
    的頭像 發表于 11-14 16:22 ?785次閱讀
    詳解<b class='flag-5'>XGBoost</b> 2.0重大更新!
    主站蜘蛛池模板: 91成品视频| 秘密影院久久综合亚洲综合| cctv网站| 最近2018年手机中文字幕| 亚洲大片免费观看| 少妇高潮久久久久7777| 欧美中文字幕一区二区三区| 蜜臀AV精品久久无码99| 么公一夜要了我一八次视频HD| 国内自拍 在线 亚洲 欧美| 国产精品高清在线观看地址| 成人在无码AV在线观看一| wwwzzz日本| xxxxx俄罗斯| 芭乐草莓樱桃丝瓜18岁大全| adc高清在线观看| 99久久热视频只有精品| 99 久久99久久精品免观看| 中文字幕爆乳JULIA女教师| 中文字幕一区二区三区在线不卡| 又硬又粗又大一区二区三区视频| 亚洲一区在线观看无码欧美| 亚洲人成在线观看一区二区| 野花日本完整版在线观看免费高清| 亚洲欧美日韩国产另类电影| 一二三四免费中文在线1| 一个人在线观看免费视频 | 囯产精品久久久久久久久免费蜜桃| asian极品呦女xx农村| FREEHDXXXX学生妹| 超碰97免费人妻| 国产成人a视频在线观看| 国产精品热久久高潮AV袁孑怡| 国产又爽又黄又不遮挡视频| 狠狠色狠狠色综合曰曰| 久久精品视频在线直播6| 老师你狠狂| 日本熟妇乱妇熟色A片蜜桃亚洲 | 国产精品成人自拍| 国内精品久久人妻无码HD浪潮| 久草在线福利视频在线播放|