基于Bagging決策樹優化算法
大小:0.84 MB 人氣: 2017-11-21 需要積分:0
針對經典C4.5決策樹算法存在過度擬合和伸縮性差的問題,提出了一種基于Bagging的決策樹改進算法,并基于MapReduce模型對改進算法進行了并行化。首先,基于Bagging技術對C4.5算法進行了改進,通過有放回采樣得到多個與初始訓練集大小相等的新訓練集,并在每個訓練集上進行訓練,得到多個分類器,再根據多數投票規則集成訓練結果得到最終的分類器;然后,基于MapReduce模型對改進算法進行了并行化,能夠并行化處理訓練集、并行選擇最佳分割屬性和最佳分割點,以及并行生成子節點,實現了基于MapReduce Job工作流的并行決策樹改進算法,提高了對大數據集的分析能力。實驗結果表明,并行Bagging決策樹改進算法具有較高的準確度與敏感度,以及較好的伸縮性和加速比。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
基于Bagging決策樹優化算法下載
相關電子資料下載
- 深入探討機器學習的可視化技術 191
- 深度解析機器學習各大模型原理 1144
- 什么是隨機森林?隨機森林的工作原理 1851
- 機器學習基礎知識全攻略 126
- 決策樹:技術全解與案例實戰 762
- 一種基于決策樹的飛機級故障診斷建模方法研究 739
- 基于粗糙集聯合決策樹法的智能變電站遠程調度管理優化 392
- 數據挖掘十大算法 2071
- 常見的機器學習算法及其應用場景 622
- 為什么GBDT用回歸樹不用分類樹?CART決策樹是怎么計算基尼值呢? 1396