樸素貝葉斯方法是在貝葉斯算法的基礎上進行了相應的簡化,即假定給定目標值時屬性之間相互條件獨立。也就是說沒有哪個屬性變量對于決策結果來說占有著較大的比重,也沒有哪個屬性變量對于決策結果占有著較小的比重。
雖然這個簡化方式在一定程度上降低了貝葉斯分類算法的分類效果,但是在實際的應用場景中,極大地簡化了貝葉斯方法的復雜性。
樸素貝葉斯分類常用于文本分類,尤其是對于英文等語言來說,分類效果很好。它常用于垃圾文本過濾、情感預測、推薦系統等。
樸素貝葉斯分類器需要三個流程
第一階段:準備階段
在這個階段我們需要確定特征屬性,并對每個特征屬性進行適當劃分,然后由人工對一部分數據進行分類,形成訓練樣本。
第二階段:訓練階段
這個階段就是生成分類器,主要工作是計算每個類別在訓練樣本中的出現頻率及每個特征屬性劃分對每個類別的條件概率。
第三階段:應用階段
這個階段是使用分類器對新數據進行分類。輸入是分類器和新數據,輸出是新數據的分類結果。
樸素貝葉斯算法的優點
1. 樸素貝葉斯模型發源于古典數學理論,有著堅實的數學基礎,以及穩定的分類效率;
2. 對大數量訓練和查詢時具有較高的速度。即使使用超大規模的訓練集,針對每個項目通常也只會有相對較少的特征數,并且對項目的訓練和分類也僅僅是特征概率的數學運算而已;
3. 對小規模的數據表現很好,能個處理多分類任務,適合增量式訓練(即可以實時的對新增的樣本進行訓練);
4. 對缺失數據不太敏感,算法也比較簡單,常用于文本分類;
5. 樸素貝葉斯對結果解釋容易理解。
整合自:CSDN的LeoShaoQiang、程序員姜小白、百度百科
編輯:jq
-
數據
+關注
關注
8文章
7223瀏覽量
90194 -
分類器
+關注
關注
0文章
152瀏覽量
13284 -
樸素貝葉斯
+關注
關注
0文章
12瀏覽量
3407
發布評論請先 登錄
相關推薦
康謀方案 | 基于AI自適應迭代的邊緣場景探索方案

貝思科爾推出創新工具,限時免費試用
貝斯蘭半導體完成數千萬元天使輪融資
阿貝數如何影響光學器件性能
阿貝數與折射率的關系 阿貝數在顯微鏡中的應用
阿貝數在光學中的應用實例
貝啟科技亮相OpenHarmony人才生態大會2024

貝啟科技亮相OpenHarmony人才生態大會2024
無葉風扇燈的優缺點有哪些
共繪智能礦山新藍圖,貝啟科技簽約成為首批礦鴻OSV生態伙伴

強強聯合:貝啟科技與奧思維開啟全面戰略合作

貝索斯再次問鼎全球首富
中車出口巴西第四大城市24列地鐵列車項目正式完成簽約
貝塞爾光束產生的常用方式

評論