1. 程式人生 > >樸素貝葉斯演算法優缺點

樸素貝葉斯演算法優缺點

樸素貝葉斯的主要優點有:
1)樸素貝葉斯模型有穩定的分類效率。
2)對小規模的資料表現很好,能處理多分類任務,適合增量式訓練,尤其是資料量超出記憶體時,可以一批批的去增量訓練。
3)對缺失資料不太敏感,演算法也比較簡單,常用於文字分類。
樸素貝葉斯的主要缺點有:   
1) 理論上,樸素貝葉斯模型與其他分類方法相比具有最小的誤差率。但是實際上並非總是如此,這是因為樸素貝葉斯模型給定輸出類別的情況下,假設屬性之間相互獨立,這個假設在實際應用中往往是不成立的,在屬性個數比較多或者屬性之間相關性較大時,分類效果不好。而在屬性相關性較小時,樸素貝葉斯效能最為良好。對於這一點,有半樸素貝葉斯之類的演算法通過考慮部分關聯性適度改進。
2)需要知道先驗概率,且先驗概率很多時候取決於假設,假設的模型可以有很多種,因此在某些時候會由於假設的先驗模型的原因導致預測效果不佳。
3)由於我們是通過先驗和資料來決定後驗的概率從而決定分類,所以分類決策存在一定的錯誤率。
4)對輸入資料的表達形式很敏感。