機器學習 - 樸素貝葉斯(下)- 樸素貝葉斯分類器
阿新 • • 發佈:2019-01-01
機器學習 - 樸素貝葉斯(下)- 樸素貝葉斯分類器
-
樸素貝葉斯
-
重要假設
樸素貝葉斯是從訓練資料集中學習聯合概率分佈 ,具體地:
(1) 學習先驗概率分佈
(2) 學習條件概率分佈
其中 為樣本 的第 個特徵(3) 於是學習到聯合概率分佈
但是這裡的問題是, 的計算非常複雜,假設 的第 特徵 可取的值有 個, 可取的值有 個,那麼要計算的引數個數為 ,對這樣指數量級的引數進行估計是不實際的,所以有了樸素貝葉斯中的假設:
假設各個特徵之間條件獨立。
有了這個假設,那麼上面條件概率的計算可以寫成:
(類似 ,當 相互獨立時,可寫成 )
在這樣的假設下,就將原本指數級的引數數量變為常數級的 個。
-
特徵型別
(1) 對於特徵取值離散的特徵,通過計算數量佔比獲得概率;(多項式樸素貝葉斯)
(2) 對於特徵取值連續的特徵,① 離散化;②假設其服從某概率分佈。(高斯樸素貝葉斯) -
樸素貝葉斯分類模型
在於機器學習中,
貝葉斯公式 : 即為 樸素貝葉斯分類器的模型 基本表示式。
又因為有很嚴格的各個特徵之間的獨立性假設,將
-