第四章樸素貝葉斯法----生成模型
阿新 • • 發佈:2018-11-23
4.1樸素貝葉斯的學習與分類
4.1.1基本方法
聯合概率分佈P(X,Y),獨立同步產生
先驗概率分佈P(Y=ck),k=1,2,…K
條件概率分佈P(X=x|Y=ck)=P(X1=x1,X2=x2,|Y=ck),k=1,2…K,(具有指數級的引數)
因此對概率分佈做獨立同分布假設:
P(X=x|Y=ck)=P(X1=x1,X2=x2,|Y=ck)=πP(Xi=xi|Y=ck)
因此:後驗概率密度P(Y=ck|X=x)=…(這是樸素貝葉斯分類的基本公式)
由此,可以推匯出樸素貝葉斯分類器:y=f(x)=arg maxP(Y=ck|X=x)
4.1.2後驗概率最大化的含義----等價於期望風險最小
兩者經過公式簡化後是等價的
4.2樸素貝葉斯的引數估計
4.2.1極大似然估計
這是一種估計的方法
4.2.2學習與分類的演算法
演算法4.1(樸素貝葉斯演算法)
(1)由T計算先驗概率及條件概率
P(Y=ck)=ΣI(yi=ck)/N
P(X=aji|Y=ck)=… j=1,2,…n; l=1,2,…S; k=1,2,…K
(2)對於給定的例項x=(x1,x2,x3…xn),計算
P(Y=ck|X=x)
(3)確定例項的類
y=arg max P(Y=ck|X=x)
4.2.3貝葉斯估計----彌補極大似然估計可能出現的p=0
在分子分母中加入了λ≥0,
當λ=0時為極大似然估計;當λ=1時,為拉普拉斯平滑