1. 程式人生 > >樸素貝葉斯法

樸素貝葉斯法

獨立 貝葉斯估計 樸素貝葉斯 概率 概率分布 輸入 12px 似然 得出

樸素貝葉斯法基於

1.貝葉斯定理

技術分享圖片

2.特征條件獨立假設

用於分類的特征在類(y)確定的情況下是條件獨立的

輸入:

技術分享圖片

過程:

1.學習先驗概率

技術分享圖片

2.學習條件概率分布(條件獨立性假設)

技術分享圖片

其中:

技術分享圖片(極大似然估計)

3.根據貝葉斯公式,計算後驗概率

技術分享圖片

帶入條件概率公式:

技術分享圖片

上式中,分母是一樣的,當k取不同值時分子是不一樣的,得出的後驗概率也不一樣的,樸素貝葉斯就是要求出最大的後驗概率對應的Ck

所以,樸素貝葉斯分類器:

技術分享圖片

由於分母都是一樣的,所以就只計算分子就行:

技術分享圖片

3.輸出:分類Ck

將實例分類為後驗概率最大的類中,等價於期望風險最小化,證明略

參數估計:(主要是先驗概率和條件概率的估計)

極大似然估計:

先驗概率:

技術分享圖片

條件概率:

技術分享圖片

極大似然估計有個缺點是:如果某個特征的條件概率的值為0,那麽計算條件概率時會影響其他特征(因為是連乘),所以采用貝葉斯估計,就是在分子、分母都加上一個參數

貝葉斯估計:

先驗概率:

技術分享圖片

條件概率:

技術分享圖片

樸素貝葉斯法