1. 程式人生 > >統計學習筆記4—樸素貝葉斯法

統計學習筆記4—樸素貝葉斯法

第四章 樸素貝葉斯法

4.1樸素貝葉斯法的學習與分類

4.1.1基本方法

樸素貝葉斯法通過訓練資料集學習聯合概率分佈。
利用先驗概率分佈和條件概率分佈求得聯合概率分佈:
在這裡插入圖片描述
條件概率引數是指數級,太複雜—條件獨立性假設:用於分類的特徵在類確定的條件下是獨立的。
在這裡插入圖片描述
樸素貝葉斯分類器:
在這裡插入圖片描述

4.1.2 後驗概率最大化的含義

樸素貝葉斯法就是將例項分到後驗概率最大的類中。
因此期望風險最小化就是後驗概率最大化:
在這裡插入圖片描述

4.2樸素貝葉斯法的引數估計

4.2.1極大似然估計

先驗概率的極大似然估計:
在這裡插入圖片描述
條件概率的極大似然估計:
在這裡插入圖片描述

4.2.2學習與分類演算法

演算法流程:
在這裡插入圖片描述

4.2.3貝葉斯估計

極大似然估計存在問題:概率值為0——採用貝葉斯估計:
在這裡插入圖片描述


在這裡插入圖片描述
拉普拉斯平滑:在這裡插入圖片描述