輸入空間 X⊆Rn 為 n 維向量的集合，輸出空間 Y={c1,c2,...,cK} 為類標記集合設輸入為特徵向量 x，輸出為類標記 y。X 為定義在輸入空間上的隨機向量，Y 是定義在輸出空間上的隨機向量。P(x,y) 為 X 和 Y 的聯合概率分佈，訓練資料集 T={(x1,y1),(x2,y2),...,(xN,yN)} 由 P(X,Y) 獨立同分布產生。

樸素貝葉斯的決策函式為：

y=argmaxckP(Y=ck)∏jNP(X(j)=x(j)|Y=ck)

模型的學習意味著估計 P(Y=ck) 和 P(X(j)=x(j)|Y=ck). 可以使用極大似然估計(MLE)和最大後驗概率估計(MAP)

來進行引數估計.這裡主要討論極大似然估計。

1. 極大似然估計

極大似然估計適於“模型已知，引數未定”的情況. 已知某個隨機樣本滿足某種概率分佈，但是其中具體的引數不清楚，引數估計就是通過若干次試驗，觀察其結果，利用結果推出引數的大概值。最大似然估計是建立在這樣的思想上：已知某個引數能使這個樣本出現的概率最大，我們當然不會再去選擇其他小概率的樣本，所以乾脆就把這個引數作為估計的真實值。我們所估計的模型引數，要使得產生這個給定樣本的可能性最大. 該方法通常有以下幾個步驟：

寫出似然函式
對似然函式取對數
求導數
解似然方程

其中最關鍵的一步在於列出似然函式。

2. 從變數 Y

的分佈律出發構造似然函式

2.1 最簡單的假設：變數 Y 服從伯努利分佈

為簡單起見，考慮二分類的情況，並假設變數 Y 服從伯努利分佈。設 p{Y=c1}=p，則 p{Y≠c1}={Y=c2}=1−p. 統一起來表示為 P{Y=t}=pt(1−p)1−t(t=0,1).

事件 yi 發生的概率是P{yi=t}=pti(1−p)1−ti. 設訓練集中 c1 出現的次數為 d ，則 d=∑Ni=1I(yi=c1).

樣本聯合分佈為：

L(y1,y2,...,yN;p)=∏i=1Npti(1−p)N−ti=pd(1−p)N−d

把 L(y1,y2,...,yN;p) 看成是 p

的函式，稱為引數 p 的似然函式，記為 L(p). 取對數似然函式 lnL(p)=dlnp

樸素貝葉斯的引數估計

1. 極大似然估計

2. 從變數 Y

的分佈律出發構造似然函式

2.1 最簡單的假設：變數 Y 服從伯努利分佈

最大似然和貝葉斯引數估計

最大似然估計和最大後驗概率估計（貝葉斯引數估計）

引數估計：貝葉斯思想和貝葉斯引數估計

貝葉斯引數估計的理解

樸素貝葉斯的引數估計

機器學習筆記（六）——樸素貝葉斯法的引數估計

樸素貝葉斯法的引數估計

《統計學習方法》樸素貝葉斯極大使然估計 Python實現

統計學習方法第四章極大似然估計的樸素貝葉斯分類方法例題4.1程式碼實踐

《統計學習方法》第4章樸素貝葉斯法與貝葉斯估計

極大似然估計法推出樸素貝葉斯法中的先驗概率估計公式如何理解

最大似然估計、最大後驗估計與樸素貝葉斯分類演算法

<Machine Learning in Action >之二樸素貝葉斯 C#實現文章分類

（筆記）斯坦福機器學習第六講--樸素貝葉斯

基於的樸素貝葉斯的文本分類（附完整代碼(spark/java）

樸素貝葉斯分類算法

利用樸素貝葉斯（Navie Bayes）進行垃圾郵件分類

樸素貝葉斯分類算法介紹及python代碼實現案例

樸素貝葉斯算法資料整理和PHP 實現版本

javascript實現樸素貝葉斯分類與決策樹ID3分類

樸素貝葉斯的引數估計

1. 極大似然估計

2. 從變數 Y 的分佈律出發構造似然函式

2.1 最簡單的假設：變數 Y 服從伯努利分佈

相關推薦

2. 從變數 Y

的分佈律出發構造似然函式