EM演算法（Expectation Maximization Algorithm）

阿新 • • 發佈：2018-11-12

1. Jensen不等式

設 f 是定義域為實數的函式，如果對於所有的實數 x， $f^{^{''}}(x)\geq 0$ ，那麼 f 是凸函式。當 x 是向量時，如果其hessian矩陣 H 是半正定的（ $H\geq 0$ ），那麼 f 是凸函式。如果 $f^{^{''}}(x)> 0$ 或者 $H> 0$ ，那麼稱 f 是嚴格凸函式。

Jensen不等式表述如下：

如果 f 是凸函式，X是隨機變數，那麼 $E[f(X)]\geq f(EX)$

特別地，如果 f 是嚴格凸函式，那麼 $E[f(X)]= f(EX)$ ，當且僅當 $p(X=E[X])=1$ ，也就是說 x 是常量。這裡我們將 $f(E[X])$ 簡寫為 $f(EX)$ 。

2. 最大似然估計

目標：找出與樣本的分佈最接近的概率分佈模型

概率密度p(x|θ)是高斯分佈N(u,∂)的形式,未知引數是θ=[u, ∂]T。抽到的樣本集是X={x1,x2,…,xN},其中，均值u、方差∂2

最大似然函式是在未知引數是θ的情況下，估計樣本X的類別，用聯合概率形式為：

這個概率反映了在概率密度函式的引數是θ時，得到X這組樣本的概率。即：引數θ相對於樣本集

X的似然函式（likehood function）。記為L(θ)。

EM演算法推導過程中，會使用到極大似然估計法估計引數，所以，首先給出一個求最大似然函式估計值的一般步驟：

（1）寫出似然函式；

（2）對似然函式取對數，並整理；

（3）求導數，令導數為0，得到似然方程；

（4）解似然方程，得到的引數即為所求；

3. EM演算法

EM演算法是求極大似然借的一種演算法。

給定m個訓練樣本{x(1),…,x(m)x(1),…,x(m)},假設樣本間相互獨立，我們想要擬合模型p(x,z)p(x,z)到資料的引數。根據分佈，我們可以得到如下這個似然函式：

第一步

是對極大似然函式取對數，第二步是對每個樣本例項的每個可能的類別z求聯合分佈概率之和。然而，直接求這個引數θ會比較困難，因為上式存在一個隱含隨機變數（latent random variable）z。如果z是個已知的數，那麼使用極大似然估計來估算會很容易。在這種z不確定的情形下，EM演算法就派上用場了。

EM演算法的核心思想，簡單的歸納一下：

（1）EM演算法通過引入隱含變數,使用MLE（極大似然估計）進行迭代求解引數。

（2）通常引入隱含變數後會有兩個引數，EM演算法首先會固定其中的第一個引數，然後使用MLE計算第二個變數值；

（3）接著通過固定第二個變數，再使用MLE估測第一個變數值；

（3）依次迭代，直至收斂到區域性最優解。

由於演算法保證了每次迭代之後，似然函式都會增加，所以函式最終會收斂。

更加直觀的表示EM演算法迭代過程如下圖：

EM演算法（Expectation Maximization Algorithm）

1. Jensen不等式

2. 最大似然估計

3. EM演算法

EM演算法（Expectation Maximization Algorithm）

感知機演算法（Perceptron Learning Algorithm）和程式碼實現（Python）

t-分佈鄰域嵌入演算法（t-SNE algorithm）簡單理解

EM演算法及其推廣-expectation maximization algorithm

PLA演算法的理解（perceptron learning algorithm）

深度強化學習演算法 A3C （Actor-Critic Algorithm）

【ML1】機器學習之EM演算法（含演算法詳細推導過程）

NLP --- 隱馬爾可夫HMM（EM演算法（期望最大化演算法））

EM演算法（期望最大化）——應用：GMM

EM演算法：從極大似然估計匯出EM演算法（還算通俗易懂）

資料探勘十大演算法----EM演算法（最大期望演算法）

【算法】狄克斯特拉算法（Dijkstra’s algorithm）

為什麼我要放棄javaScript資料結構與演算法（第三章）—— 棧

為什麼我要放棄javaScript資料結構與演算法（第五章）—— 連結串列

學習JavaScript資料結構與演算法（第2版）.epub

STL之劃分與排序演算法（Partions and Sorting）

十大經典排序演算法（動圖演示）十大經典排序演算法（動圖演示）

c++分塊演算法（暴力資料結構）

【轉載】黃金比例搜尋演算法（Golden Section Search）的實現

【筆記】大數乘法之Karatsuba演算法（Java BigInteger原始碼）

EM演算法（Expectation Maximization Algorithm）

1. Jensen不等式

2. 最大似然估計

3. EM演算法

相關推薦