1. 程式人生 > >EM演算法在高斯混合模型中的應用(詳細解釋與求解)

EM演算法在高斯混合模型中的應用(詳細解釋與求解)

1、高斯混合模型GMM

是指具有以下概率分佈的模型:

P ( y θ ) =

k = 1 K α k ϕ (
y θ k ) P(y|\theta)=\sum\limits_{k=1}^{K}\alpha_k\phi(y|\theta_k)

可以看做是 K

K 個單高斯模型的線性組合,其中 α k \alpha_k 是第 k k 個單高斯模型的 ϕ ( y θ k ) = 1 2 π σ k e x p ( ( x μ k ) 2 2 σ k 2 ) \phi(y|\theta_k)=\frac{1}{\sqrt{2\pi}\sigma_k}exp(-\frac{(x-\mu_k)^2}{2\sigma_k^2}) (模型引數 θ k = ( μ k , σ k ) \theta_k=(\mu_k,\sigma_k) )的係數,可以認作是權重,滿足 k = 1 K α k = 1 \sum\limits_{k=1}^{K}\alpha_k=1

2、EM演算法應用於GMM

首先介紹EM演算法步驟:

在這裡插入圖片描述

具體內容參考EM演算法比較

假設觀測序列 y 1 , y 2 , . . . , y n y_1,y_2,...,y_n 產自以上混合高斯模型,對於某個觀測值 y i y_i 可以認為是依概率 α k \alpha_k 選擇了第 k k 個分模型 ϕ ( y θ k ) \phi(y|\theta_k) 。我們做以下標記:

如果 y i y_i 來自第 k k 個模型,那麼 γ i k = 1 \gamma_{ik}=1 ,否則 γ i k = 0 \gamma_{ik}=0

這個 γ i k \gamma_{ik} 也就是隱變量了,因為我們只知道 y i y_i 而不知道它來自哪個模型。
補充:或者這樣理解 p ( z j = k y j ; θ k ) p(z_j=k|y_j;\theta_k) ,同樣是給出了樣本 y j y_j 由第 k k 個分模型產生的後驗概率。等價於 P ( γ j k = 1 y j , θ k ) P(\gamma_{jk}=1|y_j,\theta_k) 。所以對前者求期望和對後者求期望是一樣的,接下來使用的是後者(或許前者更容易理解)。

根據EM演算法的E步:假設模型引數已知的情況下求隱含變數Z分別取z1,z2,…的期望,亦即Z分別取z1,z2,…的概率

w j k = E ( γ j k y j , θ k ) = P ( γ j k = 1 y j , θ k ) = P ( γ j k = 1 , y j θ k ) k = 1 K P ( y j γ j k = 1 , θ k ) P ( γ j k = 1 θ k ) = P ( y j γ j k = 1 , θ k ) P ( γ j k = 1 θ k ) k = 1 K P ( y j γ j k = 1 , θ k ) P ( γ j k = 1 θ k ) = α k ϕ ( y j θ k ) k = 1 K α k ϕ ( y j θ k ) w_{jk}\\=E(\gamma_{jk}|y_j,\theta_k)\\=P(\gamma_{jk}=1|y_j,\theta_k)\\=\frac{P(\gamma_{jk}=1,y_j|\theta_k)}{\sum\limits_{k=1}^{K}P(y_j|\gamma_{jk}=1,\theta_k)P(\gamma_{jk}=1|\theta_k)}\\=\frac{P(y_j|\gamma_{jk}=1,\theta_k)P(\gamma_{jk}=1|\theta_k)}{\sum\limits_{k=1}^{K}P(y_j|\gamma_{jk}=1,\theta_k)P(\gamma_{jk}=1|\theta_k)}\\=\frac{\alpha_k\phi(y_j|\theta_k)}{\sum\limits_{k=1}^{K}\alpha_k\phi(y_j|\theta_k)}

相關推薦

EM演算法混合模型應用詳細解釋求解

1、高斯混合模型GMM 是指具有以下概率分佈的模型: P ( y

05 EM演算法 - 混合模型 - GMM

04 EM演算法 - EM演算法收斂證明 __GMM__(Gaussian Mixture Model, 高斯混合模型)是指該演算法由多個高斯模型線性疊加混合而成。每個高斯模型稱之為component。 __GMM演算法__描述的是資料的本身存在的一種分佈,即樣本特徵屬性的分佈,和預測值Y無關。顯然G

EM演算法】在混合模型應用及python示例

一、EM演算法 EM演算法是一種迭代演算法,用於含有隱含變數的概率模型引數的極大似然估計。設Y為觀測隨機變數的資料,Z為隱藏的隨機變數資料,Y和Z一起稱為完全資料。 觀測資料的似然函式為: 模型引數θ的極大似然估計為: 這個問題只有通過迭代求解,下面給出EM演算法的迭代

EM(期望最大演算法)在混合模型的python實現

以下程式碼僅實現了兩個高斯混合模型在均勻分佈條件下的引數估計,想要實現完全隨機的非均勻分佈的多高斯混合模型,可在上面加以修改。具體參考書中的9.3.2節 ##python實現## import math #import copy import numpy

【機器學習】EM演算法混合模型學習應用

前言 EM演算法,此部落格介紹了EMEM演算法相關理論知識,看本篇部落格前先熟悉EMEM演算法。 本篇部落格打算先從單個高斯分佈說起,然後推廣到多個高斯混合起來,最後給出高斯混合模型引數求解過程。 單個高斯分佈 假如我們有一些資料,這些資料來自同一個

EM演算法混合模型

      由k個高斯模型加權組成,α是各高斯分佈的權重,Θ是引數。對GMM模型的引數估計,就要用EM演算法。更一般的講,EM演算法適用於帶有隱變數的概率模型的估計,即不同的高斯分佈所對應的類別變數。   為何不能使用極大似然估計,如果直接使用極大似然估計

混合模型視訊背景建模的EM演算法Matlab 實現

1.問題描述 影像的背景前景分離. 輸⼊為影像監控的1000 幀 (如下⽅圖中左邊所⽰), 要求輸出是背景和前景 (如下⽅圖中右邊所⽰). 2.背景知識 觀察待處理的監控影像,可以發現,前景主要是來來往往的行人,背景始終是攝像頭對準的固定區域,

EM演算法混合模型(二)

EM引數求解 我們將GMM帶入 θ(g+1) \theta^{(g+1)}中 θ(g+1)=argmaxθ∫zln{P(X,z|θ)P(z|X,θ(g))}dz(6.1) \theta^{(g+1)} = {argm

EM演算法混合模型

單個高斯模型 如果我們有一堆資料,其分佈屬於一個高斯模型,那麼有 p(X)=N(x|μ,Σ)=1(2π)m|Σ|‾‾‾‾‾‾‾‾√exp[−12(x−μ)TΣ−1(x−μ)](1.1) p(X) = N(x|\mu,\Sigma) = \

混合模型GMM及其EM演算法的理解

一個例子 高斯混合模型(Gaussian Mixed Model)指的是多個高斯分佈函式的線性組合,理論上GMM可以擬合出任意型別的分佈,通常用於解決同一集合下的資料包含多個不同的分佈的情況(或者是同一類分佈但引數不一樣,或者是不同型別的分佈,比如正態分佈和伯

混合模型GMM及其求解期望最大化EM演算法

1、高斯混合模型的公式表達 高斯混合模型是指隨機變數x具有如下形式的分佈(概率密度函式): (公式1) 其中,引數θθ代表所有混合成分的引數(均值向量μ與協方差矩陣Σ)的集合: (公式2) 每個混合成分的概率密度函式為:

[R][原始碼]EM演算法實現基於混合模型GMM的聚類

要求:用EM演算法實現基於GMM的聚類演算法。一、實驗資料參考[1] 3.3.2章節。由兩個二維高斯分佈混合生成1000個數據,混合係數分別是0.4、0.6,均值和方差如下:mu1=[-2,-2]sigma1=[1.2, 0.5, 0.5, 1]mean2=[2,2]sigm

R語言:EM演算法混合模型的R語言實現

本文我們討論期望最大化理論,應用和評估基於期望最大化的聚類。軟體包install.packages("mclust");require(mclust)## Loading required package: mclust## Package 'mclust' version

斯坦福大學機器學習——EM演算法求解混合模型

EM演算法(Expection-Maximizationalgorithm,EM)是一種迭代演算法,通過E步和M步兩大迭代步驟,每次迭代都使極大似然函式增加。但是,由於初始值的不同,可能會使似然函式陷入區域性最優。辜麗川老師和其夫人發表的論文:基於分裂EM演算法的GMM引數

EM演算法原理詳解混合模型

藉助於machine learning cs229和文章【1】中的內容把EM演算法的過程順一遍,加深一下印象。 關於EM公式的推導,一般會有兩個證明,一個是利用Jesen不等式,另一個是將其分解成KL距離和L函式,本質是類似的。 下面介紹Jensen EM的

混合模型引數估計的EM演算法

一、高斯模型簡介       首先介紹一下單高斯模型(GSM)和高斯混合模型(GMM)的大概思想。 1.單高斯模型       如題,就是單個高斯分佈模型or正態分佈模型。想必大家都知道正態分佈,這一分佈反映了自然界普遍存在的有關變數的一種統計規律,例如身高,考試成績等;而且有很好的數學性質,具有各階導數

混合模型GMMEM演算法實現

在 聚類演算法K-Means, K-Medoids, GMM, Spectral clustering,Ncut一文中我們給出了GMM演算法的基本模型與似然函式,在EM演算法原理中對EM演算法的實現與收斂性證明進行了詳細說明。本文主要針對如何用EM演算法在混合高

EM演算法及GMM(混合模型的詳解

一、預備知識 1.1、協方差矩陣 在高維計算協方差的時候,分母是n-1,而不是n。協方差矩陣的大小與維度相同。 1.2、黑塞矩陣 1.3、正定矩陣 二、高斯混合模型 點模式的分析中,一般會考察如下五種內容

EM演算法混合模型GMM介紹

EM演算法 EM演算法主要用於求概率密度函式引數的最大似然估計,將問題$\arg \max _{\theta_{1}} \sum_{i=1}^{n} \ln p\left(x_{i} | \theta_{1}\right)$轉換為更加易於計算的$\sum_{i=1}^{n} \ln p\left(x_{i}

CS229 Machine Learning學習筆記:Note 7(K-means聚類、混合模型EM算法)

learn 不同的 inf ear 公式 course splay alt spa K-means聚類 ng在coursera的機器學習課上已經講過K-means聚類,這裏不再贅述 高斯混合模型 問題描述 聚類問題:給定訓練集\(\{x^{(1)},\cdots,x^{(m