1. 程式人生 > >聚類模型-模型聚類-高斯混合

聚類模型-模型聚類-高斯混合

聚類模型

1、層次聚類
2、原型聚類-K-means
3、模型聚類-GMM
4、EM演算法-LDA主題模型
5、密度聚類-DBSCAN
6、圖聚類-譜聚類

三、模型聚類-高斯混合

高斯混合的類表示是一個高斯模型,相似性度量定義為服從類cj高斯分佈μ,Σ的概率(Kmeans的相似度量是聚距離度量),所以高斯混合聚類也可以看作是有參的密度聚類。高斯混合假設類之間服從伯努利分佈,樣本在某一類下服從高斯分佈,也就是說每個樣本獨立服從多元高斯分佈。為了使得所有樣本的概率最大化,即最大化對數似然函式:

L(Φ,μ,Σ)=logi=1mP(x(i))=i=1mlog(P(x(i);Φ,μ,Σ))=i=1mlogz(i)=1k(P(x(i)|z(i);μ,Σ)P(z(i);Φ)) 也就是說假設類之間服從一個伯努利分佈: P(z(i)=cj)=P(z(i);Φ)=Φj,j=1kΦj=1,j=1,2..k 樣本在類z(i)下的條件概率服從高斯分佈: P(x(i)=z(i)|z(i))=N(x;μ,Σ)=1(2π)n/2|Σ|1/2exp{12(xμ)TΣ1(xμ)} 那麼樣本x(i)和類標籤z(i)的聯合分佈為: