【轉】EM演算法MATLAB程式碼及詳細註解

阿新 • • 發佈：2021-08-11

【轉】EM演算法MATLAB程式碼及詳細註解

版權宣告：本文為博主原創文章，遵循 CC 4.0 BY-SA 版權協議，轉載請附上原文出處連結和本宣告。
本文連結：https://blog.csdn.net/qq_23968185/article/details/70940197
作者：鼴鼠的鬍鬚

覺得有用的話,歡迎一起討論相互學習~

下面程式碼為PRML所附的基於混合高斯（MoG）的程式碼，個人認為編碼可讀性和風格都值得借鑑。

function [label, model, llh] = mixGaussEm(X, init)
% Perform EM algorithm for fitting the Gaussian mixture model.
% Input: 
%   X: d x n data matrix
%   init: k (1 x 1) number of components or label (1 x n, 1<=label(i)<=k) or model structure
% Output:
%   label: 1 x n cluster label
%   model: trained model structure
%   llh: loglikelihood
% Written by Mo Chen ([email protected]).
%% init
fprintf('EM for Gaussian mixture: running ... \n');
tol = 1e-6;
maxiter = 500;
llh = -inf(1,maxiter);
R = initialization(X,init);
for iter = 2:maxiter
    [~,label(1,:)] = max(R,[],2);      %label表示1*n的類別向量
    R = R(:,unique(label));            % remove empty clusters，unique輸出label向量中不重複的元素，表示非空類別向量    
    model = maximization(X,R);         %EM演算法的M step，X表示資料矩陣，R表示類別矩陣，model是結構體，表示模型，其屬性是模型的引數
    [R, llh(iter)] = expectation(X,model);            %EM演算法的E step，X表示資料矩陣，model表示模型結構體，R表示返回的隸屬度矩陣，llh表示似然函式的目標值
    if abs(llh(iter)-llh(iter-1)) < tol*abs(llh(iter)); break; end;
end
llh = llh(2:iter);

function R = initialization(X, init)   %X是資料矩陣，init用於初始化MoG的成分，R返回的是一個n行k列的矩陣，第ij個元素表示第i個樣本由第j個成分生成的概率
n = size(X,2);                         %n是樣本個數
if isstruct(init)  % init with a model %isstruct判斷輸入是否是一個matlab結構體
    R  = expectation(X,init);          %如果init是一個結構體，直接用該模型進行E step
elseif numel(init) == 1                %如果init是一個整數
    k = init;                          %用init表示混合成分的個數，即類別個數
    label = ceil(k*rand(1,n));         %ceil用於向數軸的正方向取整，初始化樣本的label
    R = full(sparse(1:n,label,1,n,k,n));              %sparse通過記錄稀疏矩陣非負元素的索引和值來節省記憶體，full是一相反作用；R是n行k列矩陣，n表示樣本個數，k表示類別數，每一行
                                                      %是一個one-hot向量，表示該樣本屬於哪一類
elseif all(size(init)==[1,n])  % init with labels     %若init是一個一行n列的向量，則為樣本類別的向量
    label = init;
    k = max(label);
    R = full(sparse(1:n,label,1,n,k,n));
else
    error('ERROR: init is not valid.');
end

%EM演算法的E step，X表示資料矩陣，model表示模型結構體，R表示返回的隸屬度矩陣，llh表示似然函式的目標值
function [R, llh] = expectation(X, model)
mu = model.mu;
Sigma = model.Sigma;
w = model.w;                           %w為MoG的混合係數向量

n = size(X,2);                         %n為樣本個數
k = size(mu,2);                        %k為MoG混合成分的個數，即類別個數
R = zeros(n,k);                        %R隸屬度矩陣，行數為樣本個數，列數為類別個數，第ij個元素表示第i個樣本由第j個成分生成的概率
for i = 1:k                            %計算樣本的每個gauss概率的對數
    R(:,i) = loggausspdf(X,mu(:,i),Sigma(:,:,i));
end
R = bsxfun(@plus,R,log(w));            %計算隸屬度（未歸一化）矩陣的對數
T = logsumexp(R,2);                    %對R取指數加和再取對數
llh = sum(T)/n; % loglikelihood        %似然函式的均值
R = exp(bsxfun(@minus,R,T));           %計算隸屬度矩陣

%EM演算法的M step，X表示資料矩陣，R表示隸屬度矩陣，第ij個元素表示第i個樣本由第j個成分生成的概率，model是結構體，表示模型，其屬性是模型的引數
function model = maximization(X, R)
[d,n] = size(X);                                    %d表示樣本維數，n表示樣本個數
k = size(R,2);                                      %k表示MoG成分的個數
nk = sum(R,1);                                      %nk表示求隸屬度矩陣R的列和
w = nk/n;                                           %w表示混合成分系數               
mu = bsxfun(@times, X*R, 1./nk);                    %mu是一個m行k列的矩陣，表示k個高斯成分的期望，每個都是m元隨機變數

Sigma = zeros(d,d,k);                               %Sigma是一個三維張量，表示第k個高斯成分的協方差矩陣是d*d的
r = sqrt(R);
for i = 1:k                                         %迴圈計算每個成分的協方差
    Xo = bsxfun(@minus,X,mu(:,i));
    Xo = bsxfun(@times,Xo,r(:,i)');
    Sigma(:,:,i) = Xo*Xo'/nk(i)+eye(d)*(1e-6);
end

model.mu = mu;
model.Sigma = Sigma;
model.w = w;

function y = loggausspdf(X, mu, Sigma)              %計算Gauss概率分佈函式的對數的函式，輸入變數分別為資料X，期望mu，期望協方差Sigma
d = size(X,1);                                      %d表示樣本維數
X = bsxfun(@minus,X,mu);                            %樣本與均值作差
[U,p]= chol(Sigma);                                 %chol表示將協方差矩陣Sigma進行一個上三角矩陣分解，U表示上三角因子矩陣，Sigma=U'的逆與U作積（將協方差矩陣分解求逆加快計算效率）
if p ~= 0                                           %如果p不為0則Sigma不是正定矩陣，報錯
    error('ERROR: Sigma is not PD.');
end
Q = U'\X;                                           %Q=U'的逆與X的乘積
q = dot(Q,Q,1);  % quadratic term (M distance)      %dot表示點乘之後求列和
c = d*log(2*pi)+2*sum(log(diag(U)));   % normalization constant
y = -(c+q)/2;

function s = logsumexp(X, dim)
% Compute log(sum(exp(X),dim)) while avoiding numerical underflow.
%   By default dim = 1 (columns).
% Written by Mo Chen ([email protected]).
if nargin == 1, 
    % Determine which dimension sum will use
    dim = find(size(X)~=1,1);
    if isempty(dim), dim = 1; end
end

% subtract the largest in each dim
y = max(X,[],dim);
s = y+log(sum(exp(bsxfun(@minus,X,y)),dim));   % TODO: use log1p
i = isinf(y);
if any(i(:))
    s(i) = y(i);
end

【轉】EM演算法MATLAB程式碼及詳細註解

【轉】EM演算法MATLAB程式碼及詳細註解版權宣告：本文為博主原創文章，遵循 CC 4.0 BY-SA 版權協議，轉載請附上原文出處連結和本宣告。

【轉】記憶體管理內幕mallco及free函式實現--簡易記憶體分配器、記憶體池、GC技術

原文：https://www.ibm.com/developerworks/cn/linux/l-memory/ 為什麼必須管理記憶體記憶體管理是計算機程式設計最為基本的領域之一。在很多指令碼語言中，您不必擔心記憶體是如何管理的，這並不能使得記憶體管理

【轉】嵌入式C語言程式碼優化方案

來源：嵌入式C語言程式碼優化方案(深度好文,建議花時間研讀並收藏) (qq.com) 1、選擇合適的演算法和資料結構

【轉】 springboot整合redis-sentinel支援Cache註解

【轉】 springboot整合redis-sentinel支援Cache註解一、前提已經存在一個redis-sentinel叢集，兩個哨兵分別如下：

【轉】java連線mysql資料庫的詳細步驟

轉自：http://blog.csdn.net/huwentao0305/article/details/53378755 其中程式碼有部分問題，我將其完善了一下。

【轉】Docker搭建Jenkins容器 (完整詳細版)

前言需要提前準備的條件 Maven環境 Docker環境 JDK環境(Centos7.4自帶JDK環境去除，重灌的JDK)

【轉】c#判斷字串是否存在字母及字串中字元的替換例項

首先要新增對名稱空間“using System.Text.RegularExpressions;”的引用下面以一個字串為例：

JS陣列reduce()方法詳解及高階技巧【轉】

轉https://www.jianshu.com/p/e375ba1cfc47 1、語法 arr.reduce(callback,[initialValue]) reduce 為陣列中的每一個元素依次執行回撥函式，不包括陣列中被刪除或從未被賦值的元素，接受四個引數：初始值（或者上一

Linux核心-記憶體回收邏輯和演算法（LRU）【轉】

轉自：https://www.cnblogs.com/muahao/p/10109712.html Linux核心記憶體回收邏輯和演算法(LRU)

segment fault異常及常見定位手段【轉】

轉自：https://www.cnblogs.com/wahaha02/p/8034112.html 問題背景最近boot中遇到個使用者態程式的segment fault異常，除了一句“Segment fault”列印外無其他任何列印。該問題復現概率較低，定位起來比

HAProxy的四層與七層的區別及透傳IP實戰案例【轉】

一.HAProxy在四層的工作原理　　在四層負載裝置中，把client傳送的報文目標地址(原來是負載均衡裝置的IP地址)，根據均衡裝置設定的選擇web伺服器的規則選擇對應的web伺服器IP地址，這樣client就可以直接跟此伺服器

gocron在linux環境下安裝及設定開機啟動【轉】

安裝gocron，github地址：https://github.com/ouqiang/gocron 我們直接使用二進位制安裝包，這樣最簡單。

【轉】多圖+程式碼 | 詳解Python操作Excel神器openpyxl的各種操作！

轉自：https://blog.csdn.net/weixin_41846769/article/details/108273349 前言大家好，在之前的十幾篇辦公自動化系列文章中，我們大多是以真實的案例需求來講解Python如何進行自動化辦公操作，並且多次使用到openp

SpringMVC Mybatis Shiro RestTemplate的實現客戶端無狀態驗證及訪問控制【轉】

>>> A.首先需要搭建SpringMVC+Shiro環境 a1.pom.xml配置spring: <dependency> <groupId>org.springframework</groupId>

通過dubbo暴露介面呼叫方法，及基於zookeeper的dubbo涉及配置檔案【轉】

>>> 現在很流行的Dubbo很多朋友都聽說過吧，最近我也在看這方面的東西，分享先我的心得筆記。

【轉】這些年，我收集的JavaScript程式碼(二)

【轉】這些年，我收集的JavaScript程式碼(二) 一、JavaScript跨平臺事件　　對於跨平臺事件我們一般這麼寫(只例舉新增事件)：

[scheduler]八. CFS排程演算法怎麼計算程序(PELT演算法)/cpu/系統利用率的【轉】

轉自：https://blog.csdn.net/wukongmingjing/article/details/82531950?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-4.channel_param&depth_1-utm_source=distribute.p

Elasticsearch 之基礎介紹及索引原理分析【轉】

基本概念 Elasticsearch是面向文件型資料庫，一條資料就是一個文件，用JSO作為文件序列化的格式，比如下面的使用者資料。

F2FS檔案系統一設計背景及框架結構【轉】

轉自：https://blog.csdn.net/frank_zyp/article/details/96426334 一、F2FS檔案系統簡介１、背景：

【轉】PHP程序及程序間通訊

轉，原文：https://www.cnblogs.com/qixidi/p/10414689.html ----------------- 一、引言程序是一個具有獨立功能的程式關於某個資料集合的一次執行活動。換句話說就是，在系統排程多個cpu的時候，一個程式的基本單元

【轉】EM演算法MATLAB程式碼及詳細註解

【轉】EM演算法MATLAB程式碼及詳細註解

覺得有用的話,歡迎一起討論相互學習~

相關推薦