資料學習(10)·最大期望演算法·因子分析模型(下)

作者課堂筆記摘錄，有問題請聯絡 [email protected]

1 因子分析（Factor Analysis）

內容參考 http://blog.csdn.net/stdcoutzyx/article/details/37559995
高斯混合模型，當訓練資料樣本數目小於樣本維度的時候，因為協方差矩陣的非奇異性，導致不能得到概率密度函式問題，對於其他模型來說，樣本數小於樣本維度，也容易引發過擬合的問題。
解決辦法：加強模型假設，比如對協方差矩陣的限制。第二個就是降低模型的複雜度，提出一個更少引數模型，如因子分析。
限制協方差矩陣的方法：比如假設協方差矩陣為對角矩陣，更強的假設是協方差矩陣為對角且對角線上的值都相等。當需要估計完整協方差矩陣時，樣本數目必須大於樣本維度，但是當有對角假設時，樣本數目大於1就可以估算出限制的協方差矩陣。

高斯分佈矩陣表示：

設有三個變數 $x_{1} \in R^{r}, x$

2 ∈ R s , x ∈ R r

+ s x_1\in R^r,x_2\in R^s,x\in R^{r+s}

x_{1} \in R^{r}, x_{2} \in R^{s}, x \in R^{r + s}

x=\begin{bmatrix}x_1\\x_2\end{bmatrix}

假設

x\sim \N(\mu,\Sigma)

,所以:

\mu=\begin{bmatrix}\mu_1\\\mu_2\end{bmatrix},\quad \Sigma=\begin{bmatrix}\Sigma_{11}&amp;\Sigma_{12}\\\Sigma_{21}&amp;\Sigma_{22}\end{bmatrix}

其中

x_1

的邊際分佈可以得到：

E[x_1]=\mu_1,\quad Cov(x_1)=E[(x_1-\mu_1)(x_1-\mu_1)^T]=\Sigma_{11}

所以對x我們可以得到：

Cov(x)=\Sigma=\begin{bmatrix}\Sigma_{11}&amp;\Sigma_{12}\\\Sigma_{21}&amp;\Sigma_{22}\end{bmatrix}=E[(x-\mu)(x-\mu)^T]

...=E[\begin{bmatrix}x_1-\mu_1\\x_2-\mu_2\end{bmatrix}\begin{bmatrix}x_1-\mu_1\\x_2-\mu_2\end{bmatrix}^T]=E\begin{bmatrix}(x_1-\mu_1)(x_1-\mu_1)^T&amp;(x_1-\mu_1)(x_2-\mu_2)^T\\(x_2-\mu_2)(x_1-\mu_1)^T&amp;(x_2-\mu_2)(x_2-\mu_2)^T\end{bmatrix}

資料學習(10)·最大期望演算法·因子分析模型(下)

1 因子分析（Factor Analysis）

高斯分佈矩陣表示：

資料學習(10)·最大期望演算法·因子分析模型(下)

資料學習(9)·最大期望演算法·混合高斯模型(上)

機器學習之最大期望(EM)演算法

資料探勘十大演算法----EM演算法（最大期望演算法）

EM最大期望演算法與jensen不等式

MLE極大似然估計和EM最大期望演算法

2018.11.14——最大期望（EM）演算法

大資料學習——過濾及推薦常用演算法簡介

機器學習之最大似然演算法

EM（期望最大）演算法詳解(上)

資料探勘十大經典演算法之K最近鄰演算法

大資料學習[10]:Kafka新手入門

EM（最大期望）演算法推導、GMM的應用與程式碼實現

project euler之最大的素因子

1.10 最大值減去最小值小於或等於num的子陣列數量

1.10 最大值減去最小值小於或等於num的子數組數量

逆向最大匹配演算法之python實現

正向最大匹配演算法實現之python實現

網路流 - 最大流演算法之EK

【模式識別與機器學習】——最大似然估計（MLE）最大後驗概率（MAP）

資料學習(10)·最大期望演算法·因子分析模型(下)

1 因子分析（Factor Analysis）

高斯分佈矩陣表示：

相關推薦