PCA、LDA、Kmeans、SVD/EVD、譜聚類之間的關係
PCA、LDA、Kmeans、SVD/EVD、譜聚類之間的關係
最近在研究譜聚類時,遷移到主成分分析(PCA),發現兩者有著驚人的相似之處,同時還牽扯到Kmeans、SVD,甚至LDA也有相通的地方(雖然LDA是有監督學習),因此在這裡寫一篇總結,描述一下以上各個模型之間的共通性,有助於加深對這一類無監督學習演算法的理解。
PCA與SVD/EVD的關係
首先,從SVD入手:
然後,這是PCA的目標:
因此PCA的實現,既可以對協方差矩陣 做特徵值分解,也可以直接對 做奇異值分解。
Kmeans與SVD/EVD的關係
首先從SVD出發:
然後看Kmeans。Kmeans對誤差的分佈有要求,即要求誤差服從標準正態分佈,因此,Kmeans在處理非標準正態分佈的資料集時,聚類效果會比較差。Kmeans聚類的每一次迭代,是根據現有的 個類中心,樣本根據自身與中心的距離判斷類歸屬,然後計算出每一個類的中心進入下一次迭代。由於Kmeans的核心是基於樣本與類中心的歐式距離,伊霓裳可以將Kmeans聚類的目標理解為:劃分 個類 ,使得各類樣本到各自類中心的歐式距離之和最小。