譜聚類演算法詳解

譜聚類（Spectral Clustering）演算法簡單易行，其聚類效能優於傳統的K-means演算法。譜聚類將資料的劃分轉化為對圖的分割，是一種基於圖論的聚類方法，其直觀理解為根據圖內點的相似度將圖分為多個子圖，使子圖內部的點相似度最高，子圖之間點的相似度最低。

1. 圖論基礎

1.1 圖的表示

記G=(V,E)表示一個無向加權圖，V表示所有頂點的集合V={v1,...,vn}，E表示所有邊的集合，並且任意兩點vi和vj的邊具有非負權值wij≥0。圖的鄰接矩陣為W=(wij)i,j=1,...,n，如果wij=0則表示點vi和vj之間沒有連線。由於G為無向圖，所以其鄰接矩陣具有對稱性，即w

ij=wij。圖中任一點vi的度為di=∑nj=1wij，表示一個點與其他所有點的連線情況，圖的度矩陣D為每個點的度所構成的對角矩陣D=diag{d1,...,dn}。

1.2 相似度圖的構造方法

給定一組資料集V={v1,...,vn}，將其構造為相似度圖的意義在於描述點對之間的區域性近鄰關係。此處介紹三種構造相似度圖的方法。
（1）ε近鄰圖。如果兩點之間的距離小於給定值ε，則連線兩點。ε的值需要根據圖中各點的距離選擇，使與某一點連線的點不會太多，也不會太少。
（2）k近鄰圖。如果點vj是vi的k近鄰點之一，則連線兩點。由於近鄰點的非相互性，按此方法構造的鄰接矩陣不對稱，一種方法是採取“或”的方式，即如果v

j是vi的k近鄰點之一，或vi是vj的k近鄰點之一，則連線兩點；另一種方法是採取“與”的方式，如果vj是vi的k近鄰點之一，並且vi是vj的k近鄰點之一，則連線兩點。
（3）全連線圖。不考慮任何因素，直接將所有的點兩兩相連，由於圖表示點之間的區域性鄰接特性，常用的相似性函式為s(xi,xj)=exp(−∥xi−xj∥22σ2)。

1.3 圖的Laplacian矩陣

這裡我們要講到譜聚類中的關鍵內容——拉普拉斯矩陣，其定義為L=D–W，其中D和W就是上文定義的圖的度矩陣和鄰接矩陣。下面我們給出譜聚類中用到的拉普拉斯矩陣的一些性質。
（1）對任意的向量f∈Rn，有fTLf=

12∑i,j=1nwij(fi−fj)2。
證明：（此處用到了W的對稱性）

fTLf=fTDf−fTWf=∑i=1nf2idi−∑i,j=1n

譜聚類演算法詳解

1. 圖論基礎

1.1 圖的表示

1.2 相似度圖的構造方法

1.3 圖的Laplacian矩陣

譜聚類演算法詳解

K-means聚類演算法詳解

機器學習(25)之K-Means聚類演算法詳解

聚類之詳解FCM演算法原理及應用

譜聚類演算法入門教程（三）—— 求f^TLf的最小值

【無監督學習】5：譜聚類演算法原理介紹

譜聚類演算法講解

譜聚類演算法Matlab快速實現

瞭解 kmeans演算法和譜聚類演算法

聚類——譜聚類演算法以及Python實現

譜聚類演算法及其程式碼（Spectral Clustering）

譜聚類演算法(Spectral Clustering)

譜聚類演算法 matlab

譜聚類演算法(Spectral Clustering)優化與擴充套件

譜聚類演算法

譜聚類演算法及圖分割演算法

譜聚類matlab演算法實現及詳解

DBSCAN詳解（密度聚類演算法開篇）

譜聚類（spectral clustering)及其實現詳解

聚類k-means演算法詳解

譜聚類演算法詳解

1. 圖論基礎

1.1 圖的表示

1.2 相似度圖的構造方法

1.3 圖的Laplacian矩陣

相關推薦