Kmeans聚類與層次聚類

阿新 • • 發佈：2019-01-13

聚類

聚類就是對大量未知標註的資料集，按資料的內在相似性將資料集劃分為多個類別，使類別內的資料相似度較大而類別間的資料相似度較小.

資料聚類演算法可以分為結構性或者分散性,許多聚類演算法在執行之前，需要指定從輸入資料集中產生的分類個數。

1.分散式聚類演算法，是一次性確定要產生的類別，這種演算法也已應用於從下至上聚類演算法。

2.結構性演算法利用以前成功使用過的聚類器進行分類，而分散型演算法則是一次確定所有分類。

結構性演算法可以從上至下或者從下至上雙向進行計算。從下至上演算法從每個物件作為單獨分類開始，不斷融合其中相近的物件。而從上至下演算法則是把所有物件作為一個整體分類，然後逐漸分小。

3.基於密度的聚類演算法，是為了挖掘有任意形狀特性的類別而發明的。此演算法把一個類別視為資料集中大於某閾值的一個區域。DBSCAN和OPTICS是兩個典型的演算法。

相似度/距離計算:

1.歐氏距離相似度

2.Jaccard相似度

3.餘弦相似度

4.Pearson相似度

5.相對熵(K-L距離)

一.分散性聚類(kmeans)

K-均值演算法表示以空間中k個點為中心進行聚類，對最靠近他們的物件歸類。

例如：資料集合為三維，聚類以兩點：X =(x1, x2, x3),Y =(y1, y2, y3)。中心點Z變為Z =(z1, z2, z3)，其中z1 = (x1 + y1)/2，z2 = (x2 + y2)/2，z3 = (x3 + y3)/2。

演算法流程:

1.選擇聚類的個數k.

2.任意產生k個聚類，然後確定聚類中心，或者直接生成k箇中心。

3.對每個點確定其聚類中心點。

4.再計算其聚類新中心。

5.重複以上步驟直到滿足收斂要求。（通常就是確定的中心點不再改變。）

K-means是初值敏感的

優點：

1.是解決聚類問題的一種經典演算法，簡單、快速

2.對處理大資料集，該演算法保持可伸縮性和高效率

3.當結果簇是密集的，它的效果較好

缺點

1.在簇的平均值可被定義的情況下才能使用，可能不適用於某些應用

2.必須事先給出k（要生成的簇的數目），而且對初值敏感，對於不同的初始值，可能會導致不同結果。

3.不適合於發現非凸形狀的簇或者大小差別很大的簇

4.對躁聲和孤立點資料敏感

二.結構性聚類(層次聚類)

層次聚類方法對給定的資料集進行層次的分解，直到某種條件滿足為止。

在已經得到距離值之後，元素間可以被聯絡起來。通過分離和融合可以構建一個結構。傳統上，表示的方法是樹形資料結構，層次聚類演算法，要麼是自底向上聚集型的，即從葉子節點開始，最終匯聚到根節點；要麼是自頂向下分裂型的，即從根節點開始，遞迴的向下分裂。

源資料:

層次聚類:

1.凝聚層次聚類：AGNES演算法(自底向上)

首先將每個物件作為一個簇，然後合併這些原子簇為越來越大的簇，直到某個終結條件被滿足

2.分裂層次聚類：DIANA演算法(自頂向下)

首先將所有物件置於一個簇中，然後逐漸細分為越來越小的簇，直到達到了某個終結條件。

k-means++演算法選擇初始seeds的基本思想就是：初始的聚類中心之間的相互距離要儘可能的遠。

Kmeans聚類與層次聚類

聚類

相似度/距離計算:

一.分散性聚類(kmeans)

二.結構性聚類(層次聚類)

Kmeans聚類與層次聚類

聚類分析（一）：K均值聚類與層次聚類

機器學習總結（十）：常用聚類演算法（Kmeans、密度聚類、層次聚類）及常見問題

模式識別設計（Python程式設計）：IRIS資料集的Kmeans聚類與分解聚類法

聚類分析——層次聚類

聚類：層次聚類、基於劃分的聚類（k-means）、基於密度的聚類、基於模型的聚類

機器學習--聚類系列--層次聚類

聚類模型-層次聚類

聚類分析層次聚類及k-means演算法

密度聚類和層次聚類

聚類系列-層次聚類（Hierarchical Clustering）

機器學習筆記六：K-Means聚類，層次聚類，譜聚類

機器學習sklearn19.0聚類演算法——層次聚類（AGNES/DIANA）、密度聚類(DBSCAN/MDCA)、譜聚類

聚類演算法---層次聚類

5.2、聚類之層次聚類例項

聚類及相關演算法二（原型聚類、密度聚類、層次聚類）

【機器學習】筆記之聚類Cluster—— 層次聚類 Hierarchical clustering

python(七)：元類與抽象基類

資料結構實驗3：C++實現順序棧類與鏈棧類

C++中類與物件，類的定義，類的作用域，類中成員，this指標

Kmeans聚類與層次聚類

聚類

相似度/距離計算:

一.分散性聚類(kmeans)

二.結構性聚類(層次聚類)

相關推薦