1. 程式人生 > >K-Means演算法更多的討論與想法

K-Means演算法更多的討論與想法

k-均值演算法的一個重要的侷限性即在於它的聚類模型。這一模型的中心思想是:得到相互分離的球狀聚類,在這些聚類中,均值點趨向收斂於聚類中心。 K-Means聚類得到的分類結果默認了資料關於其類別之間的差異性是隨著其歐氏距離的增大而增大的K-Means聚類無法得到一個差異性與歐氏距離非線性增大的分類結果。 對於這個缺陷,我們可以用預先提取特徵,使得特徵的分佈是球狀分佈,然後再進行K-Means嗎? 那麼問題就會變成,如何將無Label的資料提取出球狀分佈的特徵呢?