1. 程式人生 > >機器學習系列:(六)K-Means聚類

機器學習系列:(六)K-Means聚類

本章,我們介紹了我們的第一個無監督學習方法:聚類。聚類是用來探索無標籤資料的結構的。我們介紹了K-Means聚類演算法,重複將樣本分配的類裡面,不斷的更新類的重心位置。雖然K-Means是無監督學習方法,其效果依然是可以度量的;用畸變程度和輪廓係數可以評估聚類效果。我們用K-Means研究了兩個問題。第一個問是影象量化,一種用單一顏色表示一組相似顏色的影象壓縮技術。我們還用K-Means研究了半監督影象分類問題的特徵。

下一章,我們將介紹另一種無監督學習任務——降維(dimensionality reduction)。和我們前面介紹過的半監督貓和狗影象分類問題類似,降維演算法可以在儘量保留資訊完整性的同時,降低解釋變數集合的維度。