代做機器學習&&資料探勘方向本科畢業設計、期刊小論文。
本篇博文主要講解一下模糊聚類的相關內容。
在講解模糊聚類之前,先把模糊數學中幾個我們主要用到的公式講一下。
(1)模糊矩陣的交,並,餘,轉置操作
(2)模糊矩陣的乘法。
對於模糊矩陣的乘法,可能有點不明白。看下圖就差不多明白了。
第一行X第一列:0.7X0.9最大,取較小的0.7
第一行X第二列:0.3X0.9最大,取較小的0.3
(3)模糊矩陣的傳遞閉包:
模糊數學中的詳細內容,如果有興趣的話,可以自行百度瞭解。接下來說一下模糊聚類了。
模糊聚類分析
模糊識別又稱為模糊分類。從處理問題的角度來看,模糊識別可以分為有監督的分類和無監督的分類兩種型別。
在模糊理論中,一個元素與一個集合的關係不再是簡單的屬於或者不屬於關係。
如圖所示,一個元素與集合的關係:屬於,不屬於,部分屬於。因此在模糊理論中引入的隸屬函式跟經典數學中的隸屬函式有所不同。
經典數學中的隸屬函式值域為{0,1},而在模糊數學中的隸屬函式值域則根據隸屬程度在[0,1]。
舉個簡單的例子說明一下:
根據年齡可以將人分為兒童,青年,中年,老年。一個人2歲,可以認為是兒童,但是如果一個人是30歲,那他屬於青年或者中年的的界限就有點模糊了。我們可以認為0.7的概率屬於青年,0.3的概率屬於中年。這個例子就是說明一下,跟以前的硬聚類不一樣,模糊聚類屬於軟聚類,它允許一個物件屬於多個簇。
具體演算法如下:
(1)建立資料矩陣。
(2)資料標準化。
因為在實際的問題中,不同的資料可能有不同的量綱,為了能夠比較,通常進行資料規格化。常用的方法有標準差標準法,極差正規化,最大值規格化。
(3)建立模糊相似關係矩陣。
求出x(i)與x(j)的相似關係矩陣,常用的方法有相似係數法,距離法,貼近度法,餘弦法。
(4)聚類
下面以一個例子說明一下:有五個感測器,每個感測器有四個特徵,對感測器進行聚類分析
那麼此時五個感測器屬於五個類別。
此時可以分為四個簇:第二個感測器與第四個感測器在一個簇中。
以此類推。
總結之:模糊聚類與之前的硬聚類有了很大的不同,允許一個物件按照不同的概率屬於不同的簇。下一篇博文將學習一下具體的模糊聚類演算法。