1. 程式人生 > >模糊聚類分析

模糊聚類分析

感覺 PPT 有點亂,這裡整理一下。

文章目錄

基於模糊等價矩陣的聚類分析方法

主要步驟有三個:

  1. 建立模糊矩陣
  2. 建立模糊等價矩陣
  3. 聚類(求動態聚類圖)

下面將分別介紹

建立模糊矩陣

U

= u 1 , u 2 ,
, u n
U ={u_1, u_2, …, u_n} 為待分類的全體物件,其中每個待分類物件由一組資料表徵如下:
u i = u_i = { x i 1 , x i 2 , . . . , x i m x_{i1},x_{i2}, ..., x_{im} }
問題轉化為:如何建立物件 u i u j u_i 與 u_j 之間的相似關係,其中 i , j [ 1 , n ] i, j \in [1, n]

建立模糊相似矩陣

建立模糊相似矩陣的注意事項:

  • r i j [ 0 , 1 ] r_{ij} \in [0, 1]
  • 自反
  • 對稱

主要過程如下

資料預處理——資料標準化

設論域 U ={x1, x2, …, xn } 為待聚類物件,每個物件由 m 個指標表示其性狀:
x i = x_i= { x i 1 , x i 2 , . . . , x i m x_{i1},x_{i2}, ..., x_{im} }
將原始資料矩陣中的元素通過適當的變換壓縮到 [0, 1] 上。

有如下兩種常用的方法

平移-極差變換(變換至0-1區間)

在這裡插入圖片描述

平移-標準差變換(消除量綱)

值得一提的是,這種方法不一定會把原始資料矩陣中的元素壓縮到 [0, 1] 上
在這裡插入圖片描述

模糊相似矩陣的建立

相似係數法

數量積法

在這裡插入圖片描述

其中M為一適當選擇的正數,滿足
在這裡插入圖片描述

此時, r i j [ 1 , 1 ] r_{ij} \in [-1, 1] ,若存在 r i j < 0 r_{ij} < 0 ,令所有 r i j = ( 1 + r i j ) / 2 r_{ij}'=(1+r_{ij})/2 使得 r i j [ 0 , 1 ] r_{ij}' \in [0, 1]

夾角餘弦法

在這裡插入圖片描述

相關係數法

在這裡插入圖片描述

指數相似係數法

在這裡插入圖片描述指數相似係數法中一行表示一個樣本的多個屬性。

最大最小法

在這裡插入圖片描述

算數平均最小法

在這裡插入圖片描述

幾何平均最小法

在這裡插入圖片描述
上述三種方法要求 xij>0,否則也要作適當變換。

距離法

絕對值倒數法

在這裡插入圖片描述

絕對值減數法

在這裡插入圖片描述

絕對值指數法

在這裡插入圖片描述

直接距離法

r i j 1 c d ( x i , x j ) r_{ij}=1-c*d(x_i, x_j)
海明距離
在這裡插入圖片描述
歐式距離
在這裡插入圖片描述
切比雪夫距離
在這裡插入圖片描述

主觀評分法

專家直接給出相似度,專家數為 N,r_{ij}(k)表示第 k 個專家給出的 i 與 j 的相似度, a i j ( k ) a_{ij}(k) 為專家的自信度。
在這裡插入圖片描述

建立模糊等價矩陣

相似關係->等價關係

一般採用平方法來求傳遞閉包,也就是模糊等價矩陣

計算次數如下:
模糊相似矩陣 5×5
k = [log25]+1=2+1=3
最壞情況下, R > R 2 > R 4 > R 8 R 8 R -> R^2 -> R^4 -> R^8,計算到 R^8

聚類(求動態聚類圖)

對傳遞閉包依次取截關係

直接基於模糊相似矩陣聚類

建立模糊相似矩陣 R 後,求其傳遞閉包 t® 計算量較大。
若直接從 R 出發,進行聚類,會怎麼樣?