實驗12-SPSS-聚類分析-公司員工績效評估
阿新 • • 發佈:2019-01-18
交叉表 pan get 初步 分享圖片 一定的 發生 用戶 針對 SPSS-聚類分析介紹 聚類分析,就是按照個體的特征將他們分類,目的在於讓同一個類別內的個體之間具有較高的相似度,而不同類別之間具有較大的差異性。 我們可以對變量進行聚類,但是更常見的還是對個體進行聚類,也就是樣本聚類。
例如對用戶、渠道、商品、員工等方面的聚類,聚類分析主要應用在市場細分、用戶細分等領域。
常用指標:距離和相似度。
聚類分析時,將“距離”較小的 點或“相似系數”較大的點歸為同一類。
1.聚類分析總結起來共有四步:
(1)確定需要參與聚類分析的變量
(2)對數據進行 標準化處理
(3)選擇聚類方法和類別個數
(4)聚類分析結果解讀
常用的聚類方法主要包括:
(1)快速聚類(K-Means Cluster):也稱為K均值聚類;它是按照一定的方法選取一批聚類中心點,讓個案向最近的聚類中心點聚集形成初始分類,然後按照最近距離原則調整不合理的分類, 直到分類合理為止。
(2)系統聚類(Hierarchical Cluster):也成層次聚類,首先將參與聚類的個案各視為一類,然後根據兩個類別之間的距離或者相似性逐步合並,直到所有個案合並為一個大類為止。
(3)二階聚類(TwoStep Cluster):
也稱兩步聚類,它是 隨著人工智能的發展而發展起來的一種智能聚類方法。整個聚類過程
分為兩步:
第一步驟是預聚類,就是根據定義的最大類別數對個案進行初步歸類;
第二步驟是正式聚類,就是對第一步中得到的初步歸類進行再聚類並確定最終聚類結果,並且在這一步中,會根據一定的統計標準確定聚類的類別數。
2. 快速聚類分析
我們用的案例數據是某公司員工相關信息及其績效評估得分。該得分由三個指標組成,分別是溝通能力、業務能力和領導能力, 如圖10-3所示。通過對這三個指標的聚類分析,將員工進行分類,從而對他們的發展方向進行合理的規劃。 圖 2-1 聚類分析數據示例2.1 實驗步驟:在SPSS中【分析】-【K-均值聚類】 圖 2-2 【K均值聚類分析】對話框3.快速聚類分析結果通過實驗步驟,在SPSS中的輸出結果如下:
圖 3-1 快速聚類分析結果 如圖 3-1所示,第一個輸出結果是“初始聚類中心”。該初始聚類中心是隨機選擇3個數據,作為快速聚類的初始位置。 從圖上可知,選了員工ID為“1001”、“1012”、“1042”三人作為快速聚類的初始位置。 第二個輸出結果是“叠代歷史記錄”。如上圖,該結果顯示了本次快速聚類分析一共叠代的次數。叠代的過程可以理解為每個類別與初始位置之間的距離改變情況,當這個距離變動非常小的時候,叠代就完成了。由圖可知,一共進行了4次叠代,初始位置之間的最小距離為82.158. 圖3-2 快速聚類分析輸出結果 第三個輸出結果是“最終聚類中心”,如圖3-2。該最終聚類中心和初始聚類中心相比,在數值上發生了變化,說明通過叠代的計算過程,每個類別的位置都發生了偏移。 第四個輸出結果是“每個聚類中的個案數目”,該結果顯示了每個類別中所包含的數據量。類別1中包含了12名員工,類別2包含了28名員工,類別3包含了19名員工。
4.聚類分析員工分類 在快速聚類完成後,如 圖 4-1,數據文件生成了一個名為“QCL_1”的變量,其中變量值表示每個個案所屬的類別。我們就這個分類結果和參與聚類分析的變量制作交叉表,計算各個類別員工在溝通、業務、領導三方面能力各自的平均值,以便了解每一類別員工的特征。 圖 4-1 生成分類變量的數據文件 根據“溝通能力得分”、“業務能力得分”、“領導能力得分”,這三個變量對1/2/3類別的員工進行得分分析,計算各自的平均值。 圖 4-2 快速聚類結果交叉表從交叉表可知: (1)類別1的員工在各績效評估指標的平均得分都較低,可認為是“工作表現較弱”的組成。 (2)類別2的員工在各績效評估指標的平均得分是最高的,可以認為是“工作表現較強”的組別; (3)類別3的員工在各績效評估指標的平均值得分處於中間水平,則認為是“工作表現中等”的組別。 我們就可以根據這三個類別的情況,有針對性的制定員工未來的工作發展方向和相應的激勵政策。
來自為知筆記(Wiz)
例如對用戶、渠道、商品、員工等方面的聚類,聚類分析主要應用在市場細分、用戶細分等領域。
常用指標:距離和相似度。
聚類分析時,將“距離”較小的 點或“相似系數”較大的點歸為同一類。
1.聚類分析總結起來共有四步:
(1)確定需要參與聚類分析的變量
(2)對數據進行 標準化處理
(3)選擇聚類方法和類別個數
(4)聚類分析結果解讀
常用的聚類方法主要包括:
(1)快速聚類(K-Means Cluster):也稱為K均值聚類;它是按照一定的方法選取一批聚類中心點,讓個案向最近的聚類中心點聚集形成初始分類,然後按照最近距離原則調整不合理的分類,
(2)系統聚類(Hierarchical Cluster):也成層次聚類,首先將參與聚類的個案各視為一類,然後根據兩個類別之間的距離或者相似性逐步合並,直到所有個案合並為一個大類為止。
(3)二階聚類(TwoStep Cluster):
也稱兩步聚類,它是 隨著人工智能的發展而發展起來的一種智能聚類方法。整個聚類過程
分為兩步:
第一步驟是預聚類,就是根據定義的最大類別數對個案進行初步歸類;
第二步驟是正式聚類,就是對第一步中得到的初步歸類進行再聚類並確定最終聚類結果,並且在這一步中,會根據一定的統計標準確定聚類的類別數。
2. 快速聚類分析
我們用的案例數據是某公司員工相關信息及其績效評估得分。該得分由三個指標組成,分別是溝通能力、業務能力和領導能力,
圖 3-1 快速聚類分析結果
4.聚類分析員工分類 在快速聚類完成後,如 圖 4-1,數據文件生成了一個名為“QCL_1”的變量,其中變量值表示每個個案所屬的類別。我們就這個分類結果和參與聚類分析的變量制作交叉表,計算各個類別員工在溝通、業務、領導三方面能力各自的平均值,以便了解每一類別員工的特征。 圖 4-1 生成分類變量的數據文件 根據“溝通能力得分”、“業務能力得分”、“領導能力得分”,這三個變量對1/2/3類別的員工進行得分分析,計算各自的平均值。 圖 4-2 快速聚類結果交叉表從交叉表可知: (1)類別1的員工在各績效評估指標的平均得分都較低,可認為是“工作表現較弱”的組成。 (2)類別2的員工在各績效評估指標的平均得分是最高的,可以認為是“工作表現較強”的組別; (3)類別3的員工在各績效評估指標的平均值得分處於中間水平,則認為是“工作表現中等”的組別。 我們就可以根據這三個類別的情況,有針對性的制定員工未來的工作發展方向和相應的激勵政策。
來自為知筆記(Wiz)
實驗12-SPSS-聚類分析-公司員工績效評估