聚類分析-實現亞洲足球聚類

阿新 • • 發佈：2018-12-26

Description：利用K-Means演算法實現亞洲足球的聚類；

下圖是亞洲15只球隊在2005年-2010年間大型盃賽的戰績：

下圖是0-1規格化後的資料：

Analysis：

1.確定K值及K個初始類簇中心點的選取（詳見Blog底部連結）

設 K = 3，即將這15支球隊分成3個集團；

現抽取日本、巴林、泰國的值作為3個簇的種子，即初始化3個簇的中心為A:{0.3, 0, 0.19}、B:{0.7, 0.76, 0.5}、C:{1, 1, 0.5}；

2.從左到右依次表示各支球隊到當前中心點的歐氏距離，將每支球隊分到離自己最近的簇，以中國為例：

D(中國, A) = sqrt( pow( ( 1 - 0.3 ), 2 ), pow( ( 1 - 0 ), 2 ), pow( ( 1 - 0.19 ), 2 ) ) = 1.59 ;

D(中國, B) = 0.15 ;

D(中國, C) = 0 ;

3.根據歐式距離得第一次聚類結果：

A:日本，韓國，伊朗，沙特；

B:烏茲別克，巴林，朝鮮；

C:中國，伊拉克，卡達，阿聯酋，泰國，越南，阿曼，印尼；

4.根據第一次聚類結果，調整各個簇的中心點：

*A簇的新中心點為：

{ ( 0.3 + 0 + 0.24 + 0.3 ) / 4 = 0.21,

( 0 + 0.15 + 0.76 + 0.76 ) / 4 = 0.4175,

( 0.19 + 0.13 + 0.25 + 0.06 ) / 4 = 0.1575 }

中心點(0.21, 0.4175, 0.1575)；

*B簇的新中心點為{0.7, 0.7333, 0.4167}；

*C簇的新中心點為{1, 0.94, 0.40625}；

5.用調整後的中心點再次進行聚類，得到：

第二次迭代後的結果為：中國C，日本A，韓國A，伊朗A，沙特A，伊拉克C，卡達C，阿聯酋C，烏茲別克B，泰國C，越南C，阿曼C，巴林B，朝鮮B，印尼C；

結果無變化，說明結果已收斂，於是給出最終聚類結果：

亞洲一流：日本，韓國，伊朗，沙特；

亞洲二流：烏茲別克，巴林，朝鮮；

亞洲三流：中國，伊拉克，卡達，阿聯酋，泰國，越南，阿曼，印尼

K值及K個初始類簇中心點的選取:

<a href='http://www.cnblogs.com/kemaswill/archive/2013/01/26/2877434.html'>http://www.cnblogs.com/kemaswill/archive/2013/01/26/2877434.html</a>

聚類分析-實現亞洲足球聚類

Description：利用K-Means演算法實現亞洲足球的聚類；下圖是亞洲15只球隊在2005年-2010年間大型盃賽的戰績：下圖是0-1規格化後的資料： Analysis： 1.確定K值

聚類分析(K-means 層次聚類和基於密度DBSCAN演算法三種實現方式)

之前也做過聚類，只不過是用經典資料集，這次是拿的實際資料跑的結果，效果還可以，記錄一下實驗過程。首先：確保自己資料集是否都完整，不能有空值，最好也不要出現為0的值，會影響聚類的效果。其次：想好要用什麼演算法去做，K-means，層次聚類還是基於密

數學模型：3.非監督學習--聚類分析和K-means聚類

rand tar 聚類分析復制 clust tle 降維算法 generator pro 1. 聚類分析聚類分析（cluster analysis）是一組將研究對象分為相對同質的群組（clusters）的統計分析技術 ---->> 將觀測對象的群體按照

聚類分析之迭代聚類——“K-Means聚類…

魯棒是Robust,英 [rə(ʊ)'bʌst]的音譯，也就是健壯、強壯、堅定、粗野的意思。魯棒性(robustness)就是系統的健壯性。常使用如：演算法的魯棒性。演算法雜貨鋪轉載學習演算法雜貨鋪——分類演算法之決策樹(Decision tree) 聚類演算法實踐（一）——層次聚類、K-

SPSS聚類分析——一個案例演示聚類分析全過程

案例資料來源：有20種12盎司啤酒成分和價格的資料，變數包括啤酒名稱、熱量、鈉含量、酒精含量、價格。資料來自《SPSS for Windows 統計分析》data11-03。點選下載【一】問題一：選擇那些變數進行聚類？——採用“R型聚類” 1、現在我們有4個變數用來對啤酒分類，是否有必要

SPSS聚類分析——一個案例演示聚類分…

本文實際為2010年5月8日完成併發布的，瀏覽量：7199，評論數：5。案例資料來源：有20種12盎司啤酒成分和價格的資料，變數包括啤酒名稱、熱量、鈉含量、酒精含量、價格。資料來自《SPSS for Windows 統計分析》data11-03。點選下載【一】問題一：選擇那些變數進行聚類？——

JAVA常量類的實現方式_列舉類＿專案實踐

前言眾所周知，系統裡有很多比如訂單狀態、稽核狀態；性別、結算方式、交易型別等屬性，這些屬性只有幾個值，一般用0、1、2、3等的數字標識存入資料庫，每次對這些屬性所屬物件的增刪改操作，都會在程式碼裡給狀態設定值，由於專案是多人開發的，如果每次設定值的時候都直接set 0

一個類繼承實現介面的抽象類是否要重寫其方法

當A類想要實現一個介面中個別方法是（不是所有方法），可以建立一個抽象類去實現該介面，然後在有A類去繼承這個抽象類。注意：這個抽象類必須重寫這個介面的所有方法，A類才可以實現其中的個別方法；如果抽象類沒有實現介面中的所有有方法（不用寫方法體），那麼A類繼承抽象類後就必須重寫抽象

聚類分析及R程式設計實現

目錄什麼是聚類分析聚類分析法的型別聚類統計量系統聚類法 R語言實現最短距離法最長距離法中間距離法類平均法重心法 ward法什麼是聚類分析聚類分析法-cluster ana

Python+pandas實現簡單聚類分析

Python+pandas實現簡單聚類分析應用百度百科對聚類分析的解釋：聚類分析指將物理或抽象物件的集合分組為由類似的物件組成的多個類的分析過程。它是一種重要的人類行為。聚類分析的目標就是在相似的基礎上收集資料來分類。聚類源於很多領域，包括數學，電腦科學，統計學，生物學和

基於.NET實現資料探勘--聚類分析演算法

http://www.cnblogs.com/captain_ccc/articles/4093615.html 本篇文章主要採用另外一種分析演算法對目標顧客群體的挖掘，同樣的利用微軟案例資料進行簡要總結。應用場景介紹通過上一篇中我們採用Microsoft決策

Java實現k_means演算法進行聚類分析

實驗描述: 對指定資料集進行聚類分析，選擇適當的聚類演算法，編寫程式實現，提交程式和結果報告。資料集： Iris Data Set（見附件一），根據花的屬性進行聚類。資料包括四個屬性：sepal length花萼長度，sepal width花萼寬度，petal len

K-means聚類分析與python實現

K-means演算法是很典型的基於距離的聚類演算法，採用距離作為相似性的評價指標，即認為兩個物件的距離越近，其相似度就越大。該演算法認為簇是由距離靠近的物件組成的，因此把得到緊湊且獨立的簇作為最終目標。演算法原理：首先從n個數據物件任意選擇 k 個物件

聚類分析——層次聚類

logs 較高的 bsp 分析類對象定義 .com blog image 聚類的定義：聚類分析將分類對象分成若幹類，相似的歸為同一類，不相似的歸為不同的類，在同一類內對象之間具有較高的相似度，不同類之間的對象差別較大。層次聚類法：聚類分析——層次聚類

聚類分析方法

實際應用多少三種輸入 k-means 情況度量分析方法差異一、層次聚類（系統聚類）原理：合並法（分解法方向相反算法相同，SPSS只提供合並法） 1、將每一個樣本作為一類，如果是k個樣本就分k成類 2、按照某種方法度量樣本之間的距離，並將距離最近的兩個樣本合並

python實現一個層次聚類方法

mac ima 優先隊列 () don 標簽中位數 filepath normal 層次聚類(Hierarchical Clustering) 一.概念　　層次聚類不需要指定聚類的數目，首先它是將數據中的每個實例看作一個類，然後將最相似的兩個類合並，該過程叠代計算只到剩

聚類分析之譜聚類

空間聚類 family 數據集 .cn 存在聚類算法 array 全局最優傳統聚類根據給定的樣本數據集定義一個描述成對數據點相似度的親合矩陣,並且計算矩陣的特征值和特征向量，然後選擇合適的特征向量聚類不同的數據點。譜聚類可以在任意形狀的樣本空間聚類，且

聚類分析

class 其中應對其它聚類 eric arch del 兩種什麽是聚類分析？聚類算法有哪幾種？請選擇一種詳細描述其計算原理和步驟。聚類分析(clusteranalysis)是一組將研究對象分為相對同質的群組(clusters)的統計分析技術。聚類分析也叫分類分

通過IDEA及hadoop平臺實現k-means聚類算法

綜合 tle tostring html map apache cnblogs cos textfile 有段時間沒有操作過，發現自己忘記一些步驟了，這篇文章會記錄相關步驟，並隨時進行補充修改。 1 基礎步驟，即相關環境部署及數據準備數據文件類型為.csv文件，excel

Python聚類分析作業代寫代做、人工智能Python作業代寫

data nal clas 決心 learn 前臺數值算法課程一個分析要求： 1. 對所給463條評語進行分詞聚類，分析其所反映的活動類型以下是人工分析得出的主要活動類型的參考舉例： 2. 按年份統計各種活動類型每年所提及的頻次比如：親子閱覽，這一活動在13

聚類分析-實現亞洲足球聚類

相關推薦