第八次作業-----#聚類--K均值演算法：自主實現與sklearn.cluster.KMeans呼叫

阿新 • • 發佈：2018-11-06

1. 用python實現K均值演算法

K-means是一個反覆迭代的過程，演算法分為四個步驟：

（x,k,y)

1）選取資料空間中的K個物件作為初始中心，每個物件代表一個聚類中心；

def initcenter(x, k): kc

2）對於樣本中的資料物件，根據它們與這些聚類中心的歐氏距離，按距離最近的準則將它們分到距離它們最近的聚類中心（最相似）所對應的類；

def nearest(kc, x[i]): j

def xclassify(x, y, kc):y[i]=j

3）更新聚類中心：將每個類別中所有物件所對應的均值作為該類別的聚類中心，計算目標函式的值；

def kcmean(x, y, kc, k):

4）判斷聚類中心和目標函式的值是否發生改變，若不變，則輸出結果，若改變，則返回2）。

while flag:

  y = xclassify(x, y, kc)

  kc, flag = kcmean(x, y, kc, k)

2. 鳶尾花花瓣長度資料做聚類並用散點圖顯示。

3. 用sklearn.cluster.KMeans，鳶尾花花瓣長度資料做聚類並用散點圖顯示.

4. 鳶尾花完整資料做聚類並用散點圖顯示.

參考官方文件: http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html#sklearn.cluster.KMeans

1.初始化

from sklearn.datasets import  load_iris
iris = load_iris()
iris.keys()

data = iris['data']
data

2.分類

iris.target

3.初始聚類中心陣列

def initcenter(x,k):
    return x[:k]

4.陣列中的值，與聚類中心最新距離所在類別的索引號

def nearest(kc,i):
        d = (abs(kc - i))
    w = np.where(d == np.min(d))
    return w[0][0]

5.對陣列的每個組分類

def xclassify(x,y,kc):
    for i in range(x.shape[0]):
        y[i]=nearest(kc,x[i])
    return y

6.更新聚類中心，將每個類別中所有物件所對應的均值作為該類別的聚類中心，計算目標函式的值

def kcmean(x,y,kc,k):
    l = list(kc)
    flag = False
    for c in range(k):
        m = np.where(y == c)
        print(c,x)
        n = np.mean(x[m])
        print(kc[c],n)
        if l[c] != n:
            l[c] = n
        flag = True
        print(l,flag)
    return(np.array(l),flag)

7.判斷聚類中心和目標函式的值是否發生改變，若不變，則輸出結果，若改變，則返回2

flag = True
# print(x,y,kc,flag)
while flag:
    y = xclassify(x,y,kc)
    kc,flag = kcmean(x,y,kc,k)
    print(y,kc)
print(x,y)

flag=True

8.初始化iris

from sklearn.datasets import load_iris
iris = load_iris()
datas = iris.data
iris_length = datas[:,2]

9.用鳶尾花花瓣作分析並用散點圖顯示

import matplotlib.pyplot as plt
import numpy as np
data=load_iris()
data_length=data['data'][:,2] # 取出鳶尾花花瓣的長度
x=data_length
y=np.zeros(x.shape[0])
kc = start_center(x,3)
flag=True
while flag:
    y=xclassify(x,y,kc)
    kc,flag=kcmean(x,y,kc,k)
print(y,kc)

10.用散點圖來展示 plt.scatter(x,x,s=x,c=y,cmap='rainbow',alpha=0.5,linewidths=4) plt.show() sandiantu

第八次作業--聚類--K均值演算法：自主實現與sklearn.cluster.KMeans呼叫

import numpy as np x = np.random.randint(1,100,[20,1]) y = np.zeros(20) k = 3 x def initcenter(x, k):#初始聚類中心陣列 return x[:k] kc = initcenter

第八次作業-----#聚類--K均值演算法：自主實現與sklearn.cluster.KMeans呼叫

1. 用python實現K均值演算法 K-means是一個反覆迭代的過程，演算法分為四個步驟：（x,k,y) 1）選取資料空間中的K個物件作為初始中心，每個物件代表一個聚類中心； def initcenter(x, k): kc 2）對於樣本中的資料物件，根據它們與這些聚類中心的歐氏距離，按距

第八次作業：聚類--K均值算法：自主實現與sklearn.cluster.KMeans調用

ans 運行 port 輸出結果 info 對數 num 函數 () import numpy as np x = np.random.randint(1,100,[20,1]) y = np.zeros(20) k = 3 def initcenter(x,k):

聚類--K均值算法：自主實現與sklearn.cluster.KMeans調用

return 判斷 flag space image from .data cluster 改變 1.K-means是一個反復叠代的過程，算法分為四個步驟：（1）選取數據空間中的K個對象作為初始中心，每個對象代表一個聚類中心；（2）對於樣本中的數據對象，根據它們與這些聚

老男孩python第八次作業

切換允許一致性斷點續傳進行文件傳輸 server 傳輸上傳作業要求：開發一個支持多用戶在線的FTP程序要求： 1.用戶加密認證 2.允許同時多用戶登陸 3.每個用戶都有自己的家目錄，並且只能訪問自己的

軟件工程第八次作業 - 每周例行匯報

blog 代碼軟件工程 ble img nbsp order 本周技術分享本周PSP 本周進度條博文字數 1648字代碼行數 0行累計進度條本周PSP餅狀圖軟件工程第八次作業

軟件工程第八次作業——例行報告

image nbsp ava 程序軟件工程 img log 音頻 images 用到的知識點：java程序中插入音頻軟件工程第八次作業——例行報告

第八次作業

images brush es2017 his nbsp light ati col length class Person{ private String name; private static int count; public Person

Ex 5_32 一臺服務器當前有n個等待服務的顧客...第八次作業

stub pac 時間 nbsp void 等待時間 method 作業 out 設第i個客戶需要等待的時間為ti，則n個客戶需要總的等待時間為 ,因此，要使T最小，則要使即可，所以，對所有的ti按升序進行排序和服務將得到最小的等待時間。 1 packag

oo第八次作業--5,6,7次作業總結

nbsp 時間要求 thread線程 and 可維護需要 HR 嘗試一、多線程的設計　　這三次作業的主要內容就是使用多線程並且解決多線程中出現的問題。而對於多線程我也有了自己的理解。首先明確的一點是單個CPU在同一時間只能處理一件事。那麽，不管是多進程還是多線程，我

OO第八次作業

類圖模塊變化有時租車 iss 功能 hang 以及 OO第八次作業唉這OO我可想好好說兩句嘍。這三次作業可以說難度相較之前大為提高，感覺一下子從普通副本踏入了精英副本區，多線程是該區boss的共性特質，這無疑給我們這些從未接觸過多線程的編程者大大提高了難度。拋去線

第八次作業（團隊）——需求規格說明書

ica 命名安全不同的應用層次產生叠代開發朋友 caf 真德秀團隊成員：　　WoLykos（3005）　　　hIrokuh（3023）　　DoraMike（3026）　　　JanzKing（3007）　　JtvDeemo（3044） 1引言 1.1目的

第八次作業之需求規格說明書

好評好想項目管理時間規範 python3 4.2 變化銷毀真德秀團隊成員：　　WoLykos（3005）　　　hIrokuh（3023）　　DoraMike（3026）　　　JanzKing（3007）　　JtvDeemo（3044） 1引言 1.1目

第八次作業——系統設計和任務分配

url 後臺些許 tee title targe 碼雲 tle 以及項目進展和總結一、團隊作業地址：http://www.yzhiliao.com/course/64/task/443/show 二、碼雲地址 1.碼雲地址：https://gitee.com/zj

0711 第八次作業

info 區別 his println http tro 圖片調用 class 一、面向對象 1.局部變量和成員變量的區別：（1）在類中的位置不同：　　局部變量：在方法中定義或在方法聲明中定義　　成員變量：在類中方法外定義（2）在內存中的位置不同：　　局部變量：在棧中

福大軟工 · 第八次作業（課堂實戰）——項目UML設計（團隊）

uml 團隊 image 技術分享 .com 分享 img alt jpg 福大軟工 · 第八次作業（課堂實戰）——項目UML設計（團隊）

福大軟工 · 第八次作業（課堂實戰）- 項目UML設計（團隊）

課堂 imp 需求文檔 des 軟工 info post 實戰團隊信息隊名：小白吃隊成員：盧澤明 031602328 蔡文斌 031602301 葛亮 031602617 劉浩 031602423 張揚 031602345 李泓 031602321 何家偉 0

第八次作業——項目UML設計

以及希望 tab 技術分享使用清晰導致流程交互關系分工及貢獻分評定成員參與貢獻比例朱躍安(031602348) 類圖 13% 後敬甲() 實體關系圖+博客整理 14.5% 林誌華() 用例圖+活動圖 14.5% 朱文婧()

軟工1816 · 第八次作業（課堂實戰）- 項目UML設計（團隊）

planning 版本 and 網絡調度 mea 分配管理軟件本次作業博客團隊信息隊名：起床一起肝活隊原組長：白晨曦(101) 原組員：李麒 (123) 陳德斌(104) 何裕捷(214) 黃培鑫(217) 王煥仁(233) 林誌華(128) 樂忠豪(

軟工第八次作業

角色 mage 流程 uml 反饋路線 inf 聯系分割團隊成員參與貢獻比例 031602406 程曉宏（臨時組長）實體關系圖設計 11 031602501 蔡宇航實體關系圖設計 8 051501124 王彬類圖設計 8 03

第八次作業-----#聚類--K均值演算法：自主實現與sklearn.cluster.KMeans呼叫

1. 用python實現K均值演算法

2. 鳶尾花花瓣長度資料做聚類並用散點圖顯示。

3. 用sklearn.cluster.KMeans，鳶尾花花瓣長度資料做聚類並用散點圖顯示.

4. 鳶尾花完整資料做聚類並用散點圖顯示.

相關推薦