用python實現K均值演算法

阿新 • • 發佈：2018-11-10

import numpy as np
x = np.random.randint(1,60,[30,1])
y = np.zeros(20)
k = 3

#1選取資料空間中的K個物件作為初始中心，每個物件代表一個聚類中心；
def initcen(x,k):
    return x[:k]

#2對於樣本中的資料物件，根據它們與這些聚類中心的歐氏距離，按距離最近的準則將它們分到距離它們最近的聚類中心（最相似）所對應的類；
def nearest(kc,i):
    d = abs(kc-i)
    w = np.where(d == np.min(d))
    return 
 w[0][0]

def xclassify(x,y,kc):
    for i in range(x.shape[0]):
        y[i] = nearest(kc,x[i])
        return y

#3更新聚類中心：將每個類別中所有物件所對應的均值作為該類別的聚類中心，計算目標函式的值；

def kcmean(x,y,kc,k):
    l = list(kc)
    flag = False
    for c in range(k):
        m = np.where(y ==0)
        n = np.mean(x[m])
         
if l[j] != n:
            l[j] = n
            flag = True
            print(l,flag)
    return (np.array(l),flag)

#4判斷聚類中心和目標函式的值是否發生改變，若不變，則輸出結果，若改變，則返回2）
kc = initcen(x,k)

flag = True
print(x,y,kc,flag)
while flag:
    y = xclassify(x,y,kc)
    kc,flag = kcmean(x,y,kc,k)
print(y,kc)

# 用鳶尾花花瓣作分析
x = np.array(iris_length)
y = np.zeros(x.shape[0])
kc = initcen(x,3)
flag = True
while flag:
    y = xclassify(x,y,kc)
    kc,flag = kcmean(x,y,kc,3)
print(kc,flag)

# 分析鳶尾花花瓣長度的資料，並用散點圖表示出來
import matplotlib.pyplot as plt
plt.scatter(iris_length, iris_length, marker='p', c=y, alpha=0.5, linewidths=4, cmap='Paired')
plt.show()

#4鳶尾花完整資料做聚類並用散點圖顯示.

from sklearn.datasets import load_iris
iris=load_iris()
x=iris.data

from sklearn.cluster import KMeans
eat=KMeans(n_clusters=3)
eat.fit(x)
eat.cluster_centers_
y=eat.predict(x)
y

import matplotlib.pyplot as plt
plt.scatter(x[:,0],x[:,1])
plt.show()

用python實現K均值演算法

import numpy as np x = np.random.randint(1,60,[30,1]) y = np.zeros(20) k = 3 #1選取資料空間中的K個物件作為初始中心，每個物件代表一個聚類中心； def initcen(x,k): return x[:k]

python實現k近鄰演算法

很簡單的一個分類演算法：根據不同特徵值之間的距離方法進行分類優點：輸入高，對異常值不敏感，無資料輸入假定缺點：計算複雜度高，空間複雜度高適用資料範圍：數值型和標稱型程式碼實現： """K近鄰演算法""" """虛擬碼：（1）計算已知資料集的點與

Python實現K近鄰演算法_分類器

收集資料 31,65,4,1 33,58,10,1 33,60,0,1 34,59,0,2 34,66,9,2 這是關於乳腺癌已手術患者存活時間(壽命)的樣本集，文字檔案中共包含306個樣本，樣本包含的屬性有： 1. 患者做手術時的年齡 opAge

Python實現k-means演算法

這也是周志華《機器學習》的習題9.4。資料集是西瓜資料集4.0，如下編號,密度,含糖率 1,0.697,0.46 2,0.774,0.376 3,0.634,0.264 4,0.608,0.318 5,0.556,0.215 6,0.403,0.23

用Python實現八大排序演算法--直接選擇排序

一、選擇排序概述選擇排序（Selection sort）是一種簡單直觀的排序演算法，它的工作原理是每次從待排序的資料元素中選出最小（或最大）的一個元素，存放在序列的起始位置，知道全部待排序的資料元素排完。演算法基本思想： n個記錄的檔案的直接選擇排序可

Python實現k-近鄰演算法

1、分類器實現 import numpy as np import operator def KNN(inx, dataset, labels, k): '''inx:待測元素;dataset:已知資料集(Numpy格式);labels:已知資料集元素對應的類別

Python基於K-均值、RLS演算法實現RBF神經網路（神經網路與機器學習第五章計算機實驗）

1、生成資料集 class moon_data_class(object): def __init__(self,N,d,r,w): self.N=N self.w=w self.d=d self.r=r

原型聚類（一）k均值演算法和python實現

原型聚類原型聚類演算法假設聚類結構能通過一組原型刻畫，在現實聚類任務中極為常用。通常情形下，演算法先對原型進行初始化，然後對原型進行迭代更新求解。這裡的“原型”我認為實際上就是“原來的模型”，這類演算法企圖模擬出生成資料集的模型。 k均值演算法（k-means

機器學習經典聚類演算法 —— k-均值演算法（附python實現程式碼及資料集）

目錄工作原理 python實現演算法實戰對mnist資料集進行聚類小結附錄工作原理聚類是一種無監督的學習，它將相似

第八次作業--聚類--K均值演算法：自主實現與sklearn.cluster.KMeans呼叫

import numpy as np x = np.random.randint(1,100,[20,1]) y = np.zeros(20) k = 3 x def initcenter(x, k):#初始聚類中心陣列 return x[:k] kc = initcenter

第八次作業-----#聚類--K均值演算法：自主實現與sklearn.cluster.KMeans呼叫

1. 用python實現K均值演算法 K-means是一個反覆迭代的過程，演算法分為四個步驟：（x,k,y) 1）選取資料空間中的K個物件作為初始中心，每個物件代表一個聚類中心； def initcenter(x, k): kc 2）對於樣本中的資料物件，根據它們與這些聚類中心的歐氏距離，按距

指派問題——匈牙利Hungary演算法（用python實現）

注：昨天剛剛看了關於python的關於陣列的簡單操作，就將匈牙利演算法用python實現了以下。其中可能有很多點可以用python中陣列本身屬性實現，但由於初學，所以不熟悉而導致步驟繁瑣的望指出～ 1.匈牙利演算法的簡單例子（1）矩陣所表示的就是從A點到B

Python實現K-Means聚類演算法

宣告：程式碼的執行環境為Python3。Python3與Python2在一些細節上會有所不同，希望廣大讀者注意。本部落格以程式碼為主，程式碼中會有詳細的註釋。相關文章將會發布在我的個人部落格專欄《Python從入門到深度學習》，歡迎大家關注~

資料結構與演算法（2）排序演算法，用Python實現插入，選擇，堆排，冒泡，快排和歸併排序

前段時間鼓起勇氣和老闆說了一下以後想從事機器學習方向的工作，所以最好能有一份不錯的實習，希望如果我有好的機會他可以讓我去，沒想到老闆非常通情達理，說人還是要追尋自己感興趣的東西，忙完這陣你就去吧。所以最

我的K均值演算法的matlab實現

這是我的第一篇部落格； K-Means演算法過程，略；這是一次課程的任務2333，是利用所學K-means聚類分析方法，對iris資料集進行聚類分析，並利用已知的樣本類別標籤進行聚類分析評價；我的K均值演算法以iris.data為例（附在文末）；資料集：I

二分K均值演算法原理及Spark MLlib呼叫例項(Scala/Java/Python)

二分K均值演算法演算法介紹：二分K均值演算法是一種層次聚類演算法，使用自頂向下的逼近：所有的觀察值開始是一個簇，遞迴地向下一個層級分裂。分裂依據為選擇能最大程度降低聚類代價函式（也就是誤差平方和）的簇劃分為兩個簇。以此進行下去，直到簇的數目等於使用者給定的數目k為止。二

Python 3實現k-鄰近演算法以及 iris 資料集分類應用

前言這個周基本在琢磨這個演算法以及自己利用Python3 實現自主程式設計實現該演算法。持續時間比較長，主要是Pyhton可能還不是很熟練，走了很多路，基本是一邊寫一邊學。不過，總算是基本搞出來了。不多說，進入正題。 1. K-鄰近演算法 1.1

機器學習經典演算法詳解及Python實現--K近鄰(KNN)演算法

轉載http://blog.csdn.net/suipingsp/article/details/41964713 （一）KNN依然是一種監督學習演算法 KNN（K Nearest Neighbors,K近鄰）演算法是機器學習所有演算法中理論最簡單，最好理解的。KNN

用python實現的兩種抽獎演算法(概率隨機抽獎、次數隨機演算法)

------------次數隨機演算法---------- #抽獎一次少一個名額 class randomMachine(object): import random as rd def setWeight(self, weight): self.weight

用python實現最長公共子序列演算法(找到所有最長公共子串)

軟體安全的一個小實驗，正好複習一下LCS的寫法。實現LCS的演算法和演算法導論上的方式基本一致，都是先建好兩個表，一個儲存在(i,j)處當前最長公共子序列長度，另一個儲存在(i,j)處的回溯方向。相對於演算法導論的版本，增加了一個多分支回溯，即儲存回溯方向時出現了向上向左都可以的情況時，這時候就代表可能

用python實現K均值演算法

相關推薦