機器學習 k-近鄰演算法

阿新 • • 發佈：2018-10-31

1、使用python匯入資料

from numpy import *
def createDataSet():
    group=array([[1.1,1.1],[1.0,1.0],[0,0],[0,0.1]])
    labels=['A','A','B','B']
    return group,labels

kNN分類演算法：

from numpy import *
import operator
def classify0(inX,dataSet,labels,k):
    dataSetSize=dataSet.shape[0]    #shape[0]表示dataSet的行數 

    diffMat=tile(inX,(dataSetSize,1))-dataSet
    sqDiffMat=diffMat**2
    sqDistances=sqDiffMat.sum(axis=1)
    distances=sqDistances**0.5
    sortedDistIndicies=distances.argsort()
    classCount={}
    for i in range(k):
        voteIlabel=labels[sortedDistIndicies[i]]
        classCount[voteIlabel] 
=classCount.get(voteIlabel,0)+1
    sortedClassCount=sorted(classCount.items(),key=operator.itemgetter(1),reverse=True)
    return sortedClassCount[0][0]

distances是1*4的矩陣，分別表示待分類的點與所有已知點的距離；
sortedDistIndicies是distances從小到大的索引值；
voteIlabel相當於臨時變數，用來取得標籤值；

classCount[voteIlabel]=classCount.get(voteIlabel,0)+1  　　如果在字典classCount中找到key=voteIlabel的value,就加1，找不到的話classCount.get(voteIlabel,0) 
返回0然後加1

sortedClassCount=sorted(classCount.items(),key=operator.itemgetter(1),reverse=True)　　先把字典classCount變成列表，再按照第二維降序排列，返回的仍是列表

執行演算法：

import kNN
from classify_kNN import *
g,l=kNN.createDataSet()
result=classify0([0,0],g,l,3)
print(result)

輸出：

items()：將字典中的項按照列表返回，無序：

get()：返回字典對應key的value值，不存在key時返回第二個引數：

dic={'a':1,'b':2,'c':3}
print(dic.items())
print(dic.get('c','no'))
輸出：
dict_items([('b', 2), ('c', 3), ('a', 1)])
3

shape：返回矩陣的維數；

from numpy import *
c=array([[1,1],[2,3,],[5,6]])
print(c)
print(c.shape)
print(c.shape[0])
print(c.shape[1])
輸出：
[[1 1]
 [2 3]
 [5 6]]
(3, 2)
3
2

operator.itemgetter()：返回物件特定維的資料，結合sorted()方法使用：

import operator
students=[['剛田武',20,'gangtw'],['朱二娃',25,'zhuerw'],['咪咪two',30,'miomitwo']]
print(sorted(students,key=operator.itemgetter(1),reverse=True))
輸出：
[['咪咪two', 30, 'miomitwo'], ['朱二娃', 25, 'zhuerw'], ['剛田武', 20, 'gangtw']]

argsort()：返回陣列值從小到大的索引值

機器學習 k-近鄰演算法

1、使用python匯入資料 from numpy import * def createDataSet(): group=array([[1.1,1.1],[1.0,1.0],[0,0],[0,0.1]]) labels=['A','A','B','B'] return gr

機器學習-k-近鄰演算法python實踐【4】

寫在最前面：簡單來說，k-近鄰演算法是用來根據不同的特徵進行分類的一種演算法優點：精度高、對異常值不敏感、無資料輸入假定缺點：計算複雜度高、空間複雜度高適用資料範圍：數值型和標稱型 IDE:Pycharm python版本：3.6 作業系統：macOS Mojave k

機器學習-K近鄰演算法

用例一： from sklearn.neighbors import NearestNeighbors import numpy as np X = np.array([[-1, -1], [-2, -1], [-3, -2], [1, 1], [2, 1], [3, 2]]) nbr

機器學習--k近鄰演算法探索及糖尿病預測

演算法原理：未標記樣本類別由距離其最近的k個鄰居投票決定。計算待標記的樣本和資料集中每個樣本的距離，取距離最近的k個樣本，待標記樣本所屬類別由這k個距離最近的樣本投票產生。優點：KNN原理簡單，容易實現，結果精度高，無需估計引數，無需訓練模型，可用於分類（投票）和迴歸（平

機器學習--k-近鄰演算法（kNN）實現手寫數字識別

這裡的手寫數字以0,1的形式儲存在文字檔案中，大小是32x32.目錄trainingDigits有1934個樣本。0-9每個數字大約有200個樣本，命名規則如下：下劃線前的數字代表是樣本0-9的

機器學習——K-近鄰（KNN）演算法

本文轉載自：https://www.cnblogs.com/ybjourney/p/4702562.html 一 . K-近鄰演算法（KNN）概述最簡單最初級的分類器是將全部的訓練資料所對應的類別都記錄下來，當測試物件的屬性和某個訓練物件的屬性完全匹配時，便可以對其進

python機器學習-k近鄰（KNN）演算法例項

機器學習-k近鄰（KNN）本篇主要是自己複習和總結機器學習演算法中最基礎入門的——k近鄰（KNN）演算法，內容由網上百度與摘抄唐宇迪老師的講義。 k近鄰介紹 ——K最近鄰(k-Nearest Neighbor，KNN)，k近鄰演算法可以應用於分類場景與迴歸場

機器學習——k-近鄰(K-Nearest Neighbor)

文件中導入實戰解析 k-近鄰算法分類內容探討精度目錄 K-Nearest neighbor K-近鄰分類算法從文本文件中解析和導入數據使用python創建擴散圖歸一化數值 K-Nearest neighbor （個人觀點，僅供參考。） k-

機器學習——K-means演算法（聚類演算法）

聚類在說K-means聚類演算法之前必須要先理解聚類和分類的區別。分類其實是從特定的資料中挖掘模式，作出判斷的過程。比如Gmail郵箱裡有垃圾郵件分類器，一開始的時候可能什麼都不過濾，在日常使用過程中，我人工對於每一封郵件點選“垃圾”或“不是垃圾”，過一段時間，Gmail就體現出

機器學習--K-means演算法

概述聚類（K-mean）是一種典型的無監督學習。採用距離作為相似性的評價指標，即認為兩個物件的距離越近，其相似度就越大。該演算法認為類簇是由距離靠近的物件組成的，因此把得到緊湊且獨立的簇作為最終目標。核心思想通過迭代尋找k個類簇的一種劃分方案，使得用這k個類簇的均值來代

機器學習——K-Means演算法

Unsupervised Learning task learning a distribution from sample(GMM/VAE) clustering(PAC) feature learning 按照演算法目的，無監督演算法大體可分為上述三類，

機器學習——k鄰近演算法的資料解析

def file2matrix(filename): #????? fr = open(filename) #?????????? arrayOLines = fr.r

機器學習--K-means演算法（聚類，無監督學習）

一、基本思想聚類屬於無監督學習，以往的迴歸、樸素貝葉斯、SVM等都是有類別標籤y的，也就是說樣例中已經給出了樣例的分類。而聚類的樣本中卻沒有給定y，只有特徵x，比如假設宇宙中的星星可以表示成三維空間中的點集。聚類的目的是找到每個樣本x潛在的類別y，並將同類別y的樣本x

機器學習-K-Means演算法（附原始碼）

定義俗話說“物以類聚”，其實從廣義上說，聚類就是將資料集中在某些方面相似的資料成員放在一起。一個聚類就是一些資料例項的集合，其中處於相同聚類中的資料元素彼此相似，但是處於不同聚類中的元素彼此不同。由於在聚類中那些表示資料類別的分類或分組資訊是沒有的，即這些資料是沒

python 機器學習K-means演算法實現

\編譯器:pycharm 1.匯入K-means相關包這個包匯入有點坑,有許多依賴包需要匯入,推薦下載Anaconda後,在pycharm匯入Anaconda中的python,在下載sklearn包,就可以開心的敲程式碼了~! 2正式開始: from

《機器學習實戰》第二章——k-近鄰演算法——筆記

在看這一章的書之前，在網上跟著博主Jack-Cui的部落格學習過，非常推薦。部落格地址：http://blog.csdn.net/c406495762 《Python3《機器學習實戰》學習筆記（一）：k-近鄰演算法(史詩級乾貨長文)》講述的非常細緻，文字幽默有趣，演算法細

小白python學習——機器學習篇——k-近鄰演算法（KNN演算法）

一、演算法理解一般給你一資料集，作為該題目的資料（一個矩陣，每一行是所有特徵），而且每一組資料都是分了類，然後給你一個數據，讓這個你預測這組資料屬於什麼類別。你需要對資料集進行處理，如：歸一化數值。處理後可以用matplotlib繪製出影象，一般選兩個特徵繪製x，y軸，然後核心是計算出預測點到

機器學習：K近鄰演算法，kd樹

https://www.cnblogs.com/eyeszjwang/articles/2429382.html kd樹詳解 https://blog.csdn.net/v_JULY_v/article/details/8203674 一、K-近鄰演算法（KNN）概述

機器學習實戰——k-近鄰演算法Python實現問題記錄

準備 kNN.py 的python模組 from numpy import * import operator def createDataSet(): group = array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])

Python3《機器學習實戰》學習筆記（一）：k-近鄰演算法

**轉載：**http://blog.csdn.net/c406495762執行平臺： WindowsPython版本： Python3.xIDE： Sublime text3 他的個人網站：http://cuijiahua.com 文章目錄

機器學習 k-近鄰演算法

相關推薦