k最近鄰(k-nn)

阿新 • • 發佈：2019-02-01

源資料如下（raw_data）

程式碼如下（main.py）

#encoding=utf-8
#獲取兩個整型列表的平方差之和
def get_distance(list1,list2):
    length=len(list1)
    total=0
    for i in xrange(0,length):
        #print i,list1[i],list2[i]
        result1= (list1[i] - list2[i]) ** 2
        #print result1
        total = total + result1
    return total

predict_data=[3,7]#判斷它的類別
raw_data=open("raw_data","r+")#讀取源資料
raw_list=raw_data.readlines()
map_list=[]
record_index=0#
for ele in raw_list:#對於源資料的每一行 1:7 7
    ele=ele.strip()
    split_list=ele.split(":")
    tag=split_list[0]
    feature=split_list[1]
    feature_list=feature.split(" ")
    feature_list_int=[]
    for ele in feature_list:
        feature_list_int.append(int(ele.strip()))
    list1=[]
    list1.append(record_index)#每條記錄的id
    record_index = record_index + 1
    for ele in feature_list:#每條記錄的特性
        list1.append(int(ele.strip()))
    distance=get_distance(predict_data,feature_list_int)#每條記錄和預測特徵的歐式距離
    list1.append(distance)
    list1.append(int(tag.strip()))#每條記錄的標籤
    #print list1
    map_list.append(list1)
#list1=[ [0,7,7,16,1],[1,7,4,25,1],[2,3,4,9,0],[3,1,4,13,0] ]#未排序前的map_list:   id feature1 feature2 distance tag
map_list.sort(key=lambda x:x[3])
map_file=open("map_data","w+")
for ele in map_list:#將處理後的資料寫入檔案
    map_file.write(str(ele))
    map_file.write("\n")
#下面開始knn演算法
class1 = 0 #好
class2 = 1 #壞
class1_no = 0
class2_no = 0
k = 3
top_k_neighbor=map_list[0:k]#k個最近鄰
for ele in top_k_neighbor:#統計k個最近鄰中每個標籤的數量
    if ele[4] == class1:
        class1_no = class1_no + 1
        #print class1,ele[3]
    if ele[4] == class2:
        class2_no = class2_no + 1
        #print class2,ele[3]
if(class1_no > class2_no):#哪個標籤的數量最多，就是屬於哪一類
    print "good"
if(class1_no < class2_no):
    print "bad"
if(class1_no == class2_no):
    print "choose another k"

資料處理結果如下（map_data）

[2, 3, 4, 9, 0]
[3, 1, 4, 13, 0]
[0, 7, 7, 16, 1]
[1, 7, 4, 25, 1]

在Ignite中使用k-最近鄰(k-NN)分類演算法

　　在本系列前面的文章中，簡單介紹了一下Ignite的線性迴歸演算法，下面會嘗試另一個機器學習演算法，即k-最近鄰(k-NN)分類。該演算法基於物件k個最近鄰中最常見的類來對物件進行分類，可用於確定類成員的關係。　　　　一個適合k-NN分類的資料集是鳶尾花資料集，它可以很容易地通過UCI網站獲得。　　　　鳶尾

在Ignite中使用k-最近鄰(k-NN)分類算法

任務 dense 取數讀取數據 features fit del div 利用　　在本系列前面的文章中，簡單介紹了一下Ignite的線性回歸算法，下面會嘗試另一個機器學習算法，即k-最近鄰(k-NN)分類。該算法基於對象k個最近鄰中最常見的類來對對象進行分類，可用於確定

k最近鄰(k-nn)

源資料如下（raw_data） 1:7 7 1:7 4 0:3 4 0:1 4程式碼如下（main.py） #encoding=utf-8 #獲取兩個整型列表的平方差之和 def get_distance(list1,list2): length=len(list1) total=0

K最近鄰演算法（K-NN）

K-NN是什麼？ K最近鄰演算法是一種簡單但目前最常用的分類演算法，也可用於迴歸。 KNN沒有引數（不對資料潛在分佈規律做任何假設），基於例項（不建立明確的模型，而是通過具體的訓練例項進行預測），用於監督學習中。 K-NN演算法怎麼工作？當用KNN進行分類時，

PCB 加投率計算實現基本原理--K最近鄰算法（KNN）

最近鄰 plist 控制 str 驗收階段分享圖片數據量出現 PCB行業中，客戶訂購5000pcs，在投料時不會直接投5000pcs,因為實際在生產過程不可避免的造成PCB報廢，所以在生產前需計劃多投一定比例的板板，例：訂單量是5000pcs，加投3%，那就

K最近鄰（KNN）

K最近鄰演算法 #K最近鄰演算法分辨手寫數字圖片 from sklearn.datasets import load_digits from sklearn.decomposition import PCA digits = load_digits() pca = PCA(n_compone

《演算法圖解》第10章 K最近鄰（K nearest neighbors,KNN）演算法

今天看到這裡的案例非常有意思，即以座標軸中的座標來作為引數。計算不同點的距離。實際上就是標記一些使用者的喜好和習慣，不同的維度代表不同的專案，在這個維度上的值可表示喜好程度。電影評分、音樂收藏...總之，很多情況都可以用，很有趣。就是標記了很多使用者，看哪些使

圖說十大資料探勘演算法(一)K最近鄰演算法

用官方的話來說，所謂K近鄰演算法，即是給定一個訓練資料集，對新的輸入例項，在訓練資料集中找到與該例項最鄰近的K個例項（也就是上面所說的K個鄰居），這K個例項的多數屬於某個類，就把該輸入例項分類到這個類中。如果你之前沒有學習過K最近鄰演算法，那今天幾張圖，讓你明白什麼是K最近鄰

python -- K最近鄰演算法

KNN核心演算法函式 #! /usr/bin/env python3 # -*- coding: utf-8 -*- # fileName ： KNNdistance.py # author : [email protected] import

資料科學和人工智慧技術筆記十四、K 最近鄰

十四、K 最近鄰作者：Chris Albon 譯者：飛龍協議：CC BY-NC-SA 4.0 確定 K 的最佳值 # 載入庫 from sklearn.neighbors import KNeighborsClassifier from skl

斯坦福CS231n專案實戰（一）：k最近鄰（kNN）分類演算法

k最近鄰分類（kNN，K Nearest neighbor)分類演算法是一種最簡單的分類器之一。在kNN演算法訓練過程中，它將所有訓練樣本的輸入和輸出label都儲存起來。測試過程中，計算測試樣本與每個訓練樣本的L1或L2距離，選取與測試樣本距離最近的前k個

機器學習演算法-K最近鄰從原理到實現（Python）

本來這篇文章是5月份寫的，今天修改了一下內容，就成今天發表的了，CSDN這是出BUG了還是什麼改規則了。。。引文：決策樹和基於規則的分類器都是積極學習方法（eager learner）的例子，因為一旦訓練資料可用，他們就開始學習從輸入屬性到類標號的對映模型。

K最近鄰分類演算法原理及例項分析

目錄概述原理要點例項 1、概述 K最近鄰（k-Nearest Neighbor，KNN），指導思想是“近朱者赤，近墨者黑”，由你的鄰居來推斷出你的類別，KNN分類演算法是最簡單的機器學習演算法。 2、原理從訓練集中找到和新資料最接近的k條記錄

KNN(K-最近鄰)

演算法介紹 KNN分類演算法應該是最容易理解的機器學習演算法了。它是惰性學習法的一種，它並不從訓練資料集中得到一個分類模型，而是簡單的儲存這些訓練資料，當一個待分類資料X到來時，它計算X和訓練資料集中

資料探勘之k-最近鄰法（KNN與KMeans）

最近鄰法基於類比學習，它既可以用於聚類，也可以用於分類 K-means是基於最近鄰法的聚類方法。演算法描述如下：輸入：k, data[n]; （1）選擇k個初始中心點，例如c[0]=data[0],…c[k-1]=data[k-1]; （2）對於data[0]….

k最近鄰(KNN)分類法介紹

1.急切學習與懶惰學習急切學習：在給定訓練元組之後、接收到測試元組之前就構造好泛化（即分類）模型。屬於急切學習的演算法有：決策樹、貝葉斯、基於規則的分類、後向傳播分類、SVM和基於關聯規則挖掘的分類等等。懶惰學習：直至給定一個測試元組才開始構造泛化模型，也稱

機器學習隨筆五—十大經典演算法—KNN (K最近鄰)

1. K-近鄰演算法原理 K最近鄰(kNN，k-NearestNeighbor)分類演算法，見名思意：找到最近的k個鄰居（樣本），在前k個樣本中選擇頻率最高的類別作為預測類別，什麼？怎麼那麼拗口，沒圖說個JB，下面舉個例子，圖解一下大家就會顯而易見了，如下圖：

K最近鄰演算法（KNN）---sklearn+python實現

def main(): import numpy as np from sklearn import datasets digits=datasets.load_digits() x=digits.data y=digits.target from sklear

KNN K最近鄰演算法

　　K Nearest Neighbor,KNN,K最近鄰演算法。　　演算法原理：　　　　(1)計算未知類別資料點與已知類別資

機器學習-簡單的K最近鄰演算法及python實現

根據前人的成果進行了學習 https://www.cnblogs.com/ahu-lichang/p/7161613.html#commentform 1、演算法介紹其實k最近鄰演算法算是聚類演算法中最淺顯易懂的一種了，考慮你有一堆二維資料，你想很簡單的把它分開，像下圖這

k最近鄰(k-nn)

源資料如下（raw_data）

程式碼如下（main.py）

資料處理結果如下（map_data）

相關推薦