機器學習---scikit-learn中KNN演算法的封裝

阿新 • • 發佈：2018-12-15

1，工具準備，python環境，pycharm

2，在機器學習中，KNN是不需要訓練過程的演算法，也就是說，輸入樣例可以直接呼叫predict預測結果，訓練資料集就是模型。當然這裡必須將訓練資料和訓練標籤進行擬合才能形成模型。

3，在pycharm中建立新的專案工程，並在專案下新建KNN.py檔案。

import numpy as np
from math import sqrt
from collections import Counter

class KNNClassifier:
    def __init__(self,k):
        """初始化KNN分類器"""
        assert  k >= 1
        """斷言判斷k的值是否合法"""
        self.k = k
        self._X_train = None
        self._y_train = None

    def fit(self,X_train,y_train):
        """根據訓練資料集X_train和Y_train訓練KNN分類器，形成模型"""
        assert X_train.shape[0] == y_train.shape[0]
        """資料和標籤的大小必須一樣
        assert self.k <= X_train.shape[0]
        """k的值不能超過資料的大小"""
        self._X_train = X_train
        self._y_train = y_train
        return self

    def predict(self,X_predict):
        """必須將訓練資料集和標籤擬合為模型才能進行預測的過程"""
        assert self._X_train is not None and self._y_train is not None
        """訓練資料和標籤不可以是空的"""
        assert X_predict.shape[1]== self._X_train.shape[1]
        """待預測資料和訓練資料的列(特徵個數)必須相同"""
        y_predict = [self._predict(x) for x in X_predict]
        return np.array(y_predict)

    def _predict(self,x):
        """給定單個待測資料x,返回x的預測資料結果"""
        assert x.shape[0] == self._X_train.shape[1]
        """x表示一行資料，即一個數組，那麼它的特徵資料個數，必須和訓練資料相同
        distances = [sqrt(np.sum((x_train - x)**2))for x_train in self._X_train]
        nearest = np.argsort(distances)
        topk_y = [self._y_train[i] for i in nearest[:self.k]]
        votes = Counter(topk_y)
        return votes.most_common(1)[0][0]

4，新建test.py檔案，引入KNNClassifier物件。

from KNN.py import KNNClassifier
raw_data_x = [[3.393,2.331],
              [3.110,1.781],
              [1.343,3.368],
              [3.582,4.679],
              [2.280,2.866],
              [7.423,4.696],
              [5.745,3.533],
              [9.172,2.511],
              [7.792,3.424],
              [7.939,0.791]]
raw_data_y = [0,0,0,0,0,1,1,1,1,1]
X_train = np.array(raw_data_x)
y_train = np.array(raw_data_y)
x = np.array([9.880,3.555])

# 要將x這個矩陣轉換成2維的矩陣，一行兩列的矩陣
X_predict = x.reshape(1,-1)

"""1，建立一個物件，設定K的值為6"""
knn_clf = KNNClassifier(6)

"""2，將訓練資料和訓練標籤融合"""
knn_clf.fit(X_train,y_train)

"""3，經過2才能跳到這裡，傳入待預測的資料"""
y_predict = knn_clf.predict(X_predict)
print(y_predict)

機器學習---scikit-learn中KNN演算法的封裝

1，工具準備，python環境，pycharm 2，在機器學習中，KNN是不需要訓練過程的演算法，也就是說，輸入樣例可以直接呼叫predict預測結果，訓練資料集就是模型。當然這裡必須將訓練資料和訓練標籤進行擬合才能形成模型。 3 3，在pycharm中建立新的專案工程

scikit-learn中KNN演算法資料歸一化的分裝

import numpy as np class StandardScaler: def __init__(self): """初始化""" """用符號和下劃線表示非使用者傳入的引數""" self.mean_ =

機器學習scikit-learn概目

機器學習scikit-learn概目線性模型 (linear_model)： 1、線性-迴歸器 ① class sklearn.linear_model.LinearRegression() ② class sklearn.linear_model.Ri

機器學習scikit-learn

1.分類：監督學習，非監督學習，半監督學習（少量標籤），強化學習，遺傳演算法 2.安裝：pip install scikit-learn 建議直接用anaconda（兩個不用同事安裝使用容易出錯） **安裝問題：如果不用anaconda用pip建議看下這篇文章https://bbs.csdn

輕鬆玩轉 Scikit-Learn 系列 —— KNN 演算法

scikit-learn 是最受歡迎的機器學習庫之一，它提供了各種主流的機器學習演算法的API介面供使用者呼叫，讓使用者可以方便快捷的搭建一些機器學習模型，並且通過調參可以達到很高的準確率。這次我們主要介紹scikit-learn中k近鄰演算法（以下簡稱為KNN）的使用。 KNN是一種非引數機器學習演算

scikit-learn 中KNN分類繪圖

scikit-learn 中KNN分類繪圖參考連結： KNN相關的類庫概述： https://www.cnblogs.com/pinard/p/6065607.html 下載的toy資料集： https://blog.csdn.net/sa14023053/a

[機器學習]Scikit-Learn學習筆記03——Scikit-Learn資料模型

Scikit-Learn提供了比較全的資料集,主要分為以下幾類 1. 自帶的小資料集（packaged dataset） 2. 線上下載的資料集（Downloaded Dataset） 3. 生成的資料集（Generated Dataset) 4. svm

機器學習實戰筆記——利用KNN演算法改進約會網站的配對效果

一、案例背景我的朋友海倫一直使用線上約會網站尋找合適自己的約會物件。儘管約會網站會推薦不同的人選，但她並不是喜歡每一個人。經過一番總結，她發現曾交往過三種類型的人：（1）不喜歡的人；（2）

機器學習scikit-learn（一）

機器學習scikit-learn 在資料分析過程中，我們經常會碰到各種各樣的問題。如何獲取外部資料？如何處理髒資料？如何處理缺失值？若有許多特徵，我們減少特徵？建立各種模型中演算法的細節？到最後，面對多種模型，我們該如何選擇？這些問題，都將在此文中得到解答。此

機器學習之K近鄰(KNN)演算法

1.KNN簡介 K近鄰(K-Nearest Neighbors, KNN)演算法既可處理分類問題，也可處理迴歸問題，其中分類和迴歸的主要區別在於最後做預測時的決策方式不同。KNN做分類預測時一般採用多數表決法，即訓練集裡和預測樣本特徵最近的K個樣本，預測結果為裡

機器學習：SVM（scikit-learn 中的 RBF、RBF 中的超參數 γ）

import colors 機器 class 核函數 RoCE caf 情況方差一、高斯核函數、高斯函數 μ：期望值，均值，樣本平均數；（決定告訴函數中心軸的位置：x = μ） σ2：方差；（度量隨機樣本和平均值之間的偏離程度：，為總體方差，為變量，為總體

機器學習——K-近鄰（KNN）演算法

本文轉載自：https://www.cnblogs.com/ybjourney/p/4702562.html 一 . K-近鄰演算法（KNN）概述最簡單最初級的分類器是將全部的訓練資料所對應的類別都記錄下來，當測試物件的屬性和某個訓練物件的屬性完全匹配時，便可以對其進

python中的numpy和pandas---機器學習實戰第一篇KNN

http://www.cnblogs.com/prpl/p/5537417.html 熟悉其基本操作 from numpy import * import operator def data(): datas = array([[1.0,1.1],[1.0,1.0],[0,0]

【python與機器學習入門1】KNN（k近鄰）演算法2 手寫識別系統

參考部落格：超詳細的機器學習python入門knn乾貨（po主Jack-Cui 參考書籍：《機器學習實戰》——第二章 KNN入門第二彈——手寫識別系統demo ——《機器學習實戰》第二章2.3 手寫識別系統 &

機器學習筆記之八—— knn-最簡單的機器學習演算法以及KD樹原理

上一節結束了線性迴歸、邏輯迴歸，今天一節來介紹機器學習中最簡單的演算法： K近鄰（KNN，全稱K-nearst Neighbor）概述：判斷一個樣本的label只需要判斷該樣本週圍其他樣本的label。簡言之，朋

用Python開始機器學習（4：KNN分類演算法） sklearn做KNN演算法 python

http://blog.csdn.net/lsldd/article/details/41357931 1、KNN分類演算法 KNN分類演算法（K-Nearest-Neighbors Classification），又叫K近鄰演算法，是一個概念極其簡單，而分類效果又很優秀的

python機器學習-k近鄰（KNN）演算法例項

機器學習-k近鄰（KNN）本篇主要是自己複習和總結機器學習演算法中最基礎入門的——k近鄰（KNN）演算法，內容由網上百度與摘抄唐宇迪老師的講義。 k近鄰介紹 ——K最近鄰(k-Nearest Neighbor，KNN)，k近鄰演算法可以應用於分類場景與迴歸場

機器學習—python+sklearn實現KNN&KD樹演算法

python+sklearn實現KNN及KD樹演算法 from sklearn import datasets# 匯入內建資料集模組 from sklearn.neighbors import KNeighborsClassifier# 匯入sklearn.ne

用Python開始機器學習（4：KNN分類演算法）

1、KNN分類演算法KNN分類演算法（K-Nearest-Neighbors Classification），又叫K近鄰演算法，是一個概念極其簡單，而分類效果又很優秀的分類演算法。他的核心思想就是，要確定測試樣本屬於哪一類，就尋找所有訓練樣本中與該測試樣本“距離”最近的前K個

scikit-learn中評價指標

style 說明回歸對比 kit 擬合 size 例如因變量一、R2 決定系數（擬合優度）它是表征回歸方程在多大程度上解釋了因變量的變化，或者說方程對觀測值的擬合程度如何。因為如果單純用殘差平方和會受到你因變量和自變量絕對值大小的影響，不利於在不同模型之間進

機器學習---scikit-learn中KNN演算法的封裝

相關推薦