KNN演算法實現對iris資料集的預測

阿新 • • 發佈：2021-10-29

KNN演算法的實現

第一次寫機器學習演算法，寫的是KNN預測iris資料集、不會矩陣運算，實現起來很呆，但是總歸還是實現了

import pandas as pd
from math import dist

k = int(input("請輸入k值（不能輸入三的倍數！）："))
dataTest = pd.read_csv('iristest.csv', header=None).values
trainData = pd.read_csv('iristrain.csv', header=None).values
iris = pd.read_csv('iris.csv', header=None)


# 用於我懶得把測試資料和訓練資料封裝成不同類，所以就會在成員變數裡面同時出現測試資料專有的屬性和測試資料的專有屬性
class Data:
    """
    這個類用來封裝每一個數據的資訊
    info：資料的前4列
    Label：資料標籤
    predict_label：資料的使用knn演算法預測的標籤
    dis：資料離測試資料的距離
    """
    def __init__(self, info, label, dis=None, predict_label=None):
        self.info = info
        self.label = label
        self.dis = dis
        self.predict_label = predict_label

    def __str__(self):
        return "info={0}、dis={1}、label={2}、predict_label={3}".format(self.info, self.dis, self.label,
                                                                     self.predict_label)

    # 重寫__lt__函式方便sort直接排序
    def __lt__(self, other):
        return self.dis < other.dis


trainDataInClass = []
for item in trainData:
    trainDataInClass.append(Data(item[0:4], item[-1]))


def getTestLabel(test_data):
    """
    :param test_data: 輸入點
    :return: 返回該點的類別
    本函式用於做輸入資料的分類
    """
    # 定義一個列表，用來儲存距離
    distance = []
    for m in trainDataInClass:
        # dist是一個直接計算歐氏距離的函式
        m.dis = dist(m.info, test_data.info)
        distance.append(m)
        distance.sort()

    # 定義一個列表來儲存最近前k名的Label
    label_top = []
    for j in range(0, k):
        label_top.append(distance[j].label)

    test_data.predict_label = max(label_top, key=label_top.count)
    return test_data


# 測試資料
# 定義一個儲存預測之後的資料的列表
predict_list = []
for item in dataTest:
    predict_list.append(getTestLabel(Data(item[0:4], item[-1])))

# 定義一個變數用於儲存預測準確的資料數量
predict_true_cnt = 0
for item in predict_list:
    if item.label == item.predict_label:
        predict_true_cnt += 1
# 計算精度
precision = predict_true_cnt / len(predict_list)
print(precision)

沒有做交叉驗證，所以附上訓練資料集和測試資料集

測試資料集，點選下載

直接顯示

訓練資料集，點選下載

直接顯示

KNN演算法實現對iris資料集的預測

KNN演算法的實現第一次寫機器學習演算法，寫的是KNN預測iris資料集、不會矩陣運算，實現起來很呆，但是總歸還是實現了

BP神經網路演算法程式實現鳶尾花(iris)資料集分類

作者有話說最近學習了一下BP神經網路，寫篇隨筆記錄一下得到的一些結果和程式碼，該隨筆會比較簡略，對一些簡單的細節不加以說明。

使用KNN分類器對MNIST資料集進行分類

MNIST資料集包含了70000張0~9的手寫數字影象。一、準備工作：匯入MNIST資料集 1 import sys

python KNN演算法實現鳶尾花資料集分類

一、knn演算法描述 1.基本概述 knn演算法，又叫k-近鄰演算法。屬於一個分類演算法，主要思想如下：

R語言用邏輯迴歸、決策樹和隨機森林對信貸資料集進行分類預測

原文連結：http://tecdat.cn/?p=17950 在本文中，我們使用了邏輯迴歸、決策樹和隨機森林模型來對信用資料集進行分類預測並比較了它們的效能。資料集是

決策樹演算法對鳶尾花資料集進行分類

①匯入相關擴充套件包 from sklearn.tree import DecisionTreeClassifier from sklearn.tree import export_graphviz

用tensorflow搭建簡單神經網路測試iris 資料集和MNIST 資料集

1.步驟第一步：import 相關模組，如 import tensorflow as tf 第二步：指定輸入網路的訓練集和測試集，如指定訓練集的輸入 x_train 和標籤y_train，測試集的輸入 x_test 和標籤 y_test。

keras實現VGG16 CIFAR10資料集方式

我就廢話不多說了，大家還是直接看程式碼吧！ import keras from keras.datasets import cifar10

MNIST 資料集分類# 構建簡單的CNN對 mnist 資料集進行分類

這是一篇學習貼。1 import torch 2 import torch.nn as nn 3 import torch.nn.functional as F 4 import torch.optim as optim

tensorflow2.0——實現波士頓房價資料集的分類問題

import tensorflow as tf import numpy as np import matplotlib.pylab as plt # 模擬資料 x = np.array( [137.97, 104.50, 100, 126.32, 79.20, 99.00, 124.0, 114.0, 106.69, 140.05, 53.75, 46.91, 68.0, 63.02

使用Scikit Learn的分類器探索Iris資料集

作者|Dehao Zhang 編譯|VK 來源|Towards Data Science 暫時，想象一下你不是一個花卉專家（如果你是專家，那對你很好！）。你能區分三種不同的鳶尾屬植物嗎？剛毛鳶尾屬，花色鳶尾屬和維吉尼亞鳶尾屬（setosa, vers

tensorflow2.0——手寫資料集預測

import tensorflow as tf import numpy as np import matplotlib.pylab as plt plt.rcParams[\"font.family\"] = \'SimHei\'# 將字型改為中文

tensorflow2.0——手寫資料集預測（全連線神經3層網路）

import tensorflow as tf import numpy as np from tensorflow.keras import datasets, layers, optimizers # 載入手寫數字資料

tensorflow2.0——手寫資料集預測完整版

import tensorflow as tf def preporocess(x,y): x = tf.cast(x,dtype=tf.float32) / 255 x = tf.reshape(x,(-1,28 *28))#鋪平

JDBC工具類實現對資料庫資料的增刪改查

1、先將連線的地址和賬號密碼放在屬性檔案中，本地連線直接///代替，java1.6以後自動載入驅動

tf.keras訓練iris資料集

import tensorflow as tf import os from sklearn import datasets import numpy as np # 載入資料集 \"\"\"

使用KNN演算法實現手寫數字識別

1.文字檔案資料等等 2.將其3232的二進位制影象轉換為11024的向量 3.測試演算法

django學習-12.在html頁面操作實現對指定資料的增刪改查功能

4.資料表的相關curd的簡單操作通過前面部落格【django學習-10.django連線和操作mysql】裡的操作，我們已經成功在資料庫【hongjingsheng_project】裡建立了一張資料表【hello_person】。

C++實現對Json資料的友好處理

背景 C/C++客戶端需要接收和傳送JSON格式的資料到後端以實現通訊和資料互動。C++沒有現成的處理JSON格式資料的介面，直接引用第三方庫還是避免不了拆解拼接。考慮到此專案將會有大量JSON資料需要處理，避免不了重複

利用pytorch實現對CIFAR-10資料集的分類

步驟如下： 1.使用torchvision載入並預處理CIFAR-10資料集、 2.定義網路 3.定義損失函式和優化器

KNN演算法實現對iris資料集的預測

KNN演算法的實現

相關推薦