sklearn iris(鳶尾花)資料集應用

阿新 • • 發佈：2019-01-15

資料背景

由Fisher在1936年整理，包含4個特徵（Sepal.Length（花萼長度）、Sepal.Width（花萼寬度）、Petal.Length（花瓣長度）、Petal.Width（花瓣寬度）），特徵值都為正浮點數，單位為釐米。目標值為鳶尾花的分類（Iris Setosa（山鳶尾）、Iris Versicolour（雜色鳶尾），Iris Virginica（維吉尼亞鳶尾））。

測試程式碼

新建lr_riis.py檔案，編寫程式碼

# -*- coding:utf-8 -*-
import numpy as np

from sklearn import datasets
from 
 sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression

def load_data():
    iris = datasets.load_iris()
    print(iris.keys())
    n_samples, n_features = iris.data.shape
    print((n_samples, n_features))
    print(iris.data[0])
    print(iris.target.shape)
    print(iris.target)
    print(iris.target_names)
    print("feature_names:" 
, iris.feature_names)


def main():
   load_data()

if __name__ == '__main__':
    main()

執行結果為：
這裡寫圖片描述

由結果可知：
iris中有5個key值

iris.data 包含了四個特徵值，例如[5.1, 3.5, 1.4, 0.2]
iris.target為目標值
iris.feature_names為特徵名稱

模型預測實踐

重新更新下程式碼

# -*- coding:utf-8 -*-
import numpy as np

from sklearn import datasets
from 
 sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression

def load_data():
    # 共150條資料，訓練120條，測試30條，進行2,8分進行模型訓練
    # 每條資料型別為 x{nbarray} [6.4, 3.1, 5.5, 1.8]
    inputdata = datasets.load_iris()
    # 切分，測試訓練2,8分
    x_train, x_test, y_train, y_test = \
        train_test_split(inputdata.data, inputdata.target, test_size = 0.2, random_state=0)
    return x_train, x_test, y_train, y_test

def main():
    # 訓練集x ,測試集x,訓練集label,測試集label
    x_train, x_test, y_train, y_test = load_data()
    # l2為正則項
    model = LogisticRegression(penalty='l2')
    model.fit(x_train, y_train)

    print "w: ", model.coef_
    print "b: ", model.intercept_
    # 準確率
    print "precision: ", model.score(x_test, y_test)
    print "MSE: ", np.mean((model.predict(x_test) - y_test) ** 2)

if __name__ == '__main__':
    main()

執行結果為：
這裡寫圖片描述

sklearn iris(鳶尾花)資料集應用

資料背景由Fisher在1936年整理，包含4個特徵（Sepal.Length（花萼長度）、Sepal.Width（花萼寬度）、Petal.Length（花瓣長度）、Petal.Width（花瓣寬度）），特徵值都為正浮點數，單位為釐米。目標值為鳶尾花的分類（

人工智慧考試——k近鄰演算法對鳶尾花（iris）資料集進行分析

一、題目通過修改提供的k_nn.c檔案，讀取鳶尾花的資料集，其中iris_training_set.txt和iris_test_set.txt分別為訓練集和測試集，兩個資料集中最後一列為類別標籤，其餘列為表示花瓣和萼片長度和寬度的輸入特徵。通過計算測試集中的每個輸入行和訓

java實現k-means演算法（用的鳶尾花iris的資料集，從mysq資料庫中讀取資料）

k-means演算法又稱k-均值演算法，是機器學習聚類演算法中的一種，是一種基於形心的劃分方法，其中每個簇的中心都用簇中所有物件的均值來表示。其思想如下：輸入： k：簇的數目；D：包含n個物件的資料集。輸出：k個簇的集合。方法：從D中隨機選擇幾個物件作為起始質心

決策樹分類鳶尾花資料集

import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt from sklearn.tree import DecisionTreeClassifier iris_

Logistics迴歸分類鳶尾花資料集

import numpy as np from sklearn.linear_model import LogisticRegression import matplotlib.pyplot as plt import matplotlib as mpl import pandas as pd fr

分類問題（一）：SVM(Python——基於skearn實現鳶尾花資料集分類)

第一步： # -*- coding: utf-8 -*- """ Created on Fri Sep 21 14:26:25 2018 @author: bd04 """ # !/usr/bin/env python # encoding: utf-8 __auth

Tensorflow訓練鳶尾花資料集

圖片資料集：鳶尾花 (一共五個類別) { 資料集連結：https://pan.baidu.com/s/1l86AiiVibPI03qWslEyqZA 密碼：oq5d } 程式程式碼如下： # -*- coding: utf-8 -*- from skimage im

【python資料探勘課程】十九.鳶尾花資料集視覺化、線性迴歸、決策樹花樣分析

這是《Python資料探勘課程》系列文章，也是我這學期上課的部分內容。本文主要講述鳶尾花資料集的各種分析，包括視覺化分析、線性迴歸分析、決策樹分析等，通常一個數據集是可以用於多種分析的，希望這篇文章對大

分析鳶尾花資料集

3. 邏輯迴歸分析從圖中可以看出，資料集線性可分的，可以劃分為3類，分別對應三種類型的鳶尾花，下面採用邏輯迴歸對其進行分類預測。前面使用X=[x[0] for x in DD]獲取第一列資料，Y=[x[1] for x in DD]獲取第二列資料，這裡採用另一種方法，iris.data[:, :2]獲取其中兩

Python sklearn包——mnist資料集下不同分類器的效能實驗

Preface：使用scikit-learn各種分類演算法對資料進行處理。 2.2、Scikit-learn的測試 scikit-learn已經包含在Anaconda中。也可以在官方下載原始碼包進行安裝。本文程式碼裡封裝瞭如下機器學習演算法，我們修改資料載入函式，即可

樸素貝葉斯對鳶尾花資料集進行分類

注：本人純粹為了練手熟悉各個方法的用法使用高斯樸素貝葉斯對鳶尾花資料進行分類程式碼： 1 # 通過樸素貝葉斯對鳶尾花資料進行分類 2 3 from sklearn import datasets 4 from sklearn.model_selection import train_

資料探勘之鳶尾花資料集分析

因為手上沒有iris.data資料，只能通過在sklearn中載入原始資料，並將其轉換為Dataframe格式主要內容：資料分佈的視覺化（特徵之間分佈、特徵內部、分類精度、熱力圖）演算法：決策樹隨機森林 import pandas as pd from skle

實現鳶尾花資料集分類

轉自：http://blog.csdn.net/jasonding1354/article/details/42143659 引入一個機器可以根據照片來辨別鮮花的品種嗎？在機器學習角度，這其實是一個分類問題，即機器根據不同品種鮮花的資料進行學習，使其可以對未標記的測

XGBoost實現對鳶尾花資料集分類預測

code:import xgboost as xgb import numpy as np import pandas as pd from sklearn.model_selection import

人工智慧深度學習TensorFlow通過感知器實現鳶尾花資料集分類

一.iris資料集簡介 iris資料集的中文名是安德森鳶尾花卉資料集，英文全稱是Anderson’s Iris data set。iris包含150個樣本，對應資料集的每行資料。每行資料包含每個樣本的四個特徵和樣本的類別資訊，所以iris資料集是一個150行5列的二維表。通俗地說，iris

DL之NN：(sklearn自帶資料集為1797個樣本*64個特徵)利用NN之sklearn、NeuralNetwor.py實現手寫數字圖片識別95%準確率

先檢視sklearn自帶digits手寫資料集(1797*64)import numpy as np from sklearn.datasets import load_digits from skl

（參評）機器學習筆記——鳶尾花資料集（KNN、決策樹、樸素貝葉斯分析）

最開始選取鳶尾花資料集來了解決策樹模型時，筆者是按照學習報告的形式來寫得，在這裡將以原形式上傳。格式較為繁複，希望讀者可以耐心看完，謝謝大家。目錄 6.總結 7.問題 1、問題描述 iris是鳶尾植物，這裡儲存了其萼片和花瓣的長寬，共4個屬性，鳶尾

[Java][機器學習]用決策樹分類演算法對Iris花資料集進行處理

Iris Data Set是很經典的一個數據集，在很多地方都能看到，一般用於教學分類演算法。這個資料集在UCI Machine Learning Repository裡可以找到（還是下載量排第一的資料喲）。這個資料集裡面，每個資料都包含4個值(sepal len

利用線性函式實現鳶尾花資料集分類

在空間中，我們定義分類的線性函式為：g(x)=wTx+bg(x)=w^{T}x+bg(x)=wTx+b 其中樣本x=(x1,x2,...,xl)Tx=(x_{1},x_{2},...,x_{l})^{T}x=(x1,x2,...,xl)T，權向量w=(w1

Google機器學習（二）鳶尾花資料集（load_iris）決策樹

Google深度學習系列視訊 ____tz_zs學習筆記一、在Spyder中寫第一個機器學習的程式：這裡使用的分類器是決策樹 from sklearn import tree feature = [[140,1],[130,1],[150,0],[170,

sklearn iris(鳶尾花)資料集應用

資料背景

測試程式碼

模型預測實踐

相關推薦