Pandas之iris資料集簡單分析

阿新 • • 發佈：2019-01-07

匯出iris資料集

from sklearn import datasets
import pandas as np


iris_datas = datasets.load_iris()

iris_data是一個類似字典的物件。

print(iris_datas.data) # 資料集中的資料
print(iris_datas.target_name) #  iris的種類

iris = pd.DataFrame(iris_datas.data, columns=['SpealLength', 'Spealwidth', 'PetalLength', 'PetalLength'])

iris.shape
iris.head()

(150, 4)

    SpealLength	 Spealwidth	PetalLength	PetalLength
0	    5.1	        3.5	        1.4	     0.2
1	    4.9	        3.0	        1.4	     0.2
2	    4.7	        3.2	        1.3	     0.2
3	    4.6	        3.1	        1.5	     0.2
4	    5.0	        3.6	        1.4	     0.2

描述性統計

iris.describe().T     # 描述性統計轉置

花萼長度與寬度/花瓣長度與寬度的視覺化，判斷是否僅依據其即可判別鳶尾花品種。

from collection import Counter, defaultdict
import matplotlib
import matplotlib.pyplot as plt


matplotlib.rcParams['font.sans-serif'] = ['SimHei']

style_list = ['o', '^', 's']       # 設定點的不同形狀，不同形狀預設顏色不同，也可自定義
data = iris_datas.data
labels = iris_datas.target_names
cc = defaultdict(list)

for i, d in enumerate(data):
    cc[labels[int(i/50)]].append(d)

p_list = []
c_list = []

for each in [0, 2]:
    for i, (c, ds) in enumerate(cc.items()):
        draw_data = np.array(ds)
        p = plt.plot(draw_data[:, each], draw_data[:, each+1], style_list[i])
        p_list.append(p)
        c_list.append(c)

    plt.legend(map(lambda x: x[0], p_list), c_list)
    plt.title('鳶尾花花瓣的長度和寬度') if each else plt.title('鳶尾花花萼的長度和寬度')
    plt.xlabel('花瓣的長度(cm)') if each else plt.xlabel('花萼的長度(cm)')
    plt.ylabel('花瓣的寬度(cm)') if each else plt.ylabel('花萼的寬度(cm)')
    plt.show()

Pandas之iris資料集簡單分析

匯出iris資料集 from sklearn import datasets import pandas as np iris_datas = datasets.load_iris() ir

TensorFlow入門教程：8：訓練資料之Iris資料集

Irises，聞名於世的不只是梵高那副價值超過5000萬美元的鳶尾花，同時還有Iris資料集。 Iris資料集由英國統計學家/生物學家Ronald Fisher在1936年所收集，共包含150條資料，

[譯]使用 Pandas 對 Kaggle 資料集進行統計資料分析

原文地址：EXPLORATORY STATISTICAL DATA ANALYSIS WITH A KAGGLE DATASET USING PANDAS 原文作者：Strikingloo 譯文出自：掘金翻譯計劃本文永久連結：github.com/xitu/gold-m…

Spark ML 基於Iris資料集進行資料建模及迴歸聚類綜合分析-Spark商業ML實戰

本套技術專欄是作者（秦凱新）平時工作的總結和昇華，通過從真實商業環境抽取案例進行總結和分享，並給出商業應用的調優建議和叢集環境容量規劃等內容，請持續關注本套部落格。版權宣告：禁止轉載，歡迎學習。QQ郵箱地址：[email protected]，如有任何商業交流，可隨時聯絡。

Iris資料集用主成分分析MATLAB

1、程式碼 filename = 'iris.csv'; data = csvread(filename); rawdata = data(:,2:5) a = data(data(:,1)==0,:); a = a(:,2:5); b = data(data(

Python資料分析--Iris資料集實戰

本次主要圍繞Iris資料集進行一個簡單的資料分析, 另外在資料的視覺化部分進行了重點介紹. 環境 win8, python3.7, jupyter notebook 正文 1. 專案背景鳶尾屬(拉丁學名：Iris L.), 單子葉植物綱, 鳶尾科多年生草本植物, 開的花大而美麗, 觀賞價值很高. 鳶尾屬約3

資料探勘-Iris資料集分析-決策邊界_根據花瓣資料繪製(七)

# coding: utf-8 # 使用花瓣測量資料繪製 2D散點圖，並繪出決策邊界 import numpy as np import matplotlib.pyplot as plt from

資料探勘-K-近鄰分類器-Iris資料集分析-使用K-近鄰分類器進行分類預測(四)

# coding: utf-8 #使用 scikit-learn庫的K-近鄰分類器完成分類 #1. 首先將資料集中的資料進行打亂 #2. 將資料分為訓練集和測試集兩部分 #3. 使用 k-means分類器進行分類訓練，得到預測模型 #4. 使用模型對測試集進行測試，並與真實

資料探勘之鳶尾花資料集分析

因為手上沒有iris.data資料，只能通過在sklearn中載入原始資料，並將其轉換為Dataframe格式主要內容：資料分佈的視覺化（特徵之間分佈、特徵內部、分類精度、熱力圖）演算法：決策樹隨機森林 import pandas as pd from skle

人工智慧考試——k近鄰演算法對鳶尾花（iris）資料集進行分析

一、題目通過修改提供的k_nn.c檔案，讀取鳶尾花的資料集，其中iris_training_set.txt和iris_test_set.txt分別為訓練集和測試集，兩個資料集中最後一列為類別標籤，其餘列為表示花瓣和萼片長度和寬度的輸入特徵。通過計算測試集中的每個輸入行和訓

神經網路實現Mnist資料集簡單分類

本文針對mnist手寫數字集，搭建了四層簡單的神經網路進行圖片的分類，詳細心得記錄下來分享我是採用的TensorFlow框架進行的訓練 import tensorflow as tf from tensorflow.examples.tutorials.mnist import in

CelebA資料集簡單介紹，及做人臉識別時資料集的處理

CeleA是香港中文大學的開放資料，包含10177個名人身份的202599張圖片，並且都做好了特徵標記，這對人臉相關的訓練是非常好用的資料集。網盤連結資料包含了三個資料夾，一個描述文件如下： img資料夾下有兩個壓縮包 img_align_celeba.zip & img_al

Pandas讀取excel資料——pearson相關性分析

利用Pandas和tushare進行一個簡單的資料讀取和分析一丶Pandas的DataFrame操作方法一個表格型資料，提供列名和不同的值，以及索引值通過下面程式碼記錄一些DataFrame的方法 from pandas import Series,DataFram

pandas之DataFrame資料框

DataFrame資料框 1.建立資料框 df = DataFrame({ 'age':[21,22,23], 'name':['zhangYafei','LiuGeliang','KangYue'] },index=['fir

yolo 學習筆記分享之--VOC資料集

參考： <Pascal VOC & COCO資料集介紹 & 轉換> http://www.cnblogs.com/pprp/p/9629752.html 《Pascal Voc資料集詳細分析》https://blog.csdn.net/u01383270

利用 sklearn SVM 分類器對 IRIS 資料集分類

利用 sklearn SVM 分類器對 IRIS 資料集分類支援向量機（SVM）是一種最大化分類間隔的線性分類器（如果不考慮核函式）。通過使用核函式可以用於非線性分類。SVM 是一種判別模型，既適用於分類也適用於迴歸問題，標準的 SVM 是二分類器，可以採用 “one vs one”

基於決策樹模型對 IRIS 資料集分類

基於決策樹模型對 IRIS 資料集分類文章目錄基於決策樹模型對 IRIS 資料集分類 1 python 實現載入資料集視覺化資料集分類和預測計算準確率 2 基於MATLA

用Iris資料集的屬性畫圖

1、Iris資料集這個資料集很有名，很多實驗都用它來做，這裡我用的資料集，第一列為0、1、2代表label，後面四列是不同的資料，為了方便，將後面的屬性都擴大十倍，變為整數。 2、MATLAB程式碼以下使用第二、三列屬性，畫了一個二維的影象 filename

TensorFlow入門教程：18：Iris資料集的線性迴歸訓練

這篇文章使用實際的統計資料來確認對線性迴歸的曲線擬合的效果，Iris資料集中花瓣的長度和寬度之間的關係滿足明顯的線性關係，這裡我們將使用前文多次使用的方式來對Iris資料進行分析。 Iris資料集四

多分類（softmax處理iris資料集）

# -*- coding: utf-8 -*- # @Time : 2018/12/14 10:08 # @Author : WenZhao # @Email : [email protected] # @File : iris.py # @Software: PyC

Pandas之iris資料集簡單分析

相關推薦