1. 程式人生 > >numpy資料集練習(運用jupyter notebook)

numpy資料集練習(運用jupyter notebook)

numpy資料集練習(運用jupyter notebook)

1. 匯入scipy,numpy,sklearn包

import scipy#載入scipy包
import numpy#載入numpy包
from sklearn.datasets import load_iris #載入sklearn包

2. 從sklearn包自帶的資料集中讀出鳶尾花資料集data

3.檢視data型別,包含哪些資料

from sklearn.datasets import load_iris #讀出鳶尾花資料集data
data=load_iris()#檢視data型別
print(type(data))#
檢視資料內容 print(data.keys())

執行結果:

4.取出鳶尾花特徵和鳶尾花類別資料,檢視其形狀及資料型別

#鳶尾花的4個特徵
data_feature= data.feature_names
iris_data=data.data
print(data_feature)
print(iris_data)
#鳶尾花的3個類別
data_target =data.target_names
print(data_target)
iris_data=data.target
print(iris_data)
#資料型別
type(iris_data)

執行結果:

5.取出所有花的花萼長度(cm)的資料

#鳶尾花花萼長度的資料
sepal_length=numpy.array(list(len[0] for len in data['data']))
print(sepal_length)#輸出結果

執行結果:

6.取出所有花的花瓣長度(cm)+花瓣寬度(cm)的資料

#鳶尾花花瓣長度的資料
petal_length=numpy.array(list(len[2] for len in data['data'])) 
print(petal_length)

#鳶尾花花瓣寬度的資料
petal_width=numpy.array(list(len[3] for
len in data['data'])) print(petal_width)

執行結果:

7.取出某朵花的四個特徵及其類別。

#取出某朵花的4個特徵
print(data.data[2])
#取出某朵花的類別
print(data.target_names[2])

執行結果:

8.將所有花的特徵和類別分成三組,每組50個

9.生成新的陣列,每個元素包含四個特徵+類別

#定義三個列表來存放不同型別花朵的類別
setosa_data = []
versicolor_data = []
virginica_data = []
#
for i in range(0,150):
    #生成為setosa類的鳶尾花花資料
    if  data.target[i] == 0: 
        data1 = data.data[i].tolist()
        data1.append('setosa')
        setosa_data.append(data1)
    #生成為versicolor類的鳶尾花資料  
    elif data.target[i] == 1: 
        data1 = data.data[i].tolist()
        data1.append('versicolor')
        versicolor_data.append(data1)
    #剩下的為virginica類的鳶尾花資料  
    else:                         
        data1 = data.data[i].tolist()
        data1.append('virginica')
        virginica_data.append(data1)

#生成新的陣列,每個元素包含四個特徵+類別 newdata=(setosa_data ,versicolor_data,virginica_data) print(newdata)

執行結果: