numpy資料集練習(運用jupyter notebook)
阿新 • • 發佈:2018-11-12
numpy資料集練習(運用jupyter notebook)
1. 匯入scipy,numpy,sklearn包
import scipy#載入scipy包 import numpy#載入numpy包 from sklearn.datasets import load_iris #載入sklearn包
2. 從sklearn包自帶的資料集中讀出鳶尾花資料集data
3.檢視data型別,包含哪些資料
from sklearn.datasets import load_iris #讀出鳶尾花資料集data data=load_iris()#檢視data型別 print(type(data))#檢視資料內容 print(data.keys())
執行結果:
4.取出鳶尾花特徵和鳶尾花類別資料,檢視其形狀及資料型別
#鳶尾花的4個特徵 data_feature= data.feature_names iris_data=data.data print(data_feature) print(iris_data) #鳶尾花的3個類別 data_target =data.target_names print(data_target) iris_data=data.target print(iris_data) #資料型別 type(iris_data)
執行結果:
5.取出所有花的花萼長度(cm)的資料
#鳶尾花花萼長度的資料 sepal_length=numpy.array(list(len[0] for len in data['data'])) print(sepal_length)#輸出結果
執行結果:
6.取出所有花的花瓣長度(cm)+花瓣寬度(cm)的資料
#鳶尾花花瓣長度的資料 petal_length=numpy.array(list(len[2] for len in data['data'])) print(petal_length) #鳶尾花花瓣寬度的資料 petal_width=numpy.array(list(len[3] forlen in data['data'])) print(petal_width)
執行結果:
7.取出某朵花的四個特徵及其類別。
#取出某朵花的4個特徵 print(data.data[2]) #取出某朵花的類別 print(data.target_names[2])
執行結果:
8.將所有花的特徵和類別分成三組,每組50個
9.生成新的陣列,每個元素包含四個特徵+類別
#定義三個列表來存放不同型別花朵的類別 setosa_data = [] versicolor_data = [] virginica_data = [] # for i in range(0,150): #生成為setosa類的鳶尾花花資料 if data.target[i] == 0: data1 = data.data[i].tolist() data1.append('setosa') setosa_data.append(data1) #生成為versicolor類的鳶尾花資料 elif data.target[i] == 1: data1 = data.data[i].tolist() data1.append('versicolor') versicolor_data.append(data1) #剩下的為virginica類的鳶尾花資料 else: data1 = data.data[i].tolist() data1.append('virginica') virginica_data.append(data1)
#生成新的陣列,每個元素包含四個特徵+類別 newdata=(setosa_data ,versicolor_data,virginica_data) print(newdata)
執行結果: