numpy數據集練習
阿新 • • 發佈:2018-10-14
數據集 int num 哪些 png 類別 bsp name ets
1. 安裝scipy,numpy,sklearn包
2. 從sklearn包自帶的數據集中讀出鳶尾花數據集data
3.查看data類型,包含哪些數據
#加載numpy包 import numpy #加載sklearn包 from sklearn.datasets import load_iris #讀出鳶尾花數據集data data=load_iris() #查看data類型 print(type(data)) #查看數據內容 print(data.keys())
運行結果如下:
4.取出鳶尾花特征和鳶尾花類別數據,查看其形狀及數據類型
#鳶尾花的四個特征 data_feature= data.feature_names iris_data=data.data print(data_feature) print(iris_data) #鳶尾花的三個類別 data_target =data.target_names print(data_target) iris_data=data.target print(iris_data) #數據類型 type(iris_data)
運行結果如下:
5.取出所有花的花萼長度(cm)的數據
#鳶尾花花萼長度的數據 sepal_length=numpy.array(list(len[0] for len in data[‘data‘])) print(sepal_length)
運行結果如下:
6.取出所有花的花瓣長度(cm)+花瓣寬度(cm)的數據
#鳶尾花花瓣長度的數據 petal_length=numpy.array(list(len[2] for len in data[‘data‘])) print(petal_length)
#鳶尾花花瓣寬度的數據 petal_width=numpy.array(list(len[3] for len in data[‘data‘])) print(petal_width)
運行結果如下:
7.取出某朵花的四個特征及其類別
#取出某朵花的四個特征 print(data.data[0]) #取出某朵花的類別 print(data.target_names[0])
運行結果如下:
8.將所有花的特征和類別分成三組,每組50個
9.生成新的數組,每個元素包含四個特征+類別
#定義三個列表來存放不同類型花朵的類別 setosa_data = [] versicolor_data = [] virginica_data = [] # for i in range(0,150): #生成為setosa類的鳶尾花花數據 if data.target[i] == 0: data1 = data.data[i].tolist() data1.append(‘setosa‘) setosa_data.append(data1) #生成為versicolor類的鳶尾花數據 elif data.target[i] == 1: data1 = data.data[i].tolist() data1.append(‘versicolor‘) versicolor_data.append(data1) #剩下的為virginica類的鳶尾花數據 else: data1 = data.data[i].tolist() data1.append(‘virginica‘) virginica_data.append(data1) #生成新的數組,每個元素包含四個特征+類別 newdata=(setosa_data ,versicolor_data,virginica_data) print(newdata)
運行結果如下:
numpy數據集練習