1. 程式人生 > >numpy數據集練習

numpy數據集練習

數據集 int num 哪些 png 類別 bsp name ets

1. 安裝scipy,numpy,sklearn包

2. 從sklearn包自帶的數據集中讀出鳶尾花數據集data

3.查看data類型,包含哪些數據

#加載numpy包
import numpy
#加載sklearn包
from sklearn.datasets import load_iris 
#讀出鳶尾花數據集data
data=load_iris()
#查看data類型
print(type(data))
#查看數據內容
print(data.keys())

運行結果如下:

技術分享圖片

4.取出鳶尾花特征和鳶尾花類別數據,查看其形狀及數據類型

#鳶尾花的四個特征
data_feature= data.feature_names
iris_data
=data.data print(data_feature) print(iris_data) #鳶尾花的三個類別 data_target =data.target_names print(data_target) iris_data=data.target print(iris_data) #數據類型 type(iris_data)

運行結果如下:

技術分享圖片

技術分享圖片

5.取出所有花的花萼長度(cm)的數據

#鳶尾花花萼長度的數據
sepal_length=numpy.array(list(len[0] for len in data[data]))
print(sepal_length)

運行結果如下:

技術分享圖片

6.取出所有花的花瓣長度(cm)+花瓣寬度(cm)的數據

#鳶尾花花瓣長度的數據
petal_length=numpy.array(list(len[2] for len in data[data])) 
print(petal_length)
#鳶尾花花瓣寬度的數據
petal_width=numpy.array(list(len[3] for len in data[data])) 
print(petal_width)

運行結果如下:

技術分享圖片

技術分享圖片

7.取出某朵花的四個特征及其類別

#取出某朵花的四個特征
print(data.data[0])
#取出某朵花的類別
print
(data.target_names[0])

運行結果如下:

技術分享圖片

8.將所有花的特征和類別分成三組,每組50個

9.生成新的數組,每個元素包含四個特征+類別

#定義三個列表來存放不同類型花朵的類別
setosa_data = []
versicolor_data = []
virginica_data = []
#
for i in range(0,150):
    #生成為setosa類的鳶尾花花數據
    if  data.target[i] == 0: 
        data1 = data.data[i].tolist()
        data1.append(setosa)
        setosa_data.append(data1)
    #生成為versicolor類的鳶尾花數據  
    elif data.target[i] == 1: 
        data1 = data.data[i].tolist()
        data1.append(versicolor)
        versicolor_data.append(data1)
    #剩下的為virginica類的鳶尾花數據  
    else:                         
        data1 = data.data[i].tolist()
        data1.append(virginica)
        virginica_data.append(data1)
#生成新的數組,每個元素包含四個特征+類別
newdata=(setosa_data ,versicolor_data,virginica_data)
print(newdata)

運行結果如下:

技術分享圖片

numpy數據集練習