1. 程式人生 > 其它 >將sklearn包datasets中的iris 鳶尾花資料集轉為dataframe

將sklearn包datasets中的iris 鳶尾花資料集轉為dataframe

技術標籤:路漫漫python

將sklearn包datasets中的iris 鳶尾花資料集轉為dataframe

讀取鳶尾花資料集

import pandas as pd
from sklearn.datasets import load_iris
data = load_iris()
# 讀進來的data是個字典,檢視此字典的key, value來了解此資料集
for k, v in data.items():
    print(k, v)

target有三種類型,數值編號是0、1、2,分別對應’setosa’、‘versicolor’、‘virginica’
target有三種類型,數值編號是0、1、2,分別對應'setosa'、‘versicolor’、‘virginica’
資料集中每一列的含義如下:

在這裡插入圖片描述

將資料集轉換為DataFrame格式

df1 = pd.DataFrame(data['data'], columns=['SepalLengthCm', 'SepalWidthCm', 'PetalLengthCm', 'PetalWidthCm'])
print(df1.head())
df2 = pd.DataFrame(data['target'], columns=['Species'])
print(df2.head())
# 用concat合併兩個dataframe得到目標結果
df = pd.concat([df1, df2], axis=1)
print(df.sample(
20))