1. 程式人生 > 程式設計 >Python分割訓練集和測試集的方法示例

Python分割訓練集和測試集的方法示例

資料集介紹

使用資料集Wine,來自UCI 。包括178條樣本,13個特徵。

import pandas as pd
import numpy as np

df_wine = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data',header=None)
df_wine.columns = ['Class label','Alcohol','Malic acid','Ash','Alcalinity of ash','Magnesium','Total phenols','Flavanoids','Nonflavanoid phenols','Proanthocyanins','Color intensity','Hue','OD280/OD315 of diluted wines','Proline']

分割訓練集和測試集

隨機分割

分為訓練集和測試集

方法:使用scikit-learn中model_selection子模組的train_test_split函式

from sklearn.model_selection import train_test_split

X,y = df_wine.ix[:,1:].values,df_wine.ix[:,0].values
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.25,random_state=0)#隨機選擇25%作為測試集,剩餘作為訓練集

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支援我們。