Python分割訓練集和測試集的方法示例
阿新 • • 發佈:2020-01-09
資料集介紹
使用資料集Wine,來自UCI 。包括178條樣本,13個特徵。
import pandas as pd import numpy as np df_wine = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data',header=None) df_wine.columns = ['Class label','Alcohol','Malic acid','Ash','Alcalinity of ash','Magnesium','Total phenols','Flavanoids','Nonflavanoid phenols','Proanthocyanins','Color intensity','Hue','OD280/OD315 of diluted wines','Proline']
分割訓練集和測試集
隨機分割
分為訓練集和測試集
方法:使用scikit-learn中model_selection子模組的train_test_split函式
from sklearn.model_selection import train_test_split X,y = df_wine.ix[:,1:].values,df_wine.ix[:,0].values X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.25,random_state=0)#隨機選擇25%作為測試集,剩餘作為訓練集
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支援我們。