1. 程式人生 > >分割訓練-測試資料:sklearn.model_selection.train_test_split()

分割訓練-測試資料:sklearn.model_selection.train_test_split()

定義:

train_test_split(*arrays, 
test_size=0.25,
train_size=None,
random_state=None,
shuffle=True,
statify=None)

返回:列表
引數:

  • *arrays:資料集。
  • test_size:如果為float,表示測試資料佔比。如果為int,表示測試資料數量。如果為None,跟隨train_size。預設為0.25。
  • train_size:訓練資料數量,同test_size。預設跟隨test_size。
  • random_state:隨機數生成器。預設使用np.random的RandomState例項。
  • shuffle:是否打亂。預設打亂。
  • statify:陣列。資料以分層方式分割,使用此作為標籤,預設不進行。

例項:

data_train, data_test, label_train, label_test = train_test_split(data, label)