1. 程式人生 > >訓練集,驗證集和測試集

訓練集,驗證集和測試集

要明確train/validation/test三個集合需要先了解什麼是hyperparameter。機器學習中模型的引數有的可以通過訓練獲得最優的值,而有些無法通過訓練獲得,只能通過人工設定,這部分需要人工設定的引數就是hyperparameters,比如KNN中的K值,神經網路中的網路層數,結構,SVM中的C值等。 三個集合在訓練中的使用途徑如下

  1. 給定hyperparameters,train/validation兩個集合,調整餘下的模型的引數,使得validation集合上最優
  2. 第一步中給出的模型在test集合上評估,得到模型分數
  3. 調節hyperparameters,轉步驟1
  4. 前三步反覆迭代,最終輸出一個在test上得分最高的模型