1. 程式人生 > >交叉驗證及其目的

交叉驗證及其目的

數據集 準確率 及其 結果 nbsp 常用 模型 方式 ros

首先,為什麽要交叉驗證:目的有兩個:

1.選擇合適的模型

2.選擇合適的參數

1.對於一個問題,可以用模型m1,m2,不知道哪個的準確率高,可以交叉驗證一下,從而選擇用哪個

2.對於一個模型,參數的選擇會影響結果,所以用交叉驗證選擇最合適的參數

然後,常用的交叉驗證的方式是k折交叉驗證(k-fold cross validation)

把數據集分為訓練集和測試集:

先把所有數據分成k組,其中k-1組作為訓練集,剩下的一組作為測試集,這樣有k種選法

把k種選法得到的訓練集和測試集進行模型訓練和測試,得到的結果平均,就是交叉驗證的結果。

還有一種方法,就是留n法,每次把n個數據作為測試集,留1法就是k折的一個特例。

交叉驗證及其目的