1. 程式人生 > >模型評估與選擇

模型評估與選擇

訓練 style 分支 可能 決策 擬合 比例 適用於 自身

1、經驗誤差與過擬合

  錯誤率為分類錯誤的樣本數占樣本總數的比例,相應的精度=1-錯誤率,模型的實際預測輸出與樣本的真實輸出之間的差異稱為“誤差”,模型在訓練集上的誤差稱為“訓練誤差”,在新樣本上的誤差稱為“泛化誤差”。我們希望得到在新樣本上表現好的學習器,也就是泛化誤差小的學習器,但是並不是泛化誤差越小越好,我們應該盡可能出訓練樣本中學出適用於所有潛在樣本的“普遍規律”,然而模型把訓練樣本學的太好,很可能把訓練完本自身的特點當做所有潛在樣本都具有的一般性質,這樣就導致了泛化性能下降,這種現象稱為“過擬合

”,相對立的是“欠擬合”,是指訓練樣本的一般性質尚未學好。欠擬合比較容易克制,例如在決策樹學習中擴展分支、在神經網絡中增加訓練輪數

模型評估與選擇