1. 程式人生 > >Machine Learning-過擬合和欠擬合問題

Machine Learning-過擬合和欠擬合問題

過擬合(訓練樣本自身特點及非一般特性當作重要特性

模型學習的太好,記住了樣本的非一般特性。個人理解為比如對人的特徵(鼻、耳、嘴等)學習效果良好。假如訓練資料為黃人和黑人的樣本圖片。模型可以在訓練資料表現出色,根據特徵進行分類。此時過擬合就是指訓練過程中記著一些非重要特徵。例如,黃人和黑人腳趾甲長度(這為非一般特徵),從而預測新樣本時。原本可以根據一般特徵很輕易的預測是否黃種人。但是由於模型過於強大,預測失敗。

欠擬合 

模型學習能力不夠好,即學習到某些一般特性,假如只會根據鼻樑的高低程度來判別是否為黃種人

樣本為:白種人

實際預測為:黃種人(誤以為高鼻樑就是黃種人)