1. 程式人生 > >西瓜書讀書筆記:第二章 模型評估與選擇

西瓜書讀書筆記:第二章 模型評估與選擇

2.1經驗誤差與過擬合

錯誤率:分類錯誤的樣本數佔樣本總數的比例

精度accuracy:1-錯誤率

誤差:學習器的實際預測輸出與樣本的真實輸出之間的差異

訓練誤差training error/經驗誤差empirical error:學習器在訓練集上的誤差

泛化誤差:在新樣本上的誤差

過擬合overfitting:泛化效能低,各類學習演算法都對過擬合有緩解的措施但無法徹底避免。機器學習面臨的問題通常是NP問題甚至更難,有效的學習演算法必然是在多項式時間內執行完成的,而P≠NP

欠擬合underfitting:泛化效能低,容易克服,如在決策樹學習中擴充套件分支,在神經網路學習中增加訓練輪數

模型選擇model selection:不同學習演算法、不同引數配置會產生不同模型,不能用泛化誤差和訓練誤差進行模型評估與選擇