1. 程式人生 > >ISLR第六章Linear Model Selection and Regularization

ISLR第六章Linear Model Selection and Regularization

another 訓練數據 16px style strong not 效率 找到 使用

技術分享圖片

本章主要介紹幾種可替代普通最小二乘擬合的其他一些方法。

Why might we want to use another fitting procedure instead of least squares?

better prediction accuracy(預測精度) and better model interpretability(模型解釋力).

主要介紹三種方法:

Subset Selection、Shrinkage、Dimension Reduction

6.1Subset Selection

6.1.1 Best Subset Selection

該方法從p 個預測變量中挑選出與響應變最相關的變量形成子集,再對縮減的變量集合使用最小二乘方法。

技術分享圖片

技術分享圖片

6.1.2 Stepwise Selection

由於運算效率的限制,當p 很大時,最優子集選擇方法不再適用,而且也存在一些統計學上的問題。隨著搜索空間始增大,

通過此方法找到的模型雖然在訓練數據上有較好的表現,但對新數據並不具備良好的預測能力。從一個巨大搜索空間中得到

的模型通常會有過擬合和系數估計方差高的問題。

ISLR第六章Linear Model Selection and Regularization