ISLR第六章Linear Model Selection and Regularization
阿新 • • 發佈:2018-03-06
another 訓練數據 16px style strong not 效率 找到 使用
本章主要介紹幾種可替代普通最小二乘擬合的其他一些方法。
Why might we want to use another fitting procedure instead of least squares?
better prediction accuracy(預測精度) and better model interpretability(模型解釋力).
主要介紹三種方法:
Subset Selection、Shrinkage、Dimension Reduction
6.1Subset Selection
6.1.1 Best Subset Selection
該方法從p 個預測變量中挑選出與響應變最相關的變量形成子集,再對縮減的變量集合使用最小二乘方法。
6.1.2 Stepwise Selection
由於運算效率的限制,當p 很大時,最優子集選擇方法不再適用,而且也存在一些統計學上的問題。隨著搜索空間始增大,
通過此方法找到的模型雖然在訓練數據上有較好的表現,但對新數據並不具備良好的預測能力。從一個巨大搜索空間中得到
的模型通常會有過擬合和系數估計方差高的問題。
ISLR第六章Linear Model Selection and Regularization