嶺迴歸與lasso迴歸
阿新 • • 發佈:2018-12-12
a. 什麼是嶺迴歸和lasso迴歸?為什麼要用嶺迴歸和lasso迴歸?嶺迴歸選參的一般原則是什麼。
對OLS進行範數1正則化叫Lasso迴歸。
對OLS進行範數2正則化叫嶺迴歸。
進行嶺迴歸和Lasso迴歸的主要目的:
1.解決病態矩陣的過擬合和欠擬合問題。
2.消除多重共線性造成的行列式趨近於0,從而引起的大系數問題。
選參遵循原則如下:
(1)在嶺迴歸中設計矩陣X已經中心化和標準化了,這樣可以直接比較標準化嶺迴歸係數的大小。可以剔除掉標準化嶺迴歸係數比較穩定且絕對值很小的自變數。
(2)隨著lambda的增加,迴歸係數穩定,震動趨於零的自變數也可以剔除。
(3)開始(lambda=0)十分大,但是隨著lambda的增加,迅速向0靠近的迴歸係數不重要。可以考慮剔除。
(4)開始(lambda=0)十分小,但是隨著lambda的增加,迴歸係數絕對值迅速增速很快,說明該係數重要。
(5)如果兩個係數已知不穩定,但從形狀上看,總體上來說和是穩定的,這兩個係數可以合併成一個新的係數。也可以選擇不合並,不影響預測效果。
(6)一直處在波動狀態的係數可以刪除 。
(7)不穩定的,尤其逐步發散的,一直波動的引數都可以剔除。