迴歸模型-評估指標
阿新 • • 發佈:2019-01-15
一、多元線性迴歸
多元線性迴歸示例:
房價預測案例: 多重共線性(Multicollinearty): 是指線性迴歸模型中的 解釋變數(X)之間 由於存在高度相關關係而使模型估計失真或難以估計準確 多重共線性的影響: 上述模型引數($a_1,a_2...$)估值不準,有時候會導致出現相關性反轉。 如何發現多重共線性 對X變數探索兩兩之間的相關性(相關矩陣) 逐步迴歸概念是一種多元迴歸模型進行變數篩選的方法,篩選最少的變數來獲取最大化預測能力 三種方法: 向前選擇法 向後剔除法 逐步迴歸法
二、正則化防止過擬合
- L2正則化–嶺迴歸 Ridge Regression
-
在最小化殘差平方和的基礎上,增加L2範數的懲罰項:
- L1正則化–lasso迴歸
-
在最小化殘差平方和的基礎上,增加L1範數的懲罰項:
三、非線性迴歸:多項式迴歸
- 方法:
- 非線性迴歸的轉換——取對數
多項式迴歸程式碼實現:
sklearn.preprocession.PolynomialFeatures(
degree = 2, #階數
interaction_only = False,
include_bias = True
)
sklearn.linear_model.LinearRegression(
fit_intercept = True,
noemalize = False,
copy_X = True
)
3.1 迴歸模型評估指標
- 解釋方差(Explianed variance score):