1. 程式人生 > >迴歸模型-評估指標

迴歸模型-評估指標

這裡寫圖片描述

一、多元線性迴歸

多元線性迴歸示例:
y=b+a1x1+a2x2+···+anxn
這裡寫圖片描述
房價預測案例:
多重共線性(Multicollinearty):
    是指線性迴歸模型中的 解釋變數(X)之間
    由於存在高度相關關係而使模型估計失真或難以估計準確
多重共線性的影響:
    上述模型引數($a_1,a_2...$)估值不準,有時候會導致出現相關性反轉。

如何發現多重共線性
    對X變數探索兩兩之間的相關性(相關矩陣)

逐步迴歸概念是一種多元迴歸模型進行變數篩選的方法,篩選最少的變數來獲取最大化預測能力
三種方法:
    向前選擇法
    向後剔除法
    逐步迴歸法

二、正則化防止過擬合

L2正則化–嶺迴歸 Ridge Regression
mini=1n(YiYi^)=mini=1nε^i2
在最小化殘差平方和的基礎上,增加L2範數的懲罰項:
i=1n(yiβ0j=1pβjxij)2+λj=1pβj2=RSS+λj=1pβj2
L1正則化–lasso迴歸
mini=1n(YiYi^)=mini=1nε^i2
在最小化殘差平方和的基礎上,增加L1範數的懲罰項:
i=1n(yiβ0j=1pβjxij)2+λj=1p|βj|=RSS+λj=1p|βj|

三、非線性迴歸:多項式迴歸

方法:
非線性迴歸的轉換——取對數
多項式迴歸程式碼實現:
sklearn.preprocession.PolynomialFeatures(
                degree = 2,              #階數
                interaction_only = False,
                include_bias = True
) sklearn.linear_model.LinearRegression( fit_intercept = True, noemalize = False, copy_X = True )
3.1 迴歸模型評估指標
解釋方差(Explianed variance score):