1. 程式人生 > >最好的評價線性迴歸的指標-R Squared

最好的評價線性迴歸的指標-R Squared

在學習線性迴歸的時候大多數教程會講到RMSE,MSE(MAE提到的較少)這兩個指標評價模型模型擬合的效果,當然MSE也就是模型的損失函式。

在分類模型中針對不同的資料我們可以用分類的準確度評價誰的模型效果較好,這兩者的量綱是一致的,但是在迴歸中預測不同的實際場景,比如一個預測股市,一個預測房價,比較MSE或者RMSE就不能比較誰好誰壞;所以將預測結果轉換為準確度,結果都在[0, 1]之間,針對不同問題的預測準確度,可以比較並來判斷此模型更適合預測哪個問題

1、計算方法


2、對公式的理解

  • :公式樣式與MSE類似,可以理解為一個預測模型,只是該模型與x無關,在機器學習領域稱這種模型為基準模型(Baseline Model)
    ,適用於所有的線型迴歸演算法;
  • 基準模型問題:不沒有考慮x的取值,只是很生硬的將所有的預測樣本的預測結果都認為是樣本y的均值
     A)因此對公式可以這樣理解:
  1. 分子是我們的模型預測產生的錯誤,分母是使用y等於y的均值這個模型所產生的錯誤
  2. 自己的模型預測產生的錯誤 / 基礎模型預測生產的錯誤,表示自己的模型沒有擬合住的資料,因此R2可以理解為,自己的模型擬合住的資料
  B)公式推理結論:
  1. R2 <= 1
  2. R2越大越好,當自己的預測模型不犯任何錯誤時:R2 = 1
  3. 當我們的模型等於基準模型時:R2 = 0
  4. 如果R2 < 0,說明學習到的模型還不如基準模型。  # 注:很可能資料不存在任何線性關係,用線性迴歸之前可以先對資料進行相關性檢驗,或者先對資料的殘差分佈進行判定

3)公式變形

  • R2    統計學上用來表示模型的擬合優度