1. 程式人生 > >性能度量RMSE

性能度量RMSE

預測 數量 func erro sta bubuko 線性 bsp 並且

回歸問題的典型性能度量是均方根誤差(RMSE:Root Mean Square Error)。如下公式。

技術分享圖片

  1. m為是你計算RMSE的數據集中instance的數量。
  2. x(i)是第i個實例的特征值向量 ,y(i)是其label(期望的模型輸出)。如下:
    技術分享圖片
  3. X是包含了所有實例的特征值(不包含label)的矩陣。每行代表一個實例,並且每行等於x(i)向量的轉置:(x(i))T 。 下圖矩陣中的第一行為2中向量的轉置(列向量變為行向量)。
    技術分享圖片

  4. h是預測函數,當輸入是某實例的特征向量x(i) 應用函數之後,結果為?(i)=h(x(i)). ?也叫作y-hat. 比如:對第一個實例應用函數h後結果為158400,即?(1)
    =h(
    x(1))=158400。那麽預測誤差/錯誤為?(1)-y(1) = 158400 - 156400 = 2000.
  5. RMSE(X,h) 是在數據集X上應用於函數h計算的cost function。

以上,我們使用小寫斜體表示標量(m,y(i)),函數名(h)。小寫粗體表示向量(x(i)). 大寫粗體表示矩陣(X).

還有一種度量方法為: Mean Absolute Error. 理解起來也比較簡單。
技術分享圖片

下面是一張圖,通過線性關系生動解釋了RMSE。4個黑色的點是數據集(包括標簽),藍色的線是我們的預測函數h: ?=2.50x-2。從而可以求出RMSE為0.707.與之前不同的是這裏取m為3(m-1)而不是4。

結論: RMSE越小,說明模型越fit數據。

技術分享圖片

性能度量RMSE