性能度量RMSE
阿新 • • 發佈:2018-07-18
預測 數量 func erro sta bubuko 線性 bsp 並且
回歸問題的典型性能度量是均方根誤差(RMSE:Root Mean Square Error)。如下公式。
- m為是你計算RMSE的數據集中instance的數量。
- x(i)是第i個實例的特征值向量 ,y(i)是其label(期望的模型輸出)。如下:
- X是包含了所有實例的特征值(不包含label)的矩陣。每行代表一個實例,並且每行等於x(i)向量的轉置:(x(i))T 。 下圖矩陣中的第一行為2中向量的轉置(列向量變為行向量)。
- h是預測函數,當輸入是某實例的特征向量x(i) ,應用函數之後,結果為?(i)=h(x(i)). ?也叫作y-hat. 比如:對第一個實例應用函數h後結果為158400,即?(1)
- RMSE(X,h) 是在數據集X上應用於函數h計算的cost function。
以上,我們使用小寫斜體表示標量(m,y(i)),函數名(h)。小寫粗體表示向量(x(i)). 大寫粗體表示矩陣(X).
還有一種度量方法為: Mean Absolute Error. 理解起來也比較簡單。
下面是一張圖,通過線性關系生動解釋了RMSE。4個黑色的點是數據集(包括標簽),藍色的線是我們的預測函數h: ?=2.50x-2。從而可以求出RMSE為0.707.與之前不同的是這裏取m為3(m-1)而不是4。
結論: RMSE越小,說明模型越fit數據。
性能度量RMSE