1. 程式人生 > 實用技巧 >深度學習:MAE 和 RMSE 詳解

深度學習:MAE 和 RMSE 詳解

https://blog.csdn.net/nanhuaibeian/article/details/102746602

平均絕對誤差MAE(mean absolute error) 和均方根誤差 RMSE(root mean squared error)是衡量變數精度的兩個最常用的指標,同時也是機器學習中評價模型的兩把重要標尺。
那兩者之間的差異在哪裡?它對我們的生活有什麼啟示?

文章目錄

一、定義

平均絕對誤差MAE(mean absolute error)是絕對誤差的平均值,它其實是更一般形式的誤差平均值。
因為如果誤差是[-1,0,1],平均值就是0,但這並不意味之系統不存在誤差,只是正負相互抵消了,因此我們要加上絕對值。它的定義表示式為:

換成更直接的表示式:

而均方根誤差 RMSE(root mean squared error

),也有資料稱為RMSD,也可以測量誤差的平均大小,它是預測值和實際觀測之間平方差異平均值的平方根。

它的定義為:

換成更直接的表示式為:

二、比較

只是看這些抽象的公式,很難幫我們理解它們之間的差異,讓我們來用一個實際的例子說明:

假設你想了解量女朋友在準時方面的特點,你統計了近兩個月女朋友約會的遲到時間(即是實際到達時間和約定時間的差距,或誤差,單位可以是分鐘,時間有誇大,我們只想你更好理解概念),如下:
第一個月遲到時間1 = ([5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5,1000])
第二個月遲到時間2= ([5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5, 10])

那麼我們來計算兩個序列的平均絕對誤差MAE和均方根誤差RMSE。

我們計算得出:
對於第一個月:平均絕對誤差 MAE1 = 62.5分鐘,均方根誤差 RMSE1:235.82 分鐘
對於第二個月:平均絕對誤差 MAE2 = 7.5分鐘,均方根誤差RMSE2 = 7.91分鐘

第一個月的平均絕對誤差 MAE(62.5) 與均方根誤差 RMSE(235.82) 之比接近1:4,
第二個月遲到時間的平均絕對誤差 MAE (7.5) 與均方根誤差 RMSE(7.91)之比約為1:1。

我們應該用哪個量衡量女朋友守時呢?
我們看到均方根誤差 RMSE 受異常值的影響更大。
如果我們去評判女朋友守時方面的進步,用RMSE標準,我們更可以看到她的進步之大,也許更要獎勵她一頓饕餮盛宴。

一般來說,我們應該期望 MAE 值比 RMSE 值小得多。
因為對於均方根誤差RMSE,每個誤差都是平方的。
這意味著單個誤差呈二次增長,並且對最終RMSE值有不同的影響。

這兩組誤差序列之間的惟一區別是序列1中的極值是1000,而不是10。
因此,我們看到較大的異常值對均方根誤差RMSE的影響更大。

三、應用

當我們處理較大的資料集時,我們不能檢查每個值以瞭解是否有一個或一些異常值,或者是否所有的錯誤都系統性地更高。

檢視 MAE 和 RMSE 的比值可以幫助我們理解是否存在較大但不常見的錯誤。

另外,在生活中,如果想準確的衡量一個人的進步有多大,以便造就和堅固TA的進步,你知道應該選擇哪一副眼鏡去看待了麼?