1. 程式人生 > >擬合工具箱的幾個誤差引數說明,SSE,MSE,RMSE,R-square

擬合工具箱的幾個誤差引數說明,SSE,MSE,RMSE,R-square

使用過 Matlab 擬合 優化 和統計等 工具箱 的網友,會經常遇到下面幾個名詞:

SSE(和方差、誤差平方和):The sum of squares due to error
MSE(均方差、方差):Mean squared error
RMSE(均方根、標準差):Root mean squared error
R-square(確定係數):Coefficient of determination
Adjusted R-square:Degree-of-freedom adjusted coefficient of determination


下面我對以上幾個名詞進行詳細的解釋下,相信能給大家帶來一定的幫助!!

一、SSE(和方差)
該統計 引數 計算的是擬合 資料 和原始資料對應點的誤差的平方和,計算公式如下
SSE,MSE,RMSE,R-square(轉)

SSE越接近於0,說明 模型 選擇和擬合更好,資料 預測 也越成功。接下來的MSE和RMSE因為和SSE是同出一宗,所以效果一樣

二、MSE(均方差)
該統計引數是預測資料和原始資料對應點誤差的平方和的均值,也就是SSE/n,和SSE沒有太大的區別,計算公式如下
mse.gif

三、RMSE(均方根)
該統計引數,也叫回歸 系統 的擬合標準差,是MSE的平方根,就算公式如下

rmse.gif

在這之前,我們所有的誤差引數都是基於預測值(y_hat)和原始值(y)之間的誤差(即點對點)。從下面開始是所有的誤差都是相對原始資料平均值(y_ba)而展開的(即點對全)!!!

四、R-square(確定係數)
在講確定係數之前,我們需要介紹另外兩個引數SSR和SST,因為確定係數就是由它們兩個決定的
(1)SSR:Sum of squares of the regression,即預測資料與原始資料均值之差的平方和,公式如下
ssr.gif
(2)SST:Total sum of squares,即原始資料和均值之差的平方和,公式如下
sst.gif
細心的網友會發現,SST=SSE+SSR,呵呵只是一個有趣的
問題 。而我們的“確定係數”是 定義 為SSR和SST的比值,故
rsquare.gif

其實“確定係數”是通過資料的變化來表徵一個擬合的好壞。由上面的表示式可以知道“確定係數”的正常取值範圍為[0 1],越接近1,表明 方程 變數 對y的解釋能力越強,這個模型對資料擬合的也較好