方差、標準差和均方根誤差的區別總結
一、方差
方差(variance):是在概率論和統計方差衡量隨機變數或一組資料時離散程度的度量。概率論中方差用來度量隨機變數和其數學期望(即均值)之間的偏離程度。統計中的方差(樣本方差)是各個資料分別與其平均數之差的平方的和的平均數。在許多實際問題中,研究方差即偏離程度有著重要意義。
公式表示:對於一組隨機變數或者統計資料,其期望值我們由E(X)表示,即隨機變數或統計資料的均值,然後對各個資料與均值的差的平方求和:,最後對它們再求期望值就得到了方差公式。
這個公式描述了隨機變數或統計資料與均值的偏離程度。
二、方差與標準差
根號裡的內容就是我們剛提到的方差:
那麼問題來了,既然有了方差來描述變數與均值的偏離程度,那又搞出來個標準差幹什麼呢?原因是:方差與我們要處理的資料的量綱是不一致的,雖然能很好的描述資料與均值的偏離程度,但是處理結果是不符合我們的直觀思維的。
舉個例子:一個班級裡有60個學生,平均成績是70分,標準差是9,方差是81,成績服從正態分佈,那麼我們通過方差不能直觀的確定班級學生與均值到底偏離了多少分,通過標準差我們就很直觀的得到學生成績分佈在[61,79]範圍的概率為0.6826,即約等於下圖中的34.2%*2
三、均方差、均方根誤差
標準差(Standard Deviation),中文環境中又常稱均方差,但不同於均方根誤差(
從上面定義我們可以得到以下幾點:
1、均方差就是標準差,標準差就是均方差;
2、均方根誤差不同於均方差;
3、均方根誤差是各資料偏離真實值的距離平方和的平均數的開方;
舉個例子:我們要測量房間裡的溫度,很遺憾我們的溫度計精度不高,所以就需要測量5次,得到一組資料[x1,x2,x3,x4,x5],假設溫度的真實值是x,資料與真實值的誤差e=x-xi 。
那麼均方誤差
均方根誤差的公式一般為:
總的來說,均方差(標準差)是資料序列與均值的關係,而均方根誤差是資料序列與真實值之間的關係。因此,標準差是用來衡量一組數自身的離散程度,而均方根誤差是用來衡量觀測值同真值之間的偏差,它們的研究物件和研究目的不同,但是計算過程類似。
四、均方根值
均方根值(RMS)也稱作為效值,它的計算方法是先平方、再平均、然後開方。