1. 程式人生 > >數理統計(一)-期望和方差

數理統計(一)-期望和方差

#######################################################################################

#######################################################################################

關鍵詞:期望方差,表達符號

1.期望的由來:

假若通俗的講概率P是對每一個可能發生事件的描述,那麼他是存在一定的缺陷的,因為他無法整體(指的是所有事件)的事件發生的情況進行公平衡量。因此我們需要引入一個新的衡量制度---期望

什麼是期望

在概率論和統計學中,一個離散性隨機變數的期望是試驗中每次可能結果的概率乘以其結果的總和。換句話說,

期望是隨機試驗在同樣的機會下重複多次的結果計算出的等同“期望”的平均值。需要注意的是,期望並不一定等同於常識中的“期望”。“期望”也許與每一個結果都不相等。

例子:擲一枚六面篩子,其點數的期望是3.5,計算方式如下:

每天一點統計學——期望和方差

對於擲篩子來講,我每次投擲骰子可能最後得到的結果值是3.5(此處和實際情況有所偏離,因為骰子數為整數,此處僅為一個估計值,也可以看為每投一次最終得到的數值為3&4的可能性比較大)

總結:期望是隨機試驗在同樣的機會下重複多次的結果計算出的等同“期望”的平均值

期望的計算公式

期望和均值有些類似,甚至計算方式也類似,但它描述的是概率分佈。為了求出期望需要將每個數值x乘以該數值的發生概率,然後將所有結果求和

每天一點統計學——期望和方差

下圖是一張拉老虎機的結果概率圖,x表示贏錢的數量,P(X=x)表示概率(每一類事件發生的概率均不一樣):

每天一點統計學——期望和方差

E(X) = (-1*0.977) + (4*0.008) + (9*0.008) + (14*0.006) + (19*0.001) = -0.77

這個結果表示:你能夠期望在每一局賠掉0.77元。(也可以通俗的講你每次賠錢的數值為0.77)

期望指出一個變數的典型值或平均值,但並不提供有關數值分散性的任何資訊,也就是說期望並不能反映一個變數未來的變化情況。一個遊戲者玩老虎機,並不是為了每一局遊戲輸掉0.77元,他更希望的是能有好運氣贏得更多的錢。這個時候方差就起作用了。


2.方差的由來:每個數值與平均值間距離大小(均為正數)

Var(x) =E[(x-μ)^2]=E[(x-_x_)^2]

          =∑{[(x-μ)^2]*P(X)}(此處推導見:)

其中μ是期望E(x)的另外一種寫法。E(x)=μ

接著上面老虎機收益的例子,求出老虎機收益的方差如下:

Var(x) =E(x-μ)2

= (-1+0.77)2 * 0.977 + (4+0.77)2*0.008 + (9+0.77)2*0.008 + (14+0.77)2*0.006)+ (19+0.77)2*0.001

= 2.6971

標準差是取方差的平方根,計算公式如下:

每天一點統計學——期望和方差

標準差的計算公式

變化的期望和方差

如果上面拉老虎機的規則變化了,賭資增加了,變化後的結果概率圖如下:

每天一點統計學——期望和方差

計算可得出:

E(Y) = -0.85, Var(Y) = 67.4275

通過前後兩次期望、方差的對比,可以發現它們之間的如下關係:

E(Y) = 5 * E(X) + 3,

Var (Y) = 5*5* Var(X)

新舊期望、方差如果基礎概率保持不變,那麼它們之間必定存在以下關係:

每天一點統計學——期望和方差

這就是所謂的線性變化,因為X發生的是線性變化,即基礎概率保持不變,但數值變為新值,其形式為:aX + b。

獨立觀測值

如果老虎機的遊戲規則保持不變,但遊戲者同時玩多個老虎機,並且每個老虎機的期望、方差都分別為E(x)、Var(x)。這時每個老虎機的隨機變數值都是一個隨機變數值,表示為x1,x2,...xn。這時,期望、方差存在以下關係:

每天一點統計學——期望和方差