1. 程式人生 > >中心極限定理和大數定理

中心極限定理和大數定理

統計學習方法介紹經驗風險的概念(相關筆記)時,提及大數定理,下面是個人對大數定理以及跟它有點相近的中心極限定理的理解:

1.大數定理的意思就是說當樣本數夠大的時候,樣本均值近似相應隨機變數的期望。舉個擲骰子的例子,擲n次骰子,記錄每次正面朝上的點數,最終可以算得一個平均值。現假設隨機變數X表示投骰子每次朝上的點數,那麼當n趨於無窮大,由n個樣本數計算得到的均值會趨向EX。這也是我們常見的統計中用樣本均值近似期望的做法。

2.中心極限定理的內容說的就是統計學裡面經常用到的,樣本均值服從期望為u,方差為Var(X)/2的正態分佈。還是用上面投骰子的例子。做m次實驗,每次實驗投若干次骰子,可以得到一個均值Si,那麼假設隨機變數S表示每次實驗的均值,會有E

S=EX,即 EX¯=EX

更多具體內容參見知乎網友的回答

中心極限定理: 大量相互獨立的隨機變數,其均值(或者和)的分佈以正態分佈為極限(意思就是當滿足某些條件的時候,比如Sample Size比較大,取樣次數區域無窮大的時候,就越接近正態分佈)。而這個定理amazing的地方在於,無論是什麼分佈的隨機變數,都滿足這個定理。

比如現在有一個奇形怪狀的六面骰子,並且六面上的點數分別為1,1,2,3,3,5。
我們現在開始擲這個骰子(可視為一個隨機過程),然後記錄下每次朝上的點數(每次扔骰子可視為一個隨機變數)。先扔6次好了。 第一次:

那麼第一次結果的均值:

然後你再擲五次,分別求得每次結果的均值,於是你得到了 現在神奇的地方是,這六個值的分佈,有點像是正態分佈。
然後你再繼續瘋狂的擲這個奇形怪狀的骰子,擲了n次,並且分別對每次的結果都求了均值,這時候你得到了
當n越大,這n個值的分佈就越接近正態分佈,而當n趨向正無窮時,這無窮個均值的分佈就是正態分佈了!並且!這還沒有結束!!
並且!這個正態分佈的均值和投擲奇形怪狀骰子並記錄朝上的點數這個隨機過程的均值是一!樣!的!
這樣,因為我們沒有辦法得到這個奇形怪狀骰子的分佈函式,就沒有辦法直接通過求期望的公式得到這個隨機過程的期望。而運用中心極限定理,我們就能夠得到這個隨機過程的期望了。

大數定理簡單的可以描述為,如果有一個隨機變數X,你不斷的觀察並且取樣這個隨機變數,得到了n個取樣值,,然後求得這n個取樣值得平均值,當n趨向於正無窮的時候,這個平均值就收斂於這個隨機變數X的期望。
公式為:

舉個例子。
比如你有一個盒子,盒子裡面有100個硬幣,你每次搖晃盒子然後數一數有多少硬幣正面朝上。很容易算出這個隨機變數的期望為50。
第一次搖,數出有55個硬幣正面朝上,=55 第二次搖,數出有65個硬幣正面朝上,=(55+65)/2=60
第三次搖,數出有70個硬幣正面朝上,=(55+65+70)/3= …………
當你搖的次數足夠多(無數次)時,最終這個平均值就會等於50。