[概率統計]—中心極限定理
什麼是中心極限定理
中心極限定理Central Limit Theorem:設從均值為μ、方差為σ^2;(有限)的任意一個總體中抽取樣本量為n的樣本,當n充分大時,樣本均值的抽樣分佈近似服從均值為μ、方差為σ^2/n的正態分佈。
注意:原來的分佈不一定要符合正態分佈,可以是任何的分佈,可以是離散也可以是連續,即無要求。n為sample size,每次取n個樣本,每次樣本的mean,分別為: 。這些樣本均值的分佈似正態分佈。當n到達一定大時,sample mean的頻率分佈很好符合normal distribution。
在同樣取樣次數,例如取10000次樣本均值,n越大,skew和kurtosis越接近零,說明n越大,越接近正態分佈。這個可以想象,n=1,就如同原來的分佈,n→∞時,mean就是μ,無方差的正態分佈,直線一條。
正態分佈適用於樣本均值,不管原來分佈是怎樣,即sampling distribution of the sample mean當sample size n越大時,越趨向正態分佈,且收斂得很快,即n=10的或者更小的時候已經和正態分佈非常相似,故用途非常廣泛。
注意是趨向,例如有些分散式有範圍的,而正態分佈只有x趨向±∞時,才為0。
中心極限定理的例子
中心極限定理的應用範圍很廣泛,例如我們知道一個分佈(可以是非正態分佈)的均值和標準差,例如一個戶外飲水的例子,當我們組織一個50人的隊伍時,這50人的人均飲水量符合正態分佈,帶多少水有90%概率能完全滿足。這就是推導和的例子。
在實際的應用情景中,通常取樣情況可知,而總本情況不詳,需要估計總本情況,如下面置信區間的例子:You sample 36 apples from you farm‘s harvest of over 200,000 apples. The mean weight of the sample is 112 grams (with a 40 gram sample standard deviation). What is the probability that the mean weight of all 200,000 apples is within 100 and 124 grams?
這裡給出一個樣本集的情況,這36個樣本(或者n=36的一次樣本集取樣中)=112,這36個樣本的σ=40。注意這裡給出的是一個樣本集的情況,不是多個樣板集的sampling distribution of the sample mean。從樣本的方差,可以估算總本方差。
還記得無偏差樣本方差嗎?是除以n-1,而不是n,無偏差樣本方差,可以近似為總本方差σ,進而可得樣本均值的方差
這個題目的相當於
然後查一下z table就可以了,Z score近似為1.8,查Z table可得此區間的概率為92.8%。