大樹定理(LOLN)應用
1.背景
為了調查上海市的平均工資,怎麽才能得到一個比較真實的值。
2.分析
一個可行的方法是可以通過抽樣來計算平均工資,即通過樣本的均值來估計總體的均值。
LOLN:
The average of many independent samplesis(withhighprobability) close to the mean of the underlying distribution.
可以認為工資服從正太分布,那麽這個樣本取多大,也就是說要做多少份調查問卷。
大樹定律表明在樣本很大的情況下,樣本的平均值接近總體平均值,用數學表示為:
P(|X - 0.5|< 0.1) =1 X 代表樣本空間n的均值 | p( 0.4 < x< 0.6) =1
3.方案
1. 假設樣本空間 n = 10
取樣本服從均勻分布,也就是各行各業取得樣本概率是一樣的,p(x) = 1/10 , E(x) = 0.6 當樣本空間中取到第六次時候, E(x) = 0.6
同理, E(x)= 0.4 取到第4次
假設工資遵從正太分布 :
pbinom(6, 10 , 0.5) - pbinom(4, 10 ,0.5) = 0.4511719
這個結果遠小於1, 說明取得樣本太少, 不確定性因素太多
假設樣本總數n = 100
pbinom(60,100,0.5) - pbinom(39,100,0.5) = 0.9647998
假設樣本總數 n = 1000
pbinom(600,1000,0.5) - pbinom(400,1000,0.5) =1
4.結論
如果樣本空間總數取到1000,也就是發1000份調查問卷, 即可得到平均工資。概率為1說明必然事件。
大樹定理(LOLN)應用