1. 程式人生 > >大樹定理(LOLN)應用

大樹定理(LOLN)應用

sam average 應用 方案 多少 nbsp n) 抽樣 bin

1.背景

為了調查上海市的平均工資,怎麽才能得到一個比較真實的值。

2.分析

一個可行的方法是可以通過抽樣來計算平均工資,即通過樣本的均值來估計總體的均值。

LOLN:

The average of many independent samplesis(withhighprobability) close to the mean of the underlying distribution.

可以認為工資服從正太分布,那麽這個樣本取多大,也就是說要做多少份調查問卷。

大樹定律表明在樣本很大的情況下,樣本的平均值接近總體平均值,用數學表示為:

P(|X - 0.5|< 0.1) =1 X 代表樣本空間n的均值 | p( 0.4 < x< 0.6) =1

3.方案

1. 假設樣本空間 n = 10

取樣本服從均勻分布,也就是各行各業取得樣本概率是一樣的,p(x) = 1/10 , E(x) = 0.6 當樣本空間中取到第六次時候, E(x) = 0.6

同理, E(x)= 0.4 取到第4次

假設工資遵從正太分布 :

pbinom(6, 10 , 0.5) - pbinom(4, 10 ,0.5) = 0.4511719

這個結果遠小於1, 說明取得樣本太少, 不確定性因素太多

假設樣本總數n = 100

pbinom(60,100,0.5) - pbinom(39,100,0.5) = 0.9647998

假設樣本總數 n = 1000

pbinom(600,1000,0.5) - pbinom(400,1000,0.5) =1

4.結論

如果樣本空間總數取到1000,也就是發1000份調查問卷, 即可得到平均工資。概率為1說明必然事件。

大樹定理(LOLN)應用