1. 程式人生 > >[統計學理論基礎] 置信區間

[統計學理論基礎] 置信區間

1. 點估計和區間估計

例如:刮刮卡
這裡寫圖片描述

2. 置信區間

置信區間又稱估計區間,是用來估計引數的取值範圍的。在統計學中,一個概率樣本的置信區間(Confidence interval)是對這個樣本的某個總體引數的區間估計。

2.1 計算步驟

第一步:求一個樣本的均值
第二步:計算出抽樣誤差。
人們經過實踐,通常認為調查:
100個樣本的抽樣誤差為±10%;
500個樣本的抽樣誤差為±5%;
1200個樣本時的抽樣誤差為±3%;
第三步:用第一步求出的“樣本均值”加、減第二步計算的“抽樣誤差”,得出置信區間的兩個端點。
置信區間=點估計±(關鍵值× 點估計的標準差)

2.2 性質

窄的置信區間比寬的置信區間能提供更多的有關總體引數的資訊。
假設全班考試的平均分數為65分,則

置信區間 間隔 寬窄度 表達的意思
0-100分 100 等於什麼也沒告訴你
30-80分 50 較窄 你能估出大概的平均分了(55分)
60-70分 10 你幾乎能判定全班的平均分了(65分)

2.3 置信水平

置信水平是指總體引數值落在樣本統計值某一區內的概率。
假如設定的置信水平為95%,即做100次抽樣,會有95個置信區間包含了總體平均值。

2.4 置信區間與置信水平、樣本量的關係

(1)樣本量對置信區間的影響:在置信水平固定的情況下,樣本量越多,置信區間越窄。

例項分析:
這裡寫圖片描述
由上表得出:
1、在置信水平相同的情況下,樣本量越多,置信區間越窄。
2、置信區間變窄的速度不像樣本量增加的速度那麼快,也就是說並不是樣本量增加一倍,置信區間也變窄一半(實踐證明,樣本量要增加4倍,置信區間才能變窄一半),所以當樣本量達到一個量時(通常是1,200,如上例三個國家各抽了1,200個消費者),就不再增加樣本了。

(2)置信水平對置信區間的影響:在樣本量相同的情況下,置信水平越高,置信區間越寬。

2.5 例項分析

美國做了一項對總統工作滿意度的調查。在調查抽取的1,200人中,有60%的人讚揚了總統的工作,抽樣誤差為±3%,置信水平為95%;如果將抽樣誤差減少為±2.3%,置信水平降到為90%。則兩組數字的情況比較如下:
這裡寫圖片描述


由上表得出:
在樣本量相同的情況下(都是1,200人),置信水平越高(95%),置信區間越寬。