[統計學理論基礎] 置信區間
阿新 • • 發佈:2019-02-09
1. 點估計和區間估計
例如:刮刮卡
2. 置信區間
置信區間又稱估計區間,是用來估計引數的取值範圍的。在統計學中,一個概率樣本的置信區間(Confidence interval)是對這個樣本的某個總體引數的區間估計。
2.1 計算步驟
第一步:求一個樣本的均值
第二步:計算出抽樣誤差。
人們經過實踐,通常認為調查:
100個樣本的抽樣誤差為±10%;
500個樣本的抽樣誤差為±5%;
1200個樣本時的抽樣誤差為±3%;
第三步:用第一步求出的“樣本均值”加、減第二步計算的“抽樣誤差”,得出置信區間的兩個端點。
置信區間=點估計±(關鍵值× 點估計的標準差)
2.2 性質
窄的置信區間比寬的置信區間能提供更多的有關總體引數的資訊。
假設全班考試的平均分數為65分,則
置信區間 | 間隔 | 寬窄度 | 表達的意思 |
---|---|---|---|
0-100分 | 100 | 寬 | 等於什麼也沒告訴你 |
30-80分 | 50 | 較窄 | 你能估出大概的平均分了(55分) |
60-70分 | 10 | 窄 | 你幾乎能判定全班的平均分了(65分) |
2.3 置信水平
置信水平是指總體引數值落在樣本統計值某一區內的概率。
假如設定的置信水平為95%,即做100次抽樣,會有95個置信區間包含了總體平均值。
2.4 置信區間與置信水平、樣本量的關係
(1)樣本量對置信區間的影響:在置信水平固定的情況下,樣本量越多,置信區間越窄。
例項分析:
由上表得出:
1、在置信水平相同的情況下,樣本量越多,置信區間越窄。
2、置信區間變窄的速度不像樣本量增加的速度那麼快,也就是說並不是樣本量增加一倍,置信區間也變窄一半(實踐證明,樣本量要增加4倍,置信區間才能變窄一半),所以當樣本量達到一個量時(通常是1,200,如上例三個國家各抽了1,200個消費者),就不再增加樣本了。
(2)置信水平對置信區間的影響:在樣本量相同的情況下,置信水平越高,置信區間越寬。
2.5 例項分析
美國做了一項對總統工作滿意度的調查。在調查抽取的1,200人中,有60%的人讚揚了總統的工作,抽樣誤差為±3%,置信水平為95%;如果將抽樣誤差減少為±2.3%,置信水平降到為90%。則兩組數字的情況比較如下:
由上表得出:
在樣本量相同的情況下(都是1,200人),置信水平越高(95%),置信區間越寬。