各類常用統計檢驗
P與SIG值
p值為結果可信程度的一個遞減指標,p值越大,我們越不能認為樣本中變數的關聯 是總體中各變數關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。如p=0.05提示樣本中變數關聯有5%的可能是由於偶然性造成 的。就是在這個樣本集下,出現這種情況的概率,有的也寫成統計顯著性(sig)。
假設檢驗的兩類錯誤
第一類錯誤:H0假設是真實正確的,但是假設檢驗卻拒絕了H0;反第一類錯誤的原因是小概率事件也有可能發生,因此第一類錯誤發生的概率就是小概率事件發生的概率 第二類錯誤:H0假設是錯誤的,但是假設檢驗卻接受了H0;產生原因是在一次抽樣檢驗中沒有發生不合理的結果。 我們希望兩者的錯誤率越小越好,但是兩者是一個此消彼長的關係,因為若減小那麼第一類錯誤發生的概率減小了,但是假設檢驗判斷為接受H0假設的概率增大了,所以第二類錯誤發生的概率增大了;反之一樣。
U檢驗與T檢驗
單正態總體均值檢驗
理論上要求樣本來自正態分佈總體。但在實用時,只要樣本例數n較大(利用中心極限定理),或n小但總體標準差σ已知時,就可應用u檢驗;n小且總體標準差σ未知時,可應用t檢驗,但要求樣本來自正態分佈總體。兩樣本均數比較時還要求兩總體方差相等。
單正態總體均值和方差檢驗
知道總體方差,檢測總體均值: 設為樣本均值,是一已知常數; H0:; 這時候採用U統計量: 雙邊檢驗拒絕域在正態分佈兩端。 不知道總體方差,檢測總體均值: S是樣本標準差;用T統計量: 雙邊檢驗拒絕域在t分佈兩端。 總體方差檢驗 不管知不知道,都可以用卡方檢驗,設為已知常數,為要檢測得總體方差,H0: 只不過統計量形式有不同: 已知時: 未知時:
兩個正態總體均值和方差檢驗
兩個樣本集合X、Y; 知道總體方差,檢測兩總體均值是否相等: H0: 利用U統計量: 未知道總體方差,但是知道兩個方差相等,檢測兩總體均值是否相等: 未知道總體方差,檢測兩總體均值是否相等: 其中:
兩正態總體得方差檢驗
與單個得檢驗不同,這裡要用到F檢驗;