單一樣本Wilcoxon符號秩檢驗
資料要求:單峰對稱分佈,資料在其兩邊分佈的疏密情況是對稱的
很過不對稱的單峰資料分佈可能通過變換化為對稱分佈。多峰分佈通過混合分佈整體表示後,每一個分佈也可以用單峰對稱的分佈表示。就對稱分佈而言,對稱中心只有一個,中位數卻可能有很多個。
例子:
-0.27 -0.03 -0.56 -0.14 -0.15 30 80 100
對資料來說,0是這組資料的中位數,有相等數量的正號和負號;如果只看秩,而不看資料的取值,直覺上是一個以0為中心樣本。但實際上,取負值的資料相對比較密,取正值的資料相對比較稀疏,這不滿足對稱要求對稱中心兩邊的分佈相同的特點。為什麼符號的做法失敗了?問題出在沒有考慮資料絕對值的大小上,
Wilcoxon符號秩統計量的思想是:首先把樣本的絕對值|X1|、|X2|、|X3|……|Xn|排序,其順序統計量為|X|(1)、|X|(2)、|X|(3)……|X|(n)。如果資料關於零點對稱,對稱中心兩側資料的疏密和取負值的資料交錯出現,取正值資料在樣本絕對值樣本中的秩和與取負值資料在絕對值樣本中的秩和應近似相等
符號表示:
Rj : |Xj|在絕對值樣本中的秩,即|Xj|=|X|(Rj)
S(x) : 表示示性函式I(x>0),若x>0時為1,否則為0
Dj : 反秩,|XDj|=|X|(j)
Wilcoxon符號秩統計量:
W+ = SUM(jW
例子:
X1 | X2 | X3 | X4 | X5 | X6 |
9 | 13 | -7 | 10 | -18 | 4 |
|X|(3) | |X|(5) | |X|(2) | |X|(4) | |X|(6) | |X|(1) |
R1=3 | R2=5 | R3=2 | R4=4 | R5=6 | R6=1 |
W3=1 | W5=1 | W2=0 | W4=1 | W6=0 | W1=1 |
D3=1 | D5=2 | D2=3 | D4=4 | D6=5 | D1=6 |
W+ = 3+5+4+1 =13
假設樣本點X1,X2,……,X
過程:
1)計算|Xi - M0|;樣本點到M0的距離,(相間出現)
2)將上面n個絕對值排序,並找到他們的n個秩,如果有相同的樣本點,每個點取平均秩
3)令W+等於Xi - M0 > 0的|Xi - M0|的秩的和,而W-等於Xi - M0 < 0的|Xi - M0|的秩的和,注意:W+ + W- = n(n+1)/2
4)雙邊檢驗 H0 :M = M0,W+ 與W-近似相等
單邊檢驗 H0 :M <= M0,W+ = W-
單邊檢驗 H0 :M => M0,W+ = W-
R語言程式
(之後補)