1. 程式人生 > >正態性檢驗SPSS

正態性檢驗SPSS

資料分佈形態的重要性

在資料分析過程中,資料的不同分佈形態將直接影響資料分析策略的選擇。因此,對資料序列分佈形態的判定是非常重要的內容。常見的資料分佈形態有正態分佈,隨機分佈(均勻分佈)、泊松分佈、指數分佈等,但在資料分析中,最重要的分佈形態是正態分佈,很多資料分析技術都是面向正態分佈的定距變數或者高測度的定序變數。

下面我們介紹SPSS常用的三種正態性檢驗方法。

SPSS判斷資料分佈策略

帶正態曲線直方圖

利用SPSS的選單分析環境:“分析”-“描述統計”-“頻率”,在繪圖選項選擇帶正態曲線的直方圖。


繪製帶正態曲線的直方圖通過對比直方圖與正態曲線的擬合程度,判定資料序列的分佈形態是否接近正態分佈。下面兩幅圖是某班級語文和數學成績,帶有正態曲線的直方圖。在圖形上,顯示出了與當前資料序列最接近的正態曲線。從圖中可知,語文成績分佈於正態曲線比較接近,而數學成績的分佈則與正態曲線相距甚遠。基於直方圖及其相近的正態曲線的擬合程度,可以判定資料序列是否符合正態分佈。


Q-Q圖和P-P圖

利用SPSS的選單分析環境:“分析”-“描述統計”-“P-P圖或Q-Q圖”。


利用Q-Q圖、P-P圖判斷資料序列是否接近正態分佈,P-P圖與Q-Q圖的判斷原理相同,區別在於橫縱座標的單位不同,P是累積比例,Q是分位數,下面以P-P圖為例說明。從左側的兩幅圖來看,語文的P-P圖,散點能夠與斜線很好的吻合,則說明該資料序列符合正態分佈,而數學的散點嚴重偏離斜線,說明該資料序列不符合正態分佈。

右側的兩幅圖成為反趨勢正態概率圖,以累積概率作為橫座標,以與標準正態分佈的偏差作為縱座標。因此,標準正態分佈是中部的水平線。儘管兩幅圖都有很多散點分佈在水平線兩側,但語文的縱座標單位在-0.06~0.06之間,而數學的單位在-0.3~0.3之間,相對於累積概率1來說,語文成績的偏差很小,可認為基本符合正態分佈。



K-S正態檢驗 

利用SPSS的選單分析環境:“分析”-“描述統計”-“1樣本K-S”。


利用SPSS的單變數K-S檢驗判斷資料序列是否接近正態分佈。利用直方圖/Q-Q圖/P-P圖來判斷資料序列的正態性,主要還是通過分析者的主觀判斷。而用K-S作正態性檢驗則是通過對比資料序列與標準正態分佈有沒有顯著性差異來判斷序列是否滿足正態分佈。下表是用SPSS作K-S正態性檢驗的結果,可以在最後一行得到語文的P值為0.2,大於0.05,說明語文成績與正態分佈沒有顯著性差別,而數學為0.000,小於0.05,可以認為數學成績與正態分佈由顯著性差異。

單一樣本 Kolmogorov-Smirnov 檢定

語文

數學

N

40

40

常態引數a,b

平均數

69.9825

78.0874

標準偏差

5.15620

12.84712

最極端差異

絕對

.103

.280

.069

.219

-.103

-.280

測試統計資料

.103

.280

漸近顯著性 (雙尾)

.200c,d

.000c

a. 檢定分配是常態的。

b. 從資料計算。

c. Lilliefors 顯著更正。

d. 這是 true 顯著的下限。