Excel/SPSS相關性及顯著性水平分析
對兩列資料的相關性以及顯著性水平的問題一直有困擾,由於對excel的鐘情,總是傾向於把資料分析放在excel中進行。本文簡單分析excel和SPSS對相關分析和顯著性水平的檢驗應用。
(1)方法介紹
Excel中相關性係數可以直接呼叫CORREL或者Pearson(檢視幫助發現兩者計算公式一樣,如下圖
SPSS中相關性分析在直接使用“分析—相關—雙變數”,然後設定相關係數計算方法以及置信區間。如下圖:
相關性的顯著水平分析,多數是根據設定的臨界值來判斷的,就是所謂的置信區間,常見的有99%,95%和90%,意思就是說在這個概率下顯著性的水平。比如,你說兩列資料相關吧,相關係數確實不大;你說他們不相關吧,理由也不充分,所以就有了顯著性水平分析的必要。相關係數的顯著性分析可以通過構建T統計量
其中r是相關係數,n是樣本量。如果,T值大於臨界值|ta|,表明在設定的置信水平上存在正相關;T值小於-|ta|,表明在設定的置信水平上存在負相關;如果-|ta|<T<|ta|,則認為不相關。
(2)例項分析
Excel: 現有兩列資料X和Y,首先,用correl函式做出兩組資料的相關係數(correl=0.626748);然後構建T統計量;最後計算99%,95%和90%的置信區間水平下的T臨界值(用函式T.INV)。步驟如下:
通過比較T統計值和臨界值很容易發現,T統計量(5.89)不在T臨界值內(-2.44<T<2.44),
SPSS:相對更簡單,直接通過設定置信區間即可,如下看到在99%下顯著相關,因為P=0.000,遠小於0.01的水平。