1. 程式人生 > >SPSS多元線性迴歸輸出結果的詳細解釋

SPSS多元線性迴歸輸出結果的詳細解釋

先說一句題外話,如果當年在大學裡數理統計等課程結合SPSS,SAS,R等軟體來講,應該效果會好很多。

最近做了一些用SPSS進行線性迴歸的實驗,還是感覺很多細節把握不好,這裡結合我的實驗結果,以及網上別人的介紹總結一下,先貼幾張SPSS的輸出:




下面簡單解釋一下這三張圖中的結果:

第一個表模型彙總表中,R表示擬合優度(goodness of fit),它是用來衡量估計的模型對觀測值的擬合程度。它的值越接近1說明模型越好。調整的R平方比調整前R平方更準確一些,圖中的最終調整R方為0.550,表示自變數一共可以解釋因變數55%的變化(variance),另外,由於使用的是StepWise Linear Regression (SWLR),分析——迴歸——線性——“方法”選擇“逐步”,所以模型1、2、3的R方逐漸增大,標準誤差逐漸減小。

(據網友的介紹:一般認為,擬合優度達到0.1為小效應(R方0.01),0.3為中等R方0.09),0.5為大(R方0.25),這是針對自然科學的一般界限。)

第二個表Anova表示方差分析結果,主要看F和sig值兩個,F值為方差分析的結果,是一個對整個迴歸方程的總體檢驗,指的是整個迴歸方程有沒有使用價值(與隨機瞎猜相比),其F值對應的Sig值小於0.05就可以認為迴歸方程是有用的。另外,從F值的角度來講:F的值是迴歸方程的顯著性檢驗,表示的是模型中被解釋變數與所有解釋變數之間的線性關係在總體上是否顯著做出推斷。若F>Fa(k,n-k-1),則拒絕原假設,即認為列入模型的各個解釋變數聯合起來對被解釋變數有顯著影響,反之,則無顯著影響。

這裡簡單對Fa(k,n-k-1)進行一下解釋,k為自變數個數,n為樣本容量,n-k-1為自由度。對於我的實驗中的情況來講,k=3,樣本容量為146,所以查表的時候應該差Fa(3,142),一般數理統計課本中都有F分佈表,a表示的顯著性水平(一般取0.05),但我們手頭不一定會有課本,就需要藉助於excel來查F表,開啟excel,在公式區輸入:=FINV(0.05,3,142),在單元格中即出現2.668336761,表中的F值顯著大於這個值,則認為各個解釋變數對因變數有顯著影響。

需要注意的是,方差分析是對多個自變數的總體檢驗,而不是單個自變數(單個自變數在係數表中,為單樣本T檢驗),這就是第三個表迴歸係數表中的內容。

係數表格列出了自變數的顯著性檢驗結果(使用單樣本T檢驗),最後一列為T檢驗的sig,表中均小於0.05,說明自變數對因變數具有顯著影響,B表示各個自變數在迴歸方程中的係數,負值表示IPGF這個自變數對因變數有顯著的負向影響,但是由於每個自變數的量綱和取值範圍不同,基於B並不能反映各個自變數對因變數影響程度的大小,這時候我們就要藉助標準係數。目前表格中的“試用版”實際上是Beta的意思,此時數值越大表示對自變數的影響更大。

從這個分析過程來看,這個實驗結果還挺理想的。