1. 程式人生 > >線性迴歸標準化 R^2, T檢驗, F檢驗

線性迴歸標準化 R^2, T檢驗, F檢驗

1、標準化

對於多元線性迴歸需要對各個自變數進行標準化,排除單位的影響。

標準化方法:即將原始資料減去相應變數的均數後再除以該變數的標準差,而標準化得到的迴歸方程稱為標準化迴歸方程,相應得迴歸係數為標準化迴歸係數。

2T檢驗

T檢驗是對各個迴歸係數的檢驗,絕對值越大,sig就越小,sig代表t檢驗的顯著性,在統計學上,sig<0.05一般被認為是係數檢驗顯著,顯著的意思就是你的迴歸係數的絕對值顯著大於0,表明自變數可以有效預測因變數的變異,做出這個結論你有5%的可能會犯錯誤,即有95%的把握結論正確。

3F檢驗

F檢驗是對所有迴歸係數的檢驗,代表你進行迴歸的所有自變數的迴歸係數的一個總體檢驗,如果sig<0.05,

說明至少有一個自變數能夠有效預測因變數,這個在寫資料分析結果時一般可以寫出。

F檢驗和R平方同向變化,當R=0F=0

R方越大,F值也就越大

R=1時,F為無窮大。

F檢驗是所有迴歸係數的總顯著性的度量也是R方的顯著性檢驗,即檢驗迴歸係數為等價於R方為0,也就是在計算R方後,就不必做F檢驗。

另外對於一元線性迴歸,F檢驗等價於T檢驗,因為迴歸係數只有一個。

4R

對於每組資料,我們可以用最小二乘法來求得一個線性模型,但對於這個模型的效果如何,如何來比較模型之間的好壞呢。R方就是來處理這個問題,它可以來計算預測值和真實y值的匹配程度,當R方(0~1)越接近1,這線性關係越明顯。

而在使用的時候要用調整後的R

方,這個值是針對自變數的增多會不斷增強預測力的一個矯正(因為即使沒什麼用的自變數,只要多增幾個,R方也會變大,調整後的R方是對較多自變數的懲罰),R可以不用管,標準化的情況下R也是自變數和因變數的相關