多重共線性的處理（一般現象，迴歸中，自變數係數從正變成負，不符合理論）

阿新 • • 發佈：2019-01-22

造成多重共線性的原因有一下幾種：

1、解釋變數都享有共同的時間趨勢；

2、一個解釋變數是另一個的滯後，二者往往遵循一個趨勢；

3、由於資料收集的基礎不夠寬，某些解釋變數可能會一起變動；

4、某些解釋變數間存在某種近似的線性關係；

多重共線性的檢驗；

1、相關性分析，相關係數高於0.8，表明存在多重共線性；但相關係數低，並不能表示不存在多重共線性；

2、容忍度（tolerance）與方差擴大因子（VIF）。某個自變數的容忍度等於1減去該自變數為因變數而其他自變數為預測變數時所得到的線性迴歸模型的判定係數。容忍度越小，多重共線性越嚴重。通常認為容忍度小於0.1時，存在嚴重的多重共線性。方差擴大因子等於容忍度的倒數。顯然，

VIF越大，多重共線性越嚴重。一般認為VIF大於10時，存在嚴重的多重共線性。

3、迴歸係數的正負號與預期的相反。

解決方法：

1、增加樣本容量：多重共線性問題的實質是樣本資訊的不充分而導致模型引數的不能精確估計，因此追加樣本資訊是解決該問題的一條有效途徑。

2、如果要在模型中保留所有的自變數，那就應該：避免根據t統計量對單個引數β進行檢驗；對因變數y值的推斷限定在自變數樣本值的範圍內。

3、刪除一個或幾個共線變數：實際操作中常用逐步法作為自變數篩選方法。

4、嶺迴歸法；嶺迴歸法是通過最小二乘法的改進允許迴歸係數的有偏估計量存在而補救多重共線性的方法。

5、主成分分析法。

處理多重共線性的原則：

1、多重共線性是普遍存在的，輕微的多重共線性問題可不採取措施；

2、嚴重的多重共線性問題，一般可根據經驗或通過分析迴歸結果發現。如影響係數符號，重要的解釋變數t值很低。要根據不同情況採取必要措施。

3、如果模型僅用於預測，則只要擬合程度好，可不處理多重共線性問題，存在多重共線性的模型用於預測時，往往不影響預測結果。

採用兩種方法檢驗自變數之間的多重共線性

自變數之間的迴歸係數

從表可以得知GDP與RD_exp之間的迴歸係數為0.94大於0.8，存在嚴重的共線性問題；GDP與rel之間的迴歸係數為0.824大於0.8，存在嚴重的共線性問題；RD_exp與rel之間的迴歸係數為0.745，存在輕微的多重共線性，因為多重共線性普遍存在，所以輕微的多重共線性問題可不採取措施。

方差擴大因子（

VIF）檢驗

從表可以得知GDP的方差擴大因子為12.29大於10，存在嚴重的多重共線性。

由迴歸係數檢驗和方差擴大因子檢驗可知，導致多重共線性的原因，由控制變數GDP引起，因此可以可通過刪掉這個變數，再次進行共線性檢驗。

PS：這個圖太醜了，哪位大神知道怎麼優化這一塊。

多重共線性的處理（一般現象，迴歸中，自變數係數從正變成負，不符合理論）

多重共線性的處理（一般現象，迴歸中，自變數係數從正變成負，不符合理論）

python資料預處理：資料共線性處理

多重共線性的解決方法

量化投資學習筆記18——迴歸分析:變數的選擇、多重共線性及迴歸分析的改進

scikit-learn：4. 數據集預處理（clean數據、reduce降維、expand增維、generate特征提取）

Unity NavMesh尋路檢測的bug（或者特性），爬坡卡住問題。(角色高度和網格高度不一致造成）

vue 前端對null的處理，專案中使用v-if判斷陣列長度是，length報錯？

線性表（陣列、單鏈表、靜態連結串列、迴圈連結串列、雙向連結串列）

給定一個數組，陣列中有正有負，求出連續陣列中和值最大的數（陣列長度大於等於1）

java-影象處理（1、水印文字 2、水印圖示 3、縮圖 4、裁剪影象）

Idea 常用功能匯總，工作中常用技巧,移出請說明原因，筆記花了好長時間匯總的

給定一個二叉樹和其中的一個結點，請找出中序遍歷順序的下一個結點並且返回。注意，樹中的結點不僅包含左右子結點，同時包含指向父結點的指標。

ACM 給你一個整數Q，找出一個最小的正整數N，使得它的各位之積等於Q，如果不存在，請輸出-1 輸入：第一行為組數，

python中str與list互換，txt檔案的讀取，字串變成列表操作，另存為TXT時從列表變成字串

**題目描述：兩個長度不超過80的字串，串中包括大寫、小寫和空格字元，去掉空格字元並忽略大小寫後判斷兩個字串是否相等。

給一個正整數n，求出位數。並按正序輸出，逆序輸出

不知道寫啥最近在學js，就弄一個js的從零開始吧，儘量每天都堅持更新吧！

pytorch中的L2和L1正則化，自定義優化器設定等操作

iOS中的三大定時器 iOS開發中定時器經常會用到，iOS中常用的定時器有三種，分別是NSTime，CADisplayLink和GCD。

axios拿取後端資料，資料中可能會有數字比較龐大的，js轉換會出問題

多重共線性的處理（一般現象，迴歸中，自變數係數從正變成負，不符合理論）

相關推薦