1. 程式人生 > >筆記︱橫截面迴歸模型中調節效應+中介效應(橫截面迴歸模型兩大方向)

筆記︱橫截面迴歸模型中調節效應+中介效應(橫截面迴歸模型兩大方向)

筆者認為一般統計模型中的橫截面迴歸模型中大致可以分為兩個方向:一個是互動效應方向(調節、中介效應)、一個是隨機性方向(固定效應、隨機效應)。


兩個方向的選擇需要根據業務需求:

互動效應較多探究的是變數之間的網路關係,可能會有很多變數,多變數之間的關係;

而隨機性探究的是變數自身的關聯,當需要著重顧及某變數存在太大的隨機因素時(這樣的變數就想是在尋在內生變數一樣,比如點選量、不同人所在地區等)才會使用。具體見:R語言︱線性混合模型理論與案例探究(固定效應&隨機效應)


調節效應

Y與 X的關係受到第三個變數M的影響
調節變數可以是定性的 (如性別) ,也可以是定量的 (如年齡)
影響因變數和自變數之間關係的方向 (正或負 )和強弱

調節效應和互動效應

從統計上看,調節效應和互動效應是相同的
                      (對H0:c=0進行檢驗,c顯著,則調節效應顯著)
從概念上看,互動效應中,兩個自變數地位不固定,可以任意解釋。
                        調節作用中,調節變數和自變數根據假設模型固定。

中介效應

如果X通過影響變數 M來影響Y,則稱M為中介變數
c是X對Y的總效應,a、b是經過中介變數M的中介效應
c=c'+ab (一箇中介變數的情況)

侯傑泰等提出的中介效應檢驗程式


兩個效應的對比:

1、調節效應比較容易實現,通過互動項既可以獲取;但是中介效應需求驗證的東西較多,也較為複雜。

————————————————————————————————————————————————

效應的建模

1、調節效應的建模

在建模過程中,是否需要加入其它變數來進行調和。作者在後來的思考中覺得,為了使模型儘量簡潔,應該選擇第一種方案。

第一種方案:y~x1+x2+x1*x2

第二種方案:y~x1+x2+x1*x2+x3+x4+x5

檢驗的是x1*x2的係數是否顯著,若顯著則代表存在互動效應=x1 、x2獨立。業務思考的出發點在:兩變數相互獨立。

一般的解釋:兩個自變數對因變數的影響並不是獨立的,任何一個自變數的作用都會受到另一個自變數的影響。

若存在多個互動效應,比如:

y~x1+x2+x1*x2+x3+x4+x3*x4

如果出現x1*x2不顯著,那麼可以直接刪除嗎?——不可以;

如果x1*x2顯著,x2的係數反而不顯著了,可以直接刪除嗎?——不可以;

正確的建模步驟是在:

1、先做無互動效應的模型:y~x1+x2+x3+x4,然後進行變數篩選;

2、剩下的變數再來考慮互動效應,若上述的四個變數全部都留下,那麼再來做互動項x1*x2、x3*x4

3、如果互動項加入之後,導致原來的x1-x4四個變數有不顯著的,不能刪除。至於是否可以刪除互動項,其實互動項若不顯著和顯著,都是一個非常好的結論。筆者認為互動項無論咋樣,都可以不刪除。

——相關結論可見謝宇老師的《迴歸分析》的P245頁。

2、中介效應的建模

建三個模型:

y~x

x~M

y~M+x

先檢視x~M,y~M係數顯著性,再來判斷最終的顯著性。

————————————————————————————————————————————————————————

零模型的固定效應與隨機效應

節選自經管之家論壇,由HLM版主提供,感謝!帖子連結

#研究者想要知道詞彙成績(gevocab)對一般閱讀成績(geread)的預測能力。
#由於學生巢狀於學校,標準的線性迴歸方程是不合適的。
#我們將要建立的第一個模型是零模型,即,模型中不包含自變數。
#該模型可用來估計殘差和截距的變異(僅考慮巢狀於學校)。相應的lme語句見下方。

Model3.0 <- lme(fixed = geread~1, random = ~1|school, data =Achieve)

#如果僅輸入Model3.0只能得到粗略的結果,我們可通過summary(Model3.0)獲得計算結果。

summary(Model3.0)

#結果如下,下面這句話說明,使用的是REML演算法
#Linear mixed-effects model fit by REML
#資料為Achieve 
# Data: Achieve 
#模型擬合指數
#      AIC      BIC    logLik
#  46274.31 46296.03 -23134.15
#隨機效應部分
#Random effects:
# Formula: ~1 | school
#        (Intercept) Residual
#StdDev:   0.6257119  2.24611
#固定效應部分
#Fixed effects: geread ~ 1 
#               Value  Std.Error    DF t-value p-value
#(Intercept) 4.306753 0.05497501 10160 78.3402       0
#標準化的組內殘差,不重要
#Standardized Within-Group Residuals:
#       Min         Q1        Med         Q3        Max 
#-2.3229469 -0.6377948 -0.2137753  0.2849664  3.8811630 
#樣本量
#Number of Observations: 10320
#cluster的數量
#Number of Groups: 160 
#根據ICC的公式,ICC=二層方差/(二層方差+一層方差),結合上述隨機效應部分,可計算
#ICC=0.6257119*0.6257119/(0.6257119*0.6257119+2.24611*2.24611)=0.0720157351971356