13--廣義線性模型和 glm()函式介紹

阿新 • • 發佈：2021-08-13

1 廣義線性模型和 glm()函式

廣義線性模型擴充套件了線性模型的框架，它包含了非正態因變數的分析。重點關注該框架中兩種流行的模型：Logistic迴歸（因變數為類別型），比如多分類變數（比如差/良好/優秀）和泊松迴歸（因變數為計數型），比如一週交通事故的數目，每日酒水消耗的數量。

1.1 glm()函式

R中可通過glm()函式（還可用其他專門的函式）擬合廣義線性模型。它的形式與lm()類似，只是多了一些引數。函式的基本形式為：

glm(formula, family=family(link=function), data=)

下表列出了概率分佈（family）和相應預設的連線函式（function

）

假設你有一個響應變數（Y）、三個預測變數（X1、X2、X3）和一個包含資料的資料框（mydata）。Logistic迴歸適用於二值響應變數（0和1）。模型假設Y服從二項分佈，線性模型的擬合形式為：

其中π=μY是Y的條件均值（即給定一系列X的值時Y=1的概率），(π/1–π)為Y=1時的優勢比，log(π/1–π)為對數優勢比，或logit。本例中，log(π/1–π)為連線函式，概率分佈為二項分佈，可用如下程式碼擬合Logistic迴歸模型：

glm(Y~X1+X2+X3, family=gaussian(link="identity"), data=mydata)

總之，廣義線性模型通過擬合響應變數的條件均值的一個函式（不是響應變數的條件均值），

假設響應變數服從指數分佈族中的某個分佈（並不僅限於正態分佈），極大地擴充套件了標準線性模型。模型引數估計的推導依據的是極大似然估計，而非最小二乘法。

1.2 連用的函式

與分析標準線性模型時lm()連用的許多函式在glm()中都有對應的形式，其中一些常見的函

數見下表所示：

1.3 模型擬合和迴歸診斷

當評價模型的適用性時，你可以繪製初始響應變數的預測值與殘差的圖形。例如，如下程式碼

可繪製一個常見的診斷圖：

plot(predict(model, type="response"),

residuals(model, type= "deviance"))

其中，model為glm()函式返回的物件。

R將列出帽子值（hat value）、學生化殘差值和Cook距離統計量的近似值。不過，對於識別異常點的閾值，現在並沒統一答案，它們都是通過相互比較來進行判斷。其中一個方法就是繪製各統計量的參考圖，然後找出異常大的值。例如，如下程式碼可建立三幅診斷圖：

plot(hatvalues(model))

plot(rstudent(model))

plot(cooks.distance(model))

你還可以用其他方法，程式碼如下：

library(car)

influencePlot(model)

它可以建立一個綜合性的診斷圖。在後面的圖形中，橫軸代表槓桿值，縱軸代表學生化殘差

值，而繪製的符號大小與Cook距離大小成正比。

當響應變數有許多值時，診斷圖非常有用；而當響應變數只有有限個值時（比如Logistic回

歸），診斷圖的功效就會降低很多。

本文來自部落格園，作者：zhang-X，轉載請註明原文連結：https://www.cnblogs.com/YY-zhang/p/15137793.html

13--廣義線性模型和 glm()函式介紹

13--廣義線性模型和 glm()函式介紹

拓端tecdat|Matlab廣義線性模型glm泊松迴歸的lasso、彈性網路正則化分類預測考試成績資料和交叉驗證視覺化

R語言通過伽瑪與對數正態分佈假設下的廣義線性模型對大額索賠進行評估預測

詳解pytorch中squeeze()和unsqueeze()函式介紹

線性模型和CNN實現MNIST資料集手寫數字辨識

N0303-池化層、線性層和啟用函式層

pytorch中squeeze()和unsqueeze()函式介紹；MATLAB中的squeeze（）

淺談博弈論中的經典模型和SG函式

javascript條件式訪問屬性和箭頭函式介紹

STM32與PS2的無線通訊和相關函式介紹

Python run()函式和start()函式的比較和差別介紹

keras自定義損失函式並且模型載入的寫法介紹

尚矽谷MySQL學習筆記(Day_6)-儲存過程和函式介紹 - 函式

13.函式遞迴和匿名函式

拓端tecdat|R語言計量經濟學：工具變數法(兩階段最小二乘法2SLS)線性模型分析人均食品消費時間序列資料和迴歸診斷

bindTo和bind函式的使用介紹

Vue生命週期介紹和鉤子函式詳解

JavaScript陣列去重和扁平化函式介紹

拓端tecdat：R語言貝葉斯廣義線性混合效應（多層次/水平/巢狀）模型GLMM、邏輯迴歸分析教育留級影響因素資料

拓端tecdat|R語言生態學模擬對廣義線性混合模型GLMM進行功率（功效、效能、效力）分析power analysis環境監測資料

13--廣義線性模型和 glm()函式介紹

相關推薦