廣義線性模型與指數分佈族的理解
在機器學習領域,很多模型都是屬於廣義線性模型(Generalized Linear Model, GLM),如線性迴歸,邏輯迴歸,Softmax迴歸等。
廣義線性模型有3個基本假設:
(1) 樣本觀測值
滿足帶引數
的指數分佈族。即GLM是基於指數分佈族的,所以我們先來看一下指數分佈族的一般形式:
其中, 為自然引數,在一般情況下, 為實數(多項式分佈中 為向量)。 為充分統計量(一般情況下,如高斯分佈和伯努利分佈中, )。 為累積量函式。給定 , 通過引數 ,我們可以得到指數分佈族中的各類分佈。
進一步解釋下什麼是充分統計量: 是未知分佈 引數 的充分統計量,當且僅當 能夠提供 的全部資訊。比如在正態分佈中,樣本均值和方差就是未知的正態分佈的充分統計量,因為這兩個引數可以完全描述整個樣本的分佈特性。
對於假設1,換句話說:給定 , 輸出 滿足引數為 的指數族分佈。
(2) 分佈模型引數 與輸入樣本 呈線性關係,即 。(當 為變數時, )
(3) (線性迴歸和邏輯迴歸都滿足該式,例如邏輯迴歸中, ,數學期望 ,因此 )
接下來,我們首先證明高斯分佈、伯努利分佈和多項式分佈屬於指數分佈族,然後我們由廣義線性模型推匯出線性迴歸,邏輯迴歸和多項式迴歸。這是因為:線性迴歸假設樣本和噪聲服從高斯分佈,邏輯迴歸假設樣本服從伯努利分佈,多項式迴歸假設樣本服從多項式分佈。
注:關於多項式迴歸,會介紹得稍微詳細點。
文章目錄
一、證明分佈屬於指數分佈族
1.1 證明高斯分佈屬於指數分佈族
因為方差 項對我們最終求 和 沒有影響,,因此為了簡化計算,我們令 :
因此: