1. 程式人生 > >學習筆記——機器學習--多項式分佈及Softmax迴歸模型推導

學習筆記——機器學習--多項式分佈及Softmax迴歸模型推導

  在一個多分類問題,預測變數y可以取k個離散值中的任何一個,即y{1,2,,k}

例如:在一個郵件分類系統將郵件分為私人郵件,工作郵件和垃圾郵件。由於y仍然是一個離散值,這種多分類問題,二分類模型在這裡不太適用。

  多分類問題符合多項分佈。有許多演算法可用於解決多分類問題,像決策樹、樸素貝葉斯等。本文主要講解多分類演算法中的Softmax迴歸(Softmax Regression)

推導思路為:首先證明多項分佈屬於指數分佈族,這樣就可以使用廣義線性模型來擬合這個多項分佈,由廣義線性模型推匯出的目標函式hθ(x)即為Softmax迴歸的分類模型。

多項式分佈屬於指數分佈族的推導

  下面將根據多項式分佈建模。考慮樣本共有k類,每一類的概率分別為ϕ1,,ϕk,由於i=1kϕi=1,所以通常我們只需要k1個引數即ϕ1,,ϕk1
(397)P(y=i;ϕ)=ϕiP(y=k;ϕ)=1i=1k1ϕi
為了推導方便,引入表示式:

T(1)=[1000],T(2)=[0100],,T(k1)=[0001],T(k)=[0000]

  上面T(y)k1維列向量,其中y=1,2,,kT(y