學習筆記——機器學習--多項式分佈及Softmax迴歸模型推導
阿新 • • 發佈:2019-02-08
在一個多分類問題,預測變數可以取個離散值中的任何一個,即。
例如:在一個郵件分類系統將郵件分為私人郵件,工作郵件和垃圾郵件。由於仍然是一個離散值,這種多分類問題,二分類模型在這裡不太適用。
多分類問題符合多項分佈。有許多演算法可用於解決多分類問題,像決策樹、樸素貝葉斯等。本文主要講解多分類演算法中的Softmax迴歸(Softmax Regression)
推導思路為:首先證明多項分佈屬於指數分佈族,這樣就可以使用廣義線性模型來擬合這個多項分佈,由廣義線性模型推匯出的目標函式即為Softmax迴歸的分類模型。
多項式分佈屬於指數分佈族的推導
下面將根據多項式分佈建模。考慮樣本共有類,每一類的概率分別為,由於,所以通常我們只需要個引數即。
為了推導方便,引入表示式:
上面是維列向量,其中;