邏輯斯蒂迴歸,最大熵模型及其等價性
阿新 • • 發佈:2019-01-10
首先推導二類分類訓練集上的邏輯斯蒂迴歸模型(Logistic Regression), 然後推導最大熵模型(Maximum Entropy Model), 最後給出給出最大熵模型等價於邏輯斯蒂迴歸模型的條件.
1. 邏輯斯蒂迴歸
訓練集
我們假設特徵
為了預測
我們希望引數模型
f(x;β)∈[0,1] .f 應該至少是個連續函式. 這是因為我們希望模型f 的輸出能夠隨x 平滑地變化.f 應該儘可能簡單.
幸運的是, 恰好存在一個函式完美滿足上述所有條件,即sigmoid函式:
於是,我們的模型變成:
我們使用最大似然估計來求解模型引數
為什麼選擇sigmoid函式
保留訓練集
現在我們來細化上述模型:一方面,考慮到
考慮到二項分佈的連線函式