機器學習演算法之: 邏輯迴歸 logistic regression (LR)
by joey周琦
LR介紹
邏輯迴歸屬於probabilistic discriminative model這一類的分類演算法
probabilistic discriminative mode這類演算法的思路如下:
- 直接建模
- 利用最大似然估計和訓練資料,估計出模型中的引數
該類想法相對於生成模型(probabilistic generated model) 有引數較少的優點。因為生成模型需要
LR是工業界最長用的分類演算法之一,其主要原因,個人認為有幾點如下:
- 訓練速度快,扛得住大資料
- 模型可解釋度、可理解程度高,根據每個特徵的係數,就可以判斷出該特徵在模型中的重要性,幫助判斷模型是否合理
- 可以接受的精度
本文,對LR做一個簡單的總結
LR二分類
首先做下簡單的符號說明,在下述推導中,
對於
其中
最大化似然函式等價於最大化對數似然函式可以寫為
我們要最大化對數似然函式,就是等價於對數似然函式的相反數,則最小化目標函式可以寫為:
目標函式對引數
可以利用梯度下降法對引數
其中
這樣大大節約了訓練時間,也不會特別影響精度。有些系統為了避免過擬合,目標函式中可以加入L1或者 L2正則項(這裡採用L2),可以避免
其中