1. 程式人生 > >機器學習系列(八)——Logistic迴歸解決二分類問題

機器學習系列(八)——Logistic迴歸解決二分類問題

分類問題的本質是確定樣本x屬於類別ci的概率p(Ci|x)。在上週整理的分類問題中,我們採用生成式方法,藉助貝葉斯公式和極大似然估計,首先計算出p(x|Ci)p(x,Ci),然後再計算出p(Ci|x)。以二分類為例:

(1)p(C1|x)=p(C1,x)p(x)=p(x|C1)p(C1)p(x)=p(x|C1)p(C1)p(x|C1)p(C1)+p(x|C2)p(C2)

如果

p(C1|x)>0.5,則將x歸入類別C1;如果p(C1|x)<0.5,則將x歸入類別C2。一般情況下,我們將p(x|C1)p(x|C2)假設成服從不同μ1μ2但是相同Σ的高斯分佈。因為高斯分佈是自然界中最常見的一種分佈,兩個分佈同用一個協方差矩陣Σ有助於減少引數數目,防止過擬合。

Logistic迴歸推導

現在我們嘗試對上述後驗概率(1)進行變形