邏輯迴歸－logistic regression 詳解

一，為什麼要使用logistic 函式

從線性分類器談起

　　給定一些資料集合，他們分別屬於兩個不同的類別。例如對於廣告資料來說，是典型的二分類問題，一般將被點選的資料稱為正樣本，沒被點選的資料稱為負樣本。現在我們要找到一個線性分類器，將這些資料分為兩類（當然實際情況中，廣告資料特別複雜，不可能用一個線性分類器區分）。用X表示樣本資料，Y表示樣本類別（例如1與-1，或者1與0）。我們線性分類器的目的，就是找到一個超平面（Hyperplan）將兩類樣本分開。對於這個超平面，可以用以下式子描述：

ωTx+b=0

　　對於logistic迴歸，有：

hθ(x)=

g(θTx)=11+e−θTx

　　其中 x 為樣本，x=[x1,x2,⋯,xn] 為n維向量，函式g為我們常說的logistic函式。g的更一般公式為：

g(z)=11+e−z

　　這個公式，對機器學習稍微有點了解的同學可能都特別熟悉，不光在logistic迴歸中，在SVM中，在ANN中，都能見到他的身影，應用特別廣泛。大部分資料在談到這個式子時候，都是直接給出來。但是不知道大家有沒有想過，既然這個式子用途這麼廣泛，那我們為什麼要用它呢？

　　是不是已經有好多人愣住了。大家都是這麼用的。書上都是這麼寫的啊。是的，但是當一個東西老在你眼前晃來晃去的時候，你是不是應該想想為什麼呢？反正對於我來說，如果一個東西在我眼前都出現了第三次了而我還不知其所以然，我一定會去想方設法弄明白為什麼。

為什麼要用Logistic函式

　　學過模式識別的同學肯定學過各種分類器。分類器中最簡單的自然是線性分類器，線性分類器中，最簡單的應該就屬於感知器了。在上個世紀五六十年代，感知器就出現了：

y=0,∑i=1nωix≤b
y=1,∑i=1nωix>b

　　感知器的思想，就是對所有特徵與權重做點積（內積），然後根據與閾值做大小比較，將樣本分為兩類。稍微瞭解一點神經網路的同學，對一下這幅圖一定不陌生：

這裡寫圖片描述

　　沒錯，這幅圖描述的就是一個感知器。
　　我考研考的是控制原理，如果學過控制原理或者學過訊號系統的同學，就知道感知器相當於那兩門課中的階躍函式：

這裡寫圖片描述

　　這兩者的本質都是一致的，即通過劃定一個閾值，然後比較樣本與閾值的大小來分類。

　　這個模型簡單直觀，實現起來也比較容易（要不怎麼說是最簡單的現行分類器呢）。但是問題在於，這個模型不夠光滑。第一，假設t0=10，現在有一個樣本進來，最後計算出來的值為10.01，你說這個樣本分類應該是為1還是0呢？好像都不太靠譜的樣子。第二，這個函式在t0 這點有個階躍,有從0到1的突變，導致這點不連續，在數學上處理起來也不方便。

　　囉囉嗦嗦寫了這麼多了，終於輪到logistic函數出場了。對比前面的感知器或者階躍函式，他有什麼優點呢？
這裡寫圖片描述

　　通過logistic函式的影象，我們很容易總結出他的以下優點：
　　1.他的輸入範圍是−∞→+∞ ，而之於剛好為（0，1），正好滿足概率分佈為（0，1）的要求。我們用概率去描述分類器，自然比單純的某個閾值要方便很多；
　　2.他是一個單調上升的函式，具有良好的連續性，不存在不連續點。

　　寫到這裡，小夥伴們應該都明白為什麼要使用logistic函數了吧。

二，損失函式（cost function）詳解

轉自： http://blog.csdn.net/bitcarmanlee/article/details/51165444

有監督學習

機器學習分為有監督學習，無監督學習，半監督學習，強化學習。對於邏輯迴歸來說，就是一種典型的有監督學習。
既然是有監督學習，訓練集自然可以用如下方式表述：

{(x1,y1),(x2,y2),⋯,(xm,ym)}

對於這m個訓練樣本，每個樣本本身有n維特徵。再加上一個偏置項x0, 則每個樣本包含n+1維特徵：

x=[x0,x1,x2,⋯,xn]T
其中 x∈Rn+1,x0=1,y∈{0,1}

李航博士在統計學習方法一書中給分類問題做了如下定義：
分類是監督學習的一個核心問題，在監督學習中，當輸出變數Y取有限個離散值時，預測問題便成為分類問題。這時，輸入變數X可以是離散的，也可以是連續的。監督學習從資料中學習一個分類模型或分類決策函式，稱為分類器(classifier)。分類器對新的輸入進行輸出的預測(prediction)，稱為分類(classification).

hθ(x)=g(θTx)=11+e−θTx
其中一個重要的原因，就是要將Hypothesis(NG課程裡的說法)的輸出對映到0與1之間，既：
0≤hθ(x)≤1

同樣是李航博士統計學習方法一書中，有以下描述：
統計學習方法都是由模型，策略，和演算法構成的，即統計學習方法由三要素構成，可以簡單表示為：

方法=模型+策略+算法

對於logistic迴歸來說，模型自然就是logistic迴歸，策略最常用的方法是用一個損失函式(loss function)或代價函式(cost function)來度量預測錯誤程度，演算法則是求解過程，後期會詳細描述相關的優化演算法。

logistic函式求導

g′(z)=ddz11+e−z=1(1+e−z)2(e−z)=1(1+e−z)⋅(1−1(1+e−z))=g(z)(1−g(z))

此求導公式在後續推導中會使用到

常見的損失函式

機器學習或者統計機器學習常見的損失函式如下：

1.0-1損失函式（0-1 loss function）

L(Y,f(X))={1,0,Y ≠ f(X)

邏輯迴歸－logistic regression 詳解

從線性分類器談起

為什麼要用Logistic函式

有監督學習

logistic函式求導

常見的損失函式

邏輯迴歸－logistic regression 詳解

邏輯迴歸(Logistic Regression)詳解,公式推導及程式碼實現

機器學習專案實戰--邏輯迴歸（Logistic Regression）

機器學習演算法與Python實踐之邏輯迴歸（Logistic Regression）（二）

邏輯迴歸（Logistic Regression）演算法小結

林軒田--機器學習技法--SVM筆記5--核邏輯迴歸(Kernel+Logistic+Regression)

邏輯迴歸模型(Logistic Regression, LR)基礎

機器學習/邏輯迴歸（logistic regression）/--附python程式碼

機器學習之邏輯迴歸（logistic regression）

Python手擼邏輯迴歸（logistic regression）

邏輯迴歸（Logistic+Regression）經典例項

邏輯迴歸（Logistic Regression）

邏輯迴歸梯度下降法詳解

邊框迴歸(Bounding Box Regression)詳解

邏輯迴歸（logistic regression）和線性迴歸（linear regression）

樸素貝葉斯法（naive bayes）邏輯迴歸（logistic regression）線性迴歸

機器學習演算法與Python實踐之（七）邏輯迴歸（Logistic Regression）

通俗地說邏輯迴歸【Logistic regression】演算法（一）

通俗地說邏輯迴歸【Logistic regression】演算法（二）sklearn邏輯迴歸實戰

廣義線性迴歸之邏輯斯諦迴歸（ Logistic Regression）

邏輯迴歸－logistic regression 詳解

從線性分類器談起

為什麼要用Logistic函式

有監督學習

logistic函式求導

常見的損失函式

相關推薦