邏輯斯蒂迴歸原理篇

阿新 • • 發佈：2019-02-01

1.邏輯斯蒂迴歸模型

LR模型主要用於分類模型，細心的人不難發現LR模型線上性迴歸模型上加了一個sigmoid轉換。為了更加深入地瞭解這個模型，我們可能要思考以下幾個問題

（1）sigmoid從何而來，篇幅比較大，下面會單獨討論
（2）sigmoid轉換的優勢
- 求梯度方便
- 資料統一分佈在0-1之間，從下面的LR分佈也可以看出
（3）這種轉換需要注意的地方，LR分佈可以此種轉換的特徵

2.邏輯斯蒂迴歸分佈

分佈函式式中，為位置引數，為形狀引數

密度函式

邏輯斯蒂迴歸分佈的密度函式和分佈函式

不難看出，F(x)曲線在中心附近增長速度比較快，在兩端增長速度較慢。形狀引數

的值越小，曲線在中心附近增長得越快

3.模型引數估計

應用極大似然估計法估計模型

（1）設

（2）似然函式

（3）對數似然函式

（4）梯度下降

最後括號中表達式就是訓練時的誤差，從而我們可以通過batch等方法進行隨機梯度下降

4.揭祕sigmoid

定義表示式
A（u，v）：如果u == v,則A（u，v） = 1 ，否則為0
表示x的label為u的概率

滿足條件

第三個條件可以簡單的從頻率學派和貝葉斯學派理解

優化目標（拉格朗日）

求梯度
最終可以得到

對於分類問題，我們最終要確保每個類別概率之和為1

因此

通過化簡可得

5.在二分類問題中，為什麼棄用傳統的線性迴歸模型，改用邏輯斯蒂迴歸？

線性迴歸用於二分類時，首先想到下面這種形式，p是屬於類別的概率：

但是這時存在的問題是：

1）等式兩邊的取值範圍不同，右邊是負無窮到正無窮，左邊是[0,1]，這個分類模型的存在問題

2）實際中的很多問題，都是當x很小或很大時，對於因變數P的影響很小，當x達到中間某個閾值時，影響很大。即實際中很多問題，概率P與自變數並不是直線關係。

所以，上面這分類模型需要修整，怎麼修正呢？統計學家們找到的一種方法是通過logit變換對因變數加以變換，具體如下：

從而，

這裡的P完全解決了上面的兩個問題。

6.從最根本的廣義線性模型角度，匯出經典邏輯迴歸

1）指數家族

當固定T時，這個分佈屬於指數家族中的哪種分佈就由a和b兩個函式決定。下面這種是伯努利分佈，對應於邏輯迴歸問題

注：從上面可知，從而，在後面用GLM導logistic regression的時候會用到這個sigmoid函式。

下面這種是高斯分佈，對應於經典線性迴歸問題

2）GLM（廣義線性模型）

指數家族的問題可以通過廣義線性模型來解決。如何構建GLM呢？在給定x和引數後，y的條件概率p(y|x,θ) 需要滿足下面三個假設：

assum1) y | x; θ ∼ ExponentialFamily(η).

assum2) h(x) = E[y|x]. 即給定x，目標是預測T(y)的期望，通常問題中T(y)=y

assum3) η = θTx，即η和x之間是線性的

3）經典邏輯迴歸

邏輯迴歸：以二分類為例，預測值y是二值的{1,0}，假設給定x和引數，y的概率分佈服從伯努利分佈（對應構建GLM的第一條假設）。由上面高斯分佈和指數家族分佈的對應關係可知，，根據構建GLM的第2、3條假設可model表示成：

可以從GLM這種角度理解為什麼logistic regression的公式是這個形式~

7.實戰體驗

二分類問題，分類邊界實乃重中之重。訓練樣本是否均衡、樣本權重都會對邊界有影響

C1、C2為類別，圖片引用於PRML
瞭解下Fisher判別函式對理解分類問題本質會有很大幫助

8.多項邏輯斯蒂迴歸

假設離散型隨機變數Y的取值集合是{1，2…，K}，那麼多項邏輯斯蒂迴歸模型是

類似於CNN分類最後一層softmax

9.Tip

訓練速度快
資料量比較少的時候容易過擬合，這與使用極大似然估計（本質上為均值）是有關的
特徵One-hot
設計組合特徵
進行多分類的時候，思考下不同label之間是否有關係，從而覺得到底使用多個二分類還是一個多分類

邏輯斯蒂迴歸原理篇

1.邏輯斯蒂迴歸模型 LR模型主要用於分類模型，細心的人不難發現LR模型線上性迴歸模型上加了一個sigmoid轉換。為了更加深入地瞭解這個模型，我們可能要思考以下幾個問題（1）sigmoid從

邏輯斯蒂迴歸原理

1.邏輯斯蒂迴歸模型 LR模型主要用於分類模型，細心的人不難發現LR模型線上性迴歸模型上加了一個sigmoid轉換。為了更加深入地瞭解這個模型，我們可能要思考以下幾個問題（1）sigmoid從何而來，篇幅比較大，下面會單獨討論（2）sigmoid轉換的優勢 -

統計學習---邏輯斯蒂迴歸與最大熵模型

邏輯斯蒂迴歸和最大熵模型邏輯斯蒂分佈邏輯斯蒂迴歸模型將權值向量和輸入向量加以擴充後的邏輯斯蒂模型為模型引數估計極大似然估計法最大熵模型最大熵原理：在所有可能的概率模型中，熵最大的模型是最好的模型。通常用約

《機器學習實戰》第5章邏輯斯蒂迴歸數學推導

在《機器學習實戰》一書的第5章邏輯斯蒂迴歸的程式碼介紹中，p79中開頭有一句，“此處略去了一個簡單的數學推導”，那麼到底略去了哪一個簡單的數學推導呢？本著要將這個演算法徹底搞明白的態度，筆者在百度上搜了好多資料，終於找到了相關的資料，以供參考。從上圖中按照邏輯斯蒂迴歸演算法，利用梯

邏輯斯蒂迴歸能否解決非線性分類問題？邏輯斯蒂迴歸提出時用來解決線型分類問題，其分離面是一個線型超平面wx+b，如果將這個超平面改成非線性的，如x1^2+x2=0之類的非線性超平面來進行分類，是否也可

邏輯迴歸的模型引入了sigmoid函式對映，是非線性模型，但本質上又是一個線性迴歸模型，因為除去sigmoid對映函式關係，其他的步驟，演算法都是線性迴歸的。可以說，邏輯迴歸，都是以線性迴歸為理論支援的。這裡講到的線性，是說模型關於係數一定是線性形式的加入sigmoid對

《統計學習方法（李航）》邏輯斯蒂迴歸與最大熵模型學習筆記

作者：jliang https://blog.csdn.net/jliang3 1.重點歸納 1）線性迴歸（1）是確定兩種或以上變數間相互依賴的定量關係的一種統計分析方法。（2）模型：y=wx+b （3）誤差函式：（4）常見求解方法最小

sklean學習之LogisticRegression（邏輯斯蒂迴歸分類器）【原始碼】

def fit(self, X, y, sample_weight=None): """根據給定的訓練資料擬合模型. 引數 ---------- X : {array-like, sparse matrix}, shape (n_samples, n_fe

李航·統計學習方法筆記·第6章 logistic regression與最大熵模型（1）·邏輯斯蒂迴歸模型

第6章 logistic regression與最大熵模型（1）·邏輯斯蒂迴歸模型標籤（空格分隔）：機器學習教程·李航統計學習方法邏輯斯蒂：logistic 李航書中稱之為：邏輯斯蒂迴歸模型周志華書中稱之為：對數機率迴歸模

邏輯斯蒂迴歸用sigmoid函式的原因？

sigmoid函式的數學公式 sigmoid函式的因變數x取值範圍是-∞到+∞，(-∞，+∞)，但是sigmoid函式的值域是(0, 1)。不管x取什麼值其對應的sigmoid函式值一定會落到(0,1)範圍內~~~ 漂亮的logis

統計學習方法邏輯斯蒂迴歸

邏輯斯諦迴歸（logistic regression）是統計學習中的經典分類方法。最大熵是概率模型學習的一個準則，將其推廣到分類問題得到最大熵模型（maximum entropy model）。邏輯斯諦迴歸模型與最大熵模型都屬於對數線性模型。本文只介紹邏輯斯諦迴歸。設X是連續隨機變數， X

徹底搞懂邏輯斯蒂迴歸

線上性感知器演算法中，我們使用了一個f(x)=x函式，作為激勵函式，而在邏輯斯蒂迴歸中，我們將會採用sigmoid函式作為激勵函式，所以它被稱為sigmoid迴歸也叫對數機率迴歸（logistic r

邏輯斯蒂迴歸,最大熵模型及其等價性

首先推導二類分類訓練集上的邏輯斯蒂迴歸模型(Logistic Regression), 然後推導最大熵模型(Maximum Entropy Model), 最後給出給出最大熵模型等價於邏輯斯蒂迴歸模型的條件. 1. 邏輯斯蒂迴歸訓練集T={(xi,

《機器學習實戰》--邏輯斯蒂迴歸

梯度下降視覺化前一篇看完了理論，我們來實戰一下，首先看一下梯度下降的效果先看程式碼 # 目標函式 def func(x): return np.square(x) # 目標函式一階導數 def dfunc(x): return 2

機器學習筆記:線性迴歸、邏輯斯蒂迴歸推導

參考書籍：《統計學習方法》，cs229，其他 1、線性迴歸 1.1、線性迴歸表示線性迴歸屬於監督學習問題，輸入X與輸出Y成線性關係，只要我們得到了這個具體的關係，那麼對於待預測的資料X我們便可以知道Y的值。現在就來求這個線性關係先定義好變量表示。記輸入變量表示為

機器學習筆記（一）邏輯斯蒂迴歸LR

本文是在學習完李航老師的《統計學習方法》後，在網上又學習了幾篇關於LR的部落格，算是對LR各個基礎方面的一個回顧和總結。一簡述邏輯斯蒂迴歸是一種對數線性模型。經典的邏輯斯蒂迴歸模型（LR

Hinton Neural Networks課程筆記3c：學習邏輯斯蒂迴歸

這節可以看做反向傳播（BP）演算法在邏輯斯蒂迴歸（logistic regression）中的應用。為了進一步拓展BP演算法的應用，從線性神經元拓展到了非線性神經元。這裡選取了最簡單的非線性神經元：邏輯斯蒂輸出神經元（logistic output ne

【機器學習 sklearn】邏輯斯蒂迴歸模型--Logistics regression

執行結果： "D:\Program Files\Python27\python.exe" D:/PycharmProjects/sklearn/Logistics_regression.py Logistics regression [[99 1] [

《統計學習方法》1——邏輯斯蒂迴歸

1. 模型二項邏輯斯蒂迴歸模型是由邏輯斯蒂分佈的條件概率分佈表示的分類模型。邏輯斯蒂分佈函式為其中，u是位置引數，是中心點（對稱點）的位置；r是形狀函式。其分佈圖形是一條S形曲線，也就是sigmoid曲線,S形曲線的範圍是(0,1)。

初學ML筆記N0.1——線性迴歸，分類與邏輯斯蒂迴歸，通用線性模型

1.線性迴歸線性迴歸，即假設使用一個線性的模型方程，來擬合特徵與結果，如下向量形式： x1，x2為輸入特徵。在上式中，theta則為每個特徵所對應的權重值，上式隱含了一個條件，即我們假設還有x0這個特徵，其值全部為1。定義cost

《機器學習實戰》-- 邏輯斯蒂迴歸

引言迴歸我們知道有線性迴歸，線性迴歸模型能夠無限的逼近我們的結果。以(xi,yi)為例，通過線性迴歸 f(x)=wTx+b表示式，就可以得到我們對yi的估計值。迴歸到分類如何從線性迴歸轉換到分類呢？由於線性迴歸得到的是連續值，z=wTx+b，