看完這篇，邏輯迴歸80%都懂了

1. 什麼是邏輯迴歸

邏輯迴歸是用來做分類演算法的，大家都熟悉線性迴歸，一般形式是Y=aX+b，y的取值範圍是[-∞, +∞]，有這麼多取值，怎麼進行分類呢？不用擔心，偉大的數學家已經為我們找到了一個方法。

也就是把Y的結果帶入一個非線性變換的Sigmoid函式中，即可得到[0,1]之間取值範圍的數S，S可以把它看成是一個概率值，如果我們設定概率閾值為0.5，那麼S大於0.5可以看成是正樣本，小於0.5看成是負樣本，就可以進行分類了。

2. 什麼是Sigmoid函式

函式公式如下：

函式中t無論取什麼值，其結果都在[0,-1]的區間內，回想一下，一個分類問題就有兩種答案，一種是“是”，一種是“否”，那0對應著“否”，1對應著“是”，那又有人問了，你這不是[0,1]的區間嗎，怎麼會只有0和1呢？這個問題問得好，我們假設分類的閾值是0.5，那麼超過0.5的歸為1分類，低於0.5的歸為0分類，閾值是可以自己設定的。

好了，接下來我們把aX+b帶入t中就得到了我們的邏輯迴歸的一般模型方程：

結果P也可以理解為概率，換句話說概率大於0.5的屬於1分類，概率小於0.5的屬於0分類，這就達到了分類的目的。

3. 損失函式是什麼

邏輯迴歸的損失函式是 log loss，也就是對數似然函式，函式公式如下：

公式中的 y=1 表示的是真實值為1時用第一個公式，真實 y=0 用第二個公式計算損失。為什麼要加上log函式呢？可以試想一下，當真實樣本為1是，但h=0概率，那麼log0=∞，這就對模型最大的懲罰力度；當h=1時，那麼log1=0，相當於沒有懲罰，也就是沒有損失，達到最優結果。所以數學家就想出了用log函式來表示損失函式。

最後按照梯度下降法一樣，求解極小值點，得到想要的模型效果。

4.可以進行多分類嗎？

可以的，其實我們可以從二分類問題過度到多分類問題(one vs rest)，思路步驟如下：

1.將型別class1看作正樣本，其他型別全部看作負樣本，然後我們就可以得到樣本標記型別為該型別的概率p1。

2.然後再將另外型別class2看作正樣本，其他型別全部看作負樣本，同理得到p2。

3.以此迴圈，我們可以得到該待預測樣本的標記型別分別為型別class i時的概率pi，最後我們取pi中最大的那個概率對應的樣本標記型別作為我們的待預測樣本型別。

總之還是以二分類來依次劃分，並求出最大概率結果。

5.邏輯迴歸有什麼優點

LR能以概率的形式輸出結果，而非只是0,1判定。
LR的可解釋性強，可控度高(你要給老闆講的嘛…)。
訓練快，feature engineering之後效果贊。
因為結果是概率，可以做ranking model。

6. 邏輯迴歸有哪些應用

CTR預估/推薦系統的learning to rank/各種分類場景。
某搜尋引擎廠的廣告CTR預估基線版是LR。
某電商搜尋排序/廣告CTR預估基線版是LR。
某電商的購物搭配推薦用了大量LR。
某現在一天廣告賺1000w+的新聞app排序基線是LR。

7. 邏輯迴歸常用的優化方法有哪些

7.1 一階方法

梯度下降、隨機梯度下降、mini 隨機梯度下降降法。隨機梯度下降不但速度上比原始梯度下降要快，區域性最優化問題時可以一定程度上抑制區域性最優解的發生。

7.2 二階方法：牛頓法、擬牛頓法：

這裡詳細說一下牛頓法的基本原理和牛頓法的應用方式。牛頓法其實就是通過切線與x軸的交點不斷更新切線的位置，直到達到曲線與x軸的交點得到方程解。在實際應用中我們因為常常要求解凸優化問題，也就是要求解函式一階導數為0的位置，而牛頓法恰好可以給這種問題提供解決方法。實際應用中牛頓法首先選擇一個點作為起始點，並進行一次二階泰勒展開得到導數為0的點進行一個更新，直到達到要求，這時牛頓法也就成了二階求解問題，比一階方法更快。我們常常看到的x通常為一個多維向量，這也就引出了Hessian矩陣的概念（就是x的二階導數矩陣）。

缺點：牛頓法是定長迭代，沒有步長因子，所以不能保證函式值穩定的下降，嚴重時甚至會失敗。還有就是牛頓法要求函式一定是二階可導的。而且計算Hessian矩陣的逆複雜度很大。

擬牛頓法：不用二階偏導而是構造出Hessian矩陣的近似正定對稱矩陣的方法稱為擬牛頓法。擬牛頓法的思路就是用一個特別的表達形式來模擬Hessian矩陣或者是他的逆使得表示式滿足擬牛頓條件。主要有DFP法（逼近Hession的逆）、BFGS（直接逼近Hession矩陣）、 L-BFGS（可以減少BFGS所需的儲存空間）。

8. 邏輯斯特迴歸為什麼要對特徵進行離散化。

非線性！非線性！非線性！邏輯迴歸屬於廣義線性模型，表達能力受限；單變數離散化為N個後，每個變數有單獨的權重，相當於為模型引入了非線性，能夠提升模型表達能力，加大擬合；離散特徵的增加和減少都很容易，易於模型的快速迭代；
速度快！速度快！速度快！稀疏向量內積乘法運算速度快，計算結果方便儲存，容易擴充套件；
魯棒性！魯棒性！魯棒性！離散化後的特徵對異常資料有很強的魯棒性：比如一個特徵是年齡>30是1，否則0。如果特徵沒有離散化，一個異常資料“年齡300歲”會給模型造成很大的干擾；
方便交叉與特徵組合：離散化後可以進行特徵交叉，由M+N個變數變為M*N個變數，進一步引入非線性，提升表達能力；
穩定性：特徵離散化後，模型會更穩定，比如如果對使用者年齡離散化，20-30作為一個區間，不會因為一個使用者年齡長了一歲就變成一個完全不同的人。當然處於區間相鄰處的樣本會剛好相反，所以怎麼劃分區間是門學問；
簡化模型：特徵離散化以後，起到了簡化了邏輯迴歸模型的作用，降低了模型過擬合的風險。

9. 邏輯迴歸的目標函式中增大L1正則化會是什麼結果。

所有的引數w都會變成0。

10. 程式碼實現

GitHub：https://github.com/NLP-LOVE/ML-NLP/blob/master/Machine%20Learning/2.Logistics%20Regression/demo/CreditScoring.ipynb

作者：@mantchs

GitHub：https://github.com/NLP-LOVE/ML-NLP

歡迎大家加入討論！共同完善此專案！群號：【541954936】

相關推薦

看完這篇，邏輯迴歸80%都懂了

1. 什麼是邏輯迴歸邏輯迴歸是用來做分類演算法的，大家都熟悉線性迴歸，一般形式是Y=aX+b，y的取值範圍是[-∞, +∞]，有這麼多取值，怎麼進行分類呢？不用擔心，偉大的數學家已經為我們找到了一個方法。也就是把Y的結果帶入一個非線性變換的Sigmoid函式中，即可得到[0,1]之間取值範圍的數S，S可以

看完這篇，別說你還不懂Hinton大神的膠囊網路，capsule network

倒計時 2 天來源 | 王的機器（公眾號ID：MeanMachine1031）作者 | 王聖元 0 引言斯蒂文認為機器學習有時候像嬰兒學習，特別是在物體識別上。比如嬰兒首先學會識別邊界和顏色，然後將這些資訊用於識別形狀和圖形等更復雜的實體。比如在人臉識別上

wwwlyjustcom看完這篇，你就會Linux基本操作了，請耐看完199O8836661

command sts r文件正常內置命令生態 regular ces 開頭只有光頭才能變強這個學期開了Linux的課程了，授課的老師也是比較負責任的一位。總的來說也算是比較系統地學習了一下Linux了~本文章主要是總結Linux的基礎操作以及一些簡單的概念，對於開

看完這篇，你就知道Python生成器是什麼

生成器是 Python 初級開發者最難理解的概念之一，雖被認為是 Python 程式設計中的高階技能，但在各種專案中可以隨處見到生成器的身影，你得不得去理解它、使用它、甚至愛上它。提到生成器，總不可避免地要把迭代器拉出來對比著講，生成器就是一個在行為上和迭代器非常類似的物件，如果把迭代器比

看完這篇，你就會知道 Lineage OS 系統的一切

前幾天看到新聞，發現 CM 團隊做出的新專案 Lineage OS 系統，一經官方釋出，就備受刷機黨們的關注。下面我來詳細講述一下我刷這個系統的整個過程以及體驗。 Lineage OS 系統介紹大夥還記得 CyanogenMod 嗎？給安卓手機刷過機的使用者基本都知

看完這篇，你應該知道什麼是Linux了~

Linux上的檔案系統一般來說就是EXT2或EXT3，但這篇文章並不準備一上來就直接講它們，而希望結合Linux作業系統並從檔案系統建立的基礎——硬碟開始，一步步認識Linux的檔案系統。 1.機械硬碟的物理儲存機制現代計算機大部分檔案儲存功能都是由機械硬碟這種裝置

https證書申請難嗎？看完這篇，保證不難！

https證書的出現，解決了傳統http網站的使用者隱私資料傳輸不安全的問題。如今大部分重要網站都安裝上了https證書，享受著它

看完這篇，媽媽還會擔心你Docker入不了門？

“上週物件突然心血來潮說想養個小寵物，我問想養啥她又說隨便，你看著辦！！！這我真的比較難辦啊！但是咱們程式設計師能有個物

看完這篇，再也不怕被問到 AsyncTask 的原理了

本文很多資料基於[Google Developer](https://developer.android.google.cn/reference/android/os/AsyncTask?hl=en)官方對AsyncTask的最新介紹。 ### AsyncTask 是什麼 ``` AsyncTask

看完這篇，再也不怕面試官問我執行緒池了

![在這裡插入圖片描述](https://img-blog.csdnimg.cn/20201129220549759.png) ## 一、為什麼需要執行緒池在實際使用中，執行緒是很佔用系統資源的，如果對執行緒管理不完善的話很容易導致系統問題。因此，在大多數併發框架中都會使用執行緒池來管理執行緒，使用執行緒

看完這篇，保證讓你真正明白：分散式系統的CAP理論、CAP如何三選二

引言 CAP 理論，相信很多人都聽過，它是指：一個分散式系統最多隻能同時滿足一致性（Consistency）、可用性（Availability）和分割槽容錯性（Partition tolerance）這三項中的兩項。為什麼要理解 CAP 理論？我能說出很多理由來。如果是在職場上，也許最合適的理由是，當領導

看完這篇Linux基本的操作就會了

安裝便在變量名 format 速查 shell命令一次常用根據前言只有光頭才能變強本文章主要是總結Linux的基礎操作以及一些簡單的概念~如果不熟悉的同學可下個Linux來玩玩(或者去買一個服務器玩玩【學生版的不是很貴】)，對於開發者來說，能使用Lin

【Android開發經驗】APP的快取檔案到底應該存在哪？看完這篇文章你應該就自己清楚了

只要是需要進行聯網獲取資料的APP，那麼不管是版本更新，還是圖片快取，都會在本地產生快取檔案。那麼，這些快取檔案到底放在什地方合適呢？系統有沒有給我們提供建議的快取位置呢？不同的快取位置有什麼不同呢？今天這篇文章就是主要來說明這個問題的。首先，我們要知道，在A

看完這篇--決策樹，80%都懂了

1. 什麼是決策樹 1.1 決策樹的基本思想其實用一下圖片能更好的理解LR模型和決策樹模型演算法的根本區別，我們可以思考一下一個決策問題：是否去相親，一個女孩的母親要給這個女海介紹物件。大家都看得很明白了吧！LR模型是一股腦兒的把所有特徵塞入學習，而決策樹更像是程式語言中的if-else一樣，去做條件

認真看完這篇文章，JVM將不再是你的短板

前言想起當年還是個菜鳥的時候，看了許多帖子，裡面的Java大神們都在說：JVM調優是JavaIT人進階所必備的知識。於是就買了書和教程去看，但是發現對於調優這個話題看書效率奇低，有些內容反覆看了又看，回想起來腦子裡卻不剩什麼。為了避免大家出現類似的情況，特地編輯了

冷暖自知！看完這篇區塊鏈媒體輿情報告，想說點啥？

前言進入2018年，伴隨區塊鏈行業的迅速發展，大量人才、資本湧入，促進著行業不斷向前。對於進入區塊鏈行業的人群，區塊鏈資訊的傳播十分重要。正是通過一條條專案資訊、新聞報道讓人們瞭解區塊鏈行業的時間大幅縮短。鏈塔智庫聯合TokenTM，統計2018年區塊鏈媒體資訊釋出量，分析

零基礎學python，看完這篇文章，你的python基礎就差不多了！乾貨【2】

3. 運算子 3.1 算數運算子是完成基本的算術運算使用的符號，用來處理四則運算，而“+”和“*”還可以用來處理字串。 3.2 比較（關係）運算子 Python 2.x 中判斷不等於還可以使用 <

GeoHash在LBS的應用，看完這篇就什麼都懂了

今天在做專案時，遇到這麼一個小小場景：對於使用者的一條行為資料資訊，我需要通過他的地理座標實時的得到他所在地附近商圈資訊，並且給他打上相關標籤以方便向他實時推送廣告。問題是：如何根據使用者的地理座標獲得他附近的商圈資訊呢？怎樣控制獲得商圈資訊的地理座標範圍呢？怎樣更精確的獲得附近商圈的資訊

零基礎學python，看完這篇文章，你的python基礎就差不多了！乾貨【1】

本文分為兩部分： Python基礎語法和麵向物件（下一篇分享面向物件） Python基礎語法 1. 認識Python 1.1 Python 簡介 Python 的創始人為吉多·範羅蘇姆（Guido van Rossum）。

看完這篇文章，終於搞懂TVS瞬態抑制二極體

看完這篇文章，徹底搞懂TVS二極體瞬態抑制TVS二極體，作為常用的電路保護元器件，廣泛應用於各行各業。在汽車電子、消費電子、電源驅動、工業配電、再生能源、電信、家電、計量儀器、醫療電子、工業控制、照明、安保系統、建築控制及自動化、音訊/視訊裝置、計算機及其周邊