邏輯迴歸的常見面試點總結

阿新 • • 發佈：2018-12-29

1.簡介

邏輯迴歸是面試當中非常喜歡問到的一個機器學習演算法，因為表面上看邏輯迴歸形式上很簡單，很好掌握，但是一問起來就容易懵逼。所以在面試的時候給大家的第一個建議不要說自己精通邏輯迴歸，非常容易被問倒，從而減分。下面總結了一些平常我在作為面試官面試別人和被別人面試的時候，經常遇到的一些問題。

2.正式介紹

如何凸顯你是一個對邏輯迴歸已經非常瞭解的人呢。那就是用一句話概括它！邏輯迴歸假設資料服從伯努利分佈,通過極大化似然函式的方法，運用梯度下降來求解引數，來達到將資料二分類的目的。

這裡面其實包含了5個點 1：邏輯迴歸的假設，2：邏輯迴歸的損失函式，3：邏輯迴歸的求解方法，4：邏輯迴歸的目的，5:邏輯迴歸如何分類。這些問題是考核你對邏輯迴歸的基本瞭解。

邏輯迴歸的基本假設

任何的模型都是有自己的假設，在這個假設下模型才是適用的。邏輯迴歸的第一個基本假設是假設資料服從伯努利分佈。伯努利分佈有一個簡單的例子是拋硬幣，拋中為正面的概率是$p$,拋中為負面的概率是$1-p$.在邏輯迴歸這個模型裡面是假設 $h_\theta\left(x\right )$ 為樣本為正的概率，$1- h_\theta\left(x\right )$為樣本為負的概率。那麼整個模型可以描述為$$h_\theta\left(x;\theta \right )=p$$
邏輯迴歸的第二個假設是假設樣本為正的概率是 $$p=\frac{1}{1+e^{-\theta^{T} x}}$$

所以邏輯迴歸的最終形式 $$h_\theta\left(x;\theta \right )=\frac{1}{1+e^{-\theta^{T} x}}$$

邏輯迴歸的損失函式
- 邏輯迴歸的損失函式是它的極大似然函式$$L_\theta\left(x\right )= \prod _{i=1}^{m}h_\theta(x^{i};\theta )^{y{i}}*(1-h_\theta(x^{i};\theta))^{1-y^{i}} $$

邏輯迴歸的求解方法
- 由於該極大似然函式無法直接求解，我們一般通過對該函式進行梯度下降來不斷逼急最優解。在這個地方其實會有個加分的項，考察你對其他優化方法的瞭解。因為就梯度下降本身來看的話就有隨機梯度下降，批梯度下降，small batch 梯度下降三種方式，面試官可能會問這三種方式的優劣以及如何選擇最合適的梯度下降方式。
  - 簡單來說批梯度下降會獲得全域性最優解，缺點是在更新每個引數的時候需要遍歷所有的資料，計算量會很大，並且會有很多的冗餘計算，導致的結果是當資料量大的時候，每個引數的更新都會很慢。
  - 隨機梯度下降是以高方差頻繁更新，優點是使得sgd會跳到新的和潛在更好的區域性最優解，缺點是使得收斂到區域性最優解的過程更加的複雜。
  - 小批量梯度下降結合了sgd和batch gd的優點，每次更新的時候使用n個樣本。減少了引數更新的次數，可以達到更加穩定收斂結果，一般在深度學習當中我們採用這種方法。

- 其實這裡還有一個隱藏的更加深的加分項，看你了不瞭解諸如Adam，動量法等優化方法。因為上述方法其實還有兩個致命的問題。
  - 第一個是如何對模型選擇合適的學習率。自始至終保持同樣的學習率其實不太合適。因為一開始引數剛剛開始學習的時候，此時的引數和最優解隔的比較遠，需要保持一個較大的學習率儘快逼近最優解。但是學習到後面的時候，引數和最優解已經隔的比較近了，你還保持最初的學習率，容易越過最優點，在最優點附近來回振盪，通俗一點說，就很容易學過頭了，跑偏了。
  - 第二個是如何對引數選擇合適的學習率。在實踐中，對每個引數都保持的同樣的學習率也是很不合理的。有些引數更新頻繁，那麼學習率可以適當小一點。有些引數更新緩慢，那麼學習率就應該大一點。這裡我們不展開，有空我會專門出一個專題介紹。

邏輯迴歸的目的
- 該函式的目的便是將資料二分類，提高準確率。

邏輯迴歸如何分類
- 邏輯迴歸作為一個迴歸(也就是y值是連續的)，如何應用到分類上去呢。y值確實是一個連續的變數。邏輯迴歸的做法是劃定一個閾值，y值大於這個閾值的是一類，y值小於這個閾值的是另外一類。閾值具體如何調整根據實際情況選擇。一般會選擇0.5做為閾值來劃分。

3.對邏輯迴歸的進一步提問

邏輯迴歸雖然從形式上非常的簡單，但是其內涵是非常的豐富。有很多問題是可以進行思考的

邏輯迴歸的損失函式為什麼要使用極大似然函式作為損失函式？
- 損失函式一般有四種，平方損失函式，對數損失函式，HingeLoss0-1損失函式，絕對值損失函式。將極大似然函式取對數以後等同於對數損失函式。在邏輯迴歸這個模型下，對數損失函式的訓練求解引數的速度是比較快的。至於原因大家可以求出這個式子的梯度更新$$\theta _j=\theta _j-\left ( y^{i} -h_\theta (x^{i};\theta ) \right )\ast x^{i}_j$$這個式子的更新速度只和$x^{i}_j$，$y^{i} $相關。和sigmod函式本身的梯度是無關的。這樣更新的速度是可以自始至終都比較的穩定。
- 為什麼不選平方損失函式的呢？其一是因為如果你使用平方損失函式，你會發現梯度更新的速度和sigmod函式本身的梯度是很相關的。sigmod函式在它在定義域內的梯度都不大於0.25。這樣訓練會非常的慢。

邏輯迴歸在訓練的過程當中，如果有很多的特徵高度相關或者說有一個特徵重複了100遍，會造成怎樣的影響？

先說結論，如果在損失函式最終收斂的情況下，其實就算有很多特徵高度相關也不會影響分類器的效果。
但是對特徵本身來說的話，假設只有一個特徵，在不考慮取樣的情況下，你現在將它重複100遍。訓練以後完以後，資料還是這麼多，但是這個特徵本身重複了100遍，實質上將原來的特徵分成了100份，每一個特徵都是原來特徵權重值的百分之一。
如果在隨機取樣的情況下，其實訓練收斂完以後，還是可以認為這100個特徵和原來那一個特徵扮演的效果一樣，只是可能中間很多特徵的值正負相消了。

為什麼我們還是會在訓練的過程當中將高度相關的特徵去掉？
- 去掉高度相關的特徵會讓模型的可解釋性更好
- 可以大大提高訓練的速度。如果模型當中有很多特徵高度相關的話，就算損失函式本身收斂了，但實際上引數是沒有收斂的，這樣會拉低訓練的速度。其次是特徵多了，本身就會增大訓練的時間。

4.邏輯迴歸的優缺點總結

面試的時候，別人也經常會問到，你在使用邏輯迴歸的時候有哪些感受。覺得它有哪些優缺點。

在這裡我們總結了邏輯迴歸應用到工業界當中一些優點：

形式簡單，模型的可解釋性非常好。從特徵的權重可以看到不同的特徵對最後結果的影響，某個特徵的權重值比較高，那麼這個特徵最後對結果的影響會比較大。

模型效果不錯。在工程上是可以接受的（作為baseline)，如果特徵工程做的好，效果不會太差，並且特徵工程可以大家並行開發，大大加快開發的速度。

訓練速度較快。分類的時候，計算量僅僅只和特徵的數目相關。並且邏輯迴歸的分散式優化sgd發展比較成熟，訓練的速度可以通過堆機器進一步提高，這樣我們可以在短時間內迭代好幾個版本的模型。

資源佔用小,尤其是記憶體。因為只需要儲存各個維度的特徵值，。

方便輸出結果調整。邏輯迴歸可以很方便的得到最後的分類結果，因為輸出的是每個樣本的概率分數，我們可以很容易的對這些概率分數進行cutoff，也就是劃分閾值(大於某個閾值的是一類，小於某個閾值的是一類)。

但是邏輯迴歸本身也有許多的缺點:

準確率並不是很高。因為形式非常的簡單(非常類似線性模型)，很難去擬合數據的真實分佈。

很難處理資料不平衡的問題。舉個例子：如果我們對於一個正負樣本非常不平衡的問題比如正負樣本比 10000:1.我們把所有樣本都預測為正也能使損失函式的值比較小。但是作為一個分類器，它對正負樣本的區分能力不會很好。

處理非線性資料較麻煩。邏輯迴歸在不引入其他方法的情況下，只能處理線性可分的資料，或者進一步說，處理二分類的問題。

邏輯迴歸本身無法篩選特徵。有時候，我們會用gbdt來篩選特徵，然後再上邏輯迴歸。

5.總結

在這篇博文裡面，我總結了在日常面試的過程當中邏輯迴歸可能會遇到的問題，歡迎大家在下面留言和我進行交流，將你們面試遇到的關於邏輯迴歸的問題發出來，我會盡力去解答的。

邏輯迴歸的常見面試點總結

1.簡介邏輯迴歸是面試當中非常喜歡問到的一個機器學習演算法，因為表面上看邏輯迴歸形式上很簡單，很好掌握，但是一問起來就容易懵逼。所以在面試的時候給大家的第一個建議不要說自己精通邏輯迴歸，非常容易被問倒，從而減分。下面總結了一些平常我在作為面試官面試別人和被別人面試的時候，經常遇到的一些問題。 2

關於SSM框架面試點總結

1、SSM如何搭建：三個框架的搭建： 2、Spring框架的特點; IOC 和 AOP 3、Spring MVC ：主要應用於控制器 Controller 代替了Servlet。 4、MyBatis： 5、Spring,Spring MVC,MyBatis,Hibernate個人總結相關面試博文

~雜記（5）：github使用與常見注意點總結

1、關於如何使用github，網上有很多文章，其中有一篇寫的很好： https://blog.csdn.net/Hanani_Jia/article/details/7795059 跟著上一篇的步驟，可以成功克隆庫到本地以及上傳檔案。 2、我遇到的問題：（1）上述

APP常見測試點總結

APP常見測試點總結： 1.安裝、解除安裝測試主要針對編譯後源程式生成的APK安裝檔案。主要測試點：a.生成的APK檔案在真機上可以安裝及解除安裝； b.Android手機端的通用安裝工具，如：豌豆莢及91助手等工具可以正常安裝及解除安裝程式。 2.線上升級測試測試點：a.驗證

Java異常常見面試問題總結

Java提供了一個健壯的、面向物件的方法來處理出現異常，稱為Java異常處理。我以前寫過一篇長文章來介紹Java異常處理，今天我將列出一些重要的Java異常面試的問題及答案，希望對你們的面試有所幫助。 1.什麼是Java異常答：異常是發生在程式執行過程中阻礙程式正常執行的錯誤事件。比如：

雲端計算大資料類崗位部分常見面試問題總結

Hashing 適用範圍：快速查詢，刪除的基本資料結構，通常需要總資料量可以放入記憶體基本原理及要點： hash函式選擇，針對字串，整數，排列，具體相應的hash方法。碰撞處理，一種是open hashing，也稱為拉鍊法；另一種就是closed hashing，也稱開地址法，opened addre

spring基礎知識彙總及常見面試題目總結

Spring簡介 spring框架由Rod Johnson開發，2004年釋出了Spring框架的第一版。Spring是一個從實際開發中抽取出來的框架，因此它完成了大量開發中的通用步驟，留給開發者的僅僅是與特定應用相關的部分，從而大大提高了企業應用的開發效率。

C/C++常見面試知識點總結附面試真題----20180919更新（未完）

以下內容部分整理自網路，部分為自己面試的真題。第一部分：計算機基礎 1. C/C++記憶體有哪幾種類型？ C中，記憶體分為5個區：堆(malloc)、棧(如區域性變數、函式引數)、程式程式碼區（存放二進位制程式碼）、全域性/靜態儲存區（全域性變數、static

Java集合類常見面試知識點總結

Java集合類學習總結這篇總結是基於之前部落格內容的一個整理和回顧。這裡先簡單地總結一下，更多詳細內容請參考我的專欄：深入淺出Java核心技術 https://blog.csdn.net/column/details/21930.html 裡面有包括Java集合類在內的眾多Java核心技術系列

邏輯迴歸問題總結

來源：http://www.cnblogs.com/ModifyRong/p/7739955.html https://www.cnblogs.com/zhizhan/p/5038747.html 1.簡介邏輯迴

邏輯迴歸模型總結-機器學習

邏輯迴歸被廣泛的用來解決分類問題。由於分類是非線性問題，所以建模的主要難點是如何把非線性問題轉換為線性問題。在模型評估層面，討論了兩類相互有關聯的評估指標。對於分類問題的預測結果，可以定義為相應的查準查全率。對於基於概率的分類模型，還可以繪製它的ROC曲線，以及計算曲線線面的面積AUC。

2018年秋招面試常見資料庫知識總結

MYAQL：事務：事務是併發控制的基本單元，事務是一個操作序列，要麼都執行，要麼都不執行，他是一個不可分割的工作單位，事務是維護資料庫一致性的單位。四個ACID基本性質： 1.原子性：要麼都執行，要麼都不執行。 2.一致性：合法的資料才可以被寫入。 3.

機器學習總結之----2.邏輯迴歸

我也只是在學習的過程中，相當於自己理解推導一遍做個筆記，參考了別人很多東西，文末有相關連結。什麼是邏輯迴歸邏輯迴歸也叫做對數機率迴歸，但它卻用來做二分類。線性迴歸產生的預測值為 z=θTxz = \theta^{T}xz=θTx，線性迴歸通常用來做迴歸。

線性迴歸,邏輯迴歸,神經網路,SVM的總結

目錄線性迴歸,邏輯迴歸,神經網路,SVM的總結線性迴歸,邏輯迴歸,神經網路,SVM的總結詳細的學習筆記. markdown的公式編輯手冊. 迴歸的含義: 迴歸就是指根據之前的資料預測一個準確的輸出值. 分類的含義: 分類就是預測離散的輸出值, 比如男生為1, 女生為0(

NG機器學習總結-（四）邏輯迴歸以及python實現

在第一篇部落格NG機器學習總結一中，我們提到了監督學習通常一般可以分為兩類：迴歸和分類。線性迴歸屬於迴歸問題，例如房價的預測問題。而判斷一封郵件是否是垃圾郵件、腫瘤的判斷（良性還是惡性）、線上交易是否欺詐都是分類問題，當然這些都是二分類的問題。 Email：Spam /

機器學習演算法總結--線性迴歸和邏輯迴歸

1. 線性迴歸簡述在統計學中，線性迴歸（Linear Regression）是利用稱為線性迴歸方程的最小平方函式對一個或多個自變數和因變數之間關係進行建模的一種迴歸分析。這種函式是一個或多個稱為迴歸係數的模型引數的線性組合（自變數都是一次方）。只有一

線性迴歸、嶺迴歸、Lasso迴歸、邏輯迴歸的總結

對於所有的模型和演算法，都有一個目標方程，比較理想的目標方程應該有兩部分構成：損失函式和正則項，一個用來衡量模型的擬合效果，一個用來儘可能保證模型的簡單和穩定： Obj(Θ)=L(Θ)+Ω(Θ)(2)(2)Obj(Θ)=L(Θ)+Ω(Θ) 損失函式：平方

面試中關於LR邏輯迴歸問題的整理

邏輯迴歸為什麼更適合處理id類特徵？答：（1）對於tree based模型，處理id類特徵，從樹根到樹葉的路徑，其實就是是否是某使用者和是否是某商品的聯合判斷，它已經變成了一個歷史記憶，這就是為什麼tree based模型在稀疏大規模ID類特徵表現不行

Java多執行緒面試常見核心問題總結

[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr:"Thread-20" daemon prio=5 tid=0x01394f18 nid=0x109 runnable [6716f000..6716fc28][27/Jun/2006:10:03

java進階複習——常見易錯點總結

本博文用於記載java進階中一些難點和易混淆的知識點，並不詳細，也不全面，適合有java基礎的朋友進行復習鞏固。（部分內容為從PPT中拷貝，侵刪）裡面編號有點問題，以後再改吧，先湊合著看看一、反射反射中我們可以通過Class 物件來反射出

邏輯迴歸的常見面試點總結

相關推薦