10道題帶你瞭解邏輯迴歸模型
阿新 • • 發佈:2019-02-07
邏輯迴歸是解決分類問題的最常用演算法,不過常常也讓人摸不著頭腦。下面10道題帶你簡單瞭解邏輯迴歸演算法背後的“邏輯”。
邏輯迴歸模型
1.邏輯迴歸是監督機器學習的演算法嗎?
答案:是。邏輯迴歸之所以是監督機器學習的演算法,原因在於它使用了真值對資料進行訓練。監督機器學習訓練模型時會有輸入變數X和目標變數Y。
2.邏輯迴歸主要用來做迴歸嗎?
答案:錯。邏輯迴歸是分類演算法,不要被它的名字給迷惑了。
3.能否使用神經網路演算法設計一個邏輯迴歸演算法?
答案:可以。神經網路是一個通用的逼近演算法,所以它可以實現線性迴歸。
4.邏輯迴歸中可以用以下哪種方法來調整資料?
A.最小二乘法 B最大似然估計 C.傑卡德距離
答案:B.邏輯迴歸使用最大似然估計來訓練迴歸模型。
5.類似於線性迴歸的R-squared,判斷邏輯迴歸表現的一個方法是AIC,那麼AIC的值是越大越好還是越小越好?
答案:AIC最小的邏輯迴歸模型最佳。
6.在訓練邏輯迴歸模型之前,對特徵進行標準化是必須的嗎?
答案:非必須。特徵標準化的主要目的是實現模型的最優化。
7.哪種演算法可以用於變數選擇?
答案:LASSO。LASSO使用的是絕對懲罰,在增加懲罰項的情況下,一些變數的係數可能變為0。
8.下面3幅散點圖是包含決策邊界的邏輯迴歸模型,哪一幅圖的決策邊界過擬合了訓練資料?
答案:C。不平滑的決策邊界過擬合了資料。
9.上圖中哪一個決策邊界的正則化值最大?
答案:A。更大的正則化的值意味著懲罰更大,模型更簡單。
10.下圖是3個邏輯迴歸模型的AUC-ROC曲線。不同的顏色表示不同的超參值,哪一個會產生最佳的結果?
答案:黃色曲線。最佳的分類是曲線下面積最大的一個。
參考資料:www.analyticsvidhya.com