1. 程式人生 > >面試中關於LR邏輯迴歸問題的整理

面試中關於LR邏輯迴歸問題的整理

  1. 邏輯迴歸為什麼更適合處理id類特徵?
    答:
    (1)對於tree based模型,處理id類特徵,從樹根到樹葉的路徑,其實就是是否是某使用者和是否是某商品的聯合判斷,它已經變成了一個歷史記憶,這就是為什麼tree based模型在稀疏大規模ID類特徵表現不行的原因
    (2)對於邏輯迴歸模型,一方面,它可以處理大規模的資料,可以並行處理;另一方面,我們可以通過L1正則化,進行特徵選擇

  2. 關於模型在各個維度進行不均勻伸縮後,最優解與原來等價嗎?
    答:等不等價要看最終的誤差優化函式。如果經過變化後最終的優化函式等價則等價。明白了這一點,那麼很容易得到,如果對原來的特徵乘除某一常數,則等價。做加減和取對數都不等價

  3. 關於邏輯迴歸,連續特徵離散化的好處
    (1)可以實現非線性。舉例,一個變數如果服從對數正態分佈,那麼對於不同區間,重要度不同。因此我們通過離散化,可以實現對不同區間學習不同的權重。