1. 程式人生 > 其它 >機器學習迴歸分類

機器學習迴歸分類

  • Logit模型的經濟學含義:PM10保持不變的時候,PM2.5增加一個單位,取1與取0的概率比增加e^0.05(優勢比)
  • 樹的形式表示推理規則集
  • 多項式的幾何理解:y=x+x2 是3維空間中的平面在2維空間中的曲線
  • 引數估計
    • 迴歸預測中的平方損失函式
    • 分類預測中的互動熵 p.s.K是類,二分類預測的指數損失函式,多分類情況用softmax函式
      • 交叉熵
      • 負號的作用:真實值*概率,概率越大,損失越小。
    • 搜尋策略:梯度下降法
  • 預測模型的評價:模型誤差、泛化誤差
    • 混淆矩陣
    • 敏感性、特異性
    • 查準率P(真陽佔所有查出來的陽)、查全率R(真陽佔所有本身的陽)

    • F1
    • Fvalue
    • 多分類模型
      • 建模策略:一對一,一對多
      • 微平均、巨集平均
    • ROC取不同的概率閾值——計算TPR、FPR
      • 什麼情況比較好?單個模型:橫軸增加,縱軸迅速增加;模型比較:包住
      • (b)圖也可以幫助確定概率閾值
    • P-R曲線
  • 模型選擇的基本原則:奧克姆剃刀原則、避免過擬合
  • 預測模型的偏差—方差分解:增加模型複雜度,降低偏差,但方差會增加
  • 調參是在調什麼:模型如何在偏差、方差取得平衡