1. 程式人生 > >機器學習中的評價指標和應用場景

機器學習中的評價指標和應用場景

目錄

常見統計量

一般對於一個二分類問題,需要統計預測得到的正負樣本的個數和預測成功和失敗的樣本個數

  • True: 預測正確的樣本數
  • False: 預測錯誤的樣本數
  • Positive: 預測為正樣本的樣本數
  • Negative: 預測為負樣本的樣本數

組合的統計量

將以上的四個量進行組合得到下面的四個更為常見的四個樣本數

-TP: 將正樣本預測為正樣本的樣本數
-FP: 將負樣本預測為正樣本的樣本數
-TN: 將負樣本預測為負樣本的樣本數
-TN: 將負樣本預測為負樣本的樣本數

Precision & Recall & Accuracy

Precision

精確率,在所有預測為正樣本的樣本(TP+FP)中預測正確(TP)的比例,也就是
Precision=TPTP+FP

Recall

召回率,在所有正樣本(TP+FN)中,預測正確(TP)的比例,也就是
Recall=TPTP+FN

Accuracy

準確率,正確分類的樣本佔所有樣本的比例,不適於資料極度不平衡的場景如廣告點選率一般在千分之幾,
Accuracy=TP+TNTP+TN+FP+FN

F1-measure

F1分數,是綜合考慮Precision和Recall得到的一個指標,一般在需要PR都要保證的場景使用,針對一個值的優化更加直觀容易衡量
F

1=2PRP+R

ROC

TPR

真正類率,即正確分類的正樣本佔所有正樣本的比例
TPR=TPTP+FN

FPR

假正類率,即誤分類為正樣本佔所有負樣本的比率
FPR=FPFP+TN

ROC曲線就是當將預測結果分割為正負樣本的閾值變化時,以FPR作為x軸,以TPR作為y軸得到的曲線,因為TPR,FPR 都是正類和正類比較,負類和負類比較,所以不受資料不平衡問題的困擾,但是同時也會掩蓋這個問題,此曲線和x軸之間的區域面積即使下面要說的AUC的值

AUC

如同PR曲線和F1類似,一個單獨的數值有利於對模型的衡量,所以有了AUC,AUC的數值計算需要利用一個等價的結論,AUC等價於任意去正負樣本,正樣本得分高於負樣本得分的概率,基於這個結論可以得到下面的計算方法
【未完待續】