機器學習中的評價指標和應用場景
阿新 • • 發佈:2019-02-15
目錄
常見統計量
一般對於一個二分類問題,需要統計預測得到的正負樣本的個數和預測成功和失敗的樣本個數
- True: 預測正確的樣本數
- False: 預測錯誤的樣本數
- Positive: 預測為正樣本的樣本數
- Negative: 預測為負樣本的樣本數
組合的統計量
將以上的四個量進行組合得到下面的四個更為常見的四個樣本數
-TP: 將正樣本預測為正樣本的樣本數
-FP: 將負樣本預測為正樣本的樣本數
-TN: 將負樣本預測為負樣本的樣本數
-TN: 將負樣本預測為負樣本的樣本數
Precision & Recall & Accuracy
Precision
精確率,在所有預測為正樣本的樣本(TP+FP)中預測正確(TP)的比例,也就是
Recall
召回率,在所有正樣本(TP+FN)中,預測正確(TP)的比例,也就是
Accuracy
準確率,正確分類的樣本佔所有樣本的比例,不適於資料極度不平衡的場景如廣告點選率一般在千分之幾,
F1-measure
F1分數,是綜合考慮Precision和Recall得到的一個指標,一般在需要PR都要保證的場景使用,針對一個值的優化更加直觀容易衡量
1=2PRP+R
ROC
TPR
真正類率,即正確分類的正樣本佔所有正樣本的比例
FPR
假正類率,即誤分類為正樣本佔所有負樣本的比率
ROC曲線就是當將預測結果分割為正負樣本的閾值變化時,以FPR作為x軸,以TPR作為y軸得到的曲線,因為TPR,FPR 都是正類和正類比較,負類和負類比較,所以不受資料不平衡問題的困擾,但是同時也會掩蓋這個問題,此曲線和x軸之間的區域面積即使下面要說的AUC的值
AUC
如同PR曲線和F1類似,一個單獨的數值有利於對模型的衡量,所以有了AUC,AUC的數值計算需要利用一個等價的結論,AUC等價於任意去正負樣本,正樣本得分高於負樣本得分的概率,基於這個結論可以得到下面的計算方法
【未完待續】