機器學習中的評價指標和應用場景

阿新 • • 發佈：2019-02-15

常見統計量

一般對於一個二分類問題，需要統計預測得到的正負樣本的個數和預測成功和失敗的樣本個數

True: 預測正確的樣本數
False: 預測錯誤的樣本數
Positive: 預測為正樣本的樣本數
Negative: 預測為負樣本的樣本數

組合的統計量

將以上的四個量進行組合得到下面的四個更為常見的四個樣本數

-TP: 將正樣本預測為正樣本的樣本數
-FP: 將負樣本預測為正樣本的樣本數
-TN: 將負樣本預測為負樣本的樣本數
-TN: 將負樣本預測為負樣本的樣本數

Precision & Recall & Accuracy

Precision

精確率，在所有預測為正樣本的樣本(TP+FP)中預測正確(TP)的比例，也就是
Precision=TPTP+FP

Recall

召回率，在所有正樣本(TP+FN)中，預測正確(TP)的比例，也就是
Recall=TPTP+FN

Accuracy

準確率，正確分類的樣本佔所有樣本的比例，不適於資料極度不平衡的場景如廣告點選率一般在千分之幾，
Accuracy=TP+TNTP+TN+FP+FN

F1-measure

F1分數，是綜合考慮Precision和Recall得到的一個指標，一般在需要PR都要保證的場景使用，針對一個值的優化更加直觀容易衡量
F

1=2PRP+R

ROC

TPR

真正類率，即正確分類的正樣本佔所有正樣本的比例
TPR=TPTP+FN

FPR

假正類率，即誤分類為正樣本佔所有負樣本的比率
FPR=FPFP+TN

ROC曲線就是當將預測結果分割為正負樣本的閾值變化時，以FPR作為x軸，以TPR作為y軸得到的曲線，因為TPR,FPR 都是正類和正類比較，負類和負類比較，所以不受資料不平衡問題的困擾，但是同時也會掩蓋這個問題，此曲線和x軸之間的區域面積即使下面要說的AUC的值

AUC

如同PR曲線和F1類似，一個單獨的數值有利於對模型的衡量，所以有了AUC，AUC的數值計算需要利用一個等價的結論，AUC等價於任意去正負樣本，正樣本得分高於負樣本得分的概率，基於這個結論可以得到下面的計算方法
【未完待續】

機器學習中的評價指標和應用場景

目錄

常見統計量

組合的統計量

Precision & Recall & Accuracy

Precision

Recall

Accuracy

F1-measure

ROC

TPR

FPR

AUC

機器學習中的評價指標和應用場景

【機器學習】--LDA初始和應用

python 機器學習中模型評估和調參

機器學習演算法——評價指標彙總

機器學習中的偏差和方差

9.機器學習模型評價指標

機器學習模型評價指標

機器學習常見評價指標：AUC、Precision、Recall、F-measure、Accuracy

R語言︱機器學習模型評價指標+（轉）模型出錯的四大原因及如何糾錯

機器學習模型評價指標及R實現

機器學習中訓練集和測試集歸一化-matlab

機器學習的評價指標（二）-SSE、MSE、RMSE、MAE、R-Squared

機器學習中的評價指標--1[F,P,R]

機器學習模型的評價指標和方法

機器學習中的單一評價指標

機器學習 | 詳解GBDT在分類場景中的應用原理與公式推導

Spark機器學習中ml和mllib中矩陣、向量

機器學習中的概率模型和概率密度估計方法及VAE生成式模型詳解之二（作者簡介）

機器學習中的概率模型和概率密度估計方法及VAE生成式模型詳解之一（簡介）

機器學習中的概率模型和概率密度估計方法及VAE生成式模型詳解之五（第3章之 EM算法）

機器學習中的評價指標和應用場景

目錄

常見統計量

組合的統計量

Precision & Recall & Accuracy

Precision

Recall

Accuracy

F1-measure

ROC

TPR

FPR

AUC

相關推薦