分類模型的評價指標--混淆矩陣，F1-score，ROC曲線，AUC，KS曲線

阿新 • • 發佈：2018-12-13

1. 混淆矩陣---確定截斷點後，評價學習器效能

TP（實際為正預測為正），FP（實際為負但預測為正），FN（實際為正但預測為負），TN（實際為負預測為負）

通過混淆矩陣我們可以給出各指標的值：

查全率（召回率，Recall）：樣本中的正例有多少被預測準確了，衡量的是查全率，預測對的正例數佔真正的正例數的比率：

查全率 = TP / (TP+FN)

查準率（精準率，Precision）：針對預測結果而言，預測為正的樣本有多少是真正的正樣本，衡量的是查準率，預測正確的正例數佔預測為正例總量的比率：

查準率 = TP / (TP+FP)

準確率（Accuracy）：反映分類器對整個樣本的判定能力，能將正的判定為正，負的判定為負的能力，計算公式：

Accuracy=(TP+TN) / (TP+FP+TN+FN)

陰性預測值：可以理解為負樣本的查準率，陰性預測值被預測準確的比例，計算公式：

NPV=正確預測到的負例數/實際負例總數=TN / (TN+FN)

如果為多分類，也可以通過混淆矩陣得到上述指標的具體值。

查準率和查全率通常是一對矛盾的度量，通常一個高，另外一個就低。兩個指標都很重要，我們應該根據實際情況綜合考慮這兩個指標。會有一個查準率=查全率的“平衡點”，過了這個點，查全率將增加，查準率將降低。

2. F1-score---查準率和查全率的加權調和平均數

（1）當認為查準率和查全率一樣重要時，權重相同時：

（2）當查準率和查全率的重要性不同時，即權重不同時：

1. β=1，查全率的權重=查準率的權重，就是F1

2. β>1，查全率的權重>查準率的權重

3. β<1，查全率的權重<查準率的權重

除了F1分數之外，F0.5分數和F2分數在統計學中也得到了大量應用。其中，F2分數中，查全率的權重高於查準率，而F0.5分數中，查準率的權重高於查全率。另外，F1分數又分為巨集-F1和微-F1。

3. ROC曲線， AUC---評價學習器效能，檢驗分類器對客戶進行正確排序的能力

分類器產生的結果通常是一個概率值不是直接的0/1變數，通常數值越大，代表正例的可能性越大。

根據任務的不同也會採取不同的“截斷點”，大於則為正例，小於則為反例。如重視查全率，則閾值可以設定低一些；而重視查準率，閾值可以設定高一些。

如果設定了截斷點或明確了任務，那麼我們根據混淆矩陣就可以知道分類器的效果好壞（計算出P、R和截斷點或閾值進行比較）。

在未設定截斷點（任務不明確）情況下，我們如何評價一個分類模型的效果的好壞或者比較不同分類模型效果呢？

我們可以觀察這個學習器利用所有可能的截斷點（就是所有樣本的預測結果）對樣本進行分類時的效果，注意要先對所有可能的截斷點進行排序，方便對比觀察。

ROC曲線描繪的是不同的截斷點時，並以FPR和TPR為橫縱座標軸，描述隨著截斷點的變小，TPR隨著FPR的變化。

縱軸：TPR=正例分對的概率 = TP/(TP+FN)，其實就是查全率

橫軸：FPR=負例分錯的概率 = FP/(FP+TN)

如果是隨機分類，沒有進行任何學習器，FPR=TPR，即正例分對和負例分錯概率相同，預測出來的正例負例和正例負例本身的分佈是一致的，所以是一條45°的直線。因此，ROC曲線越向上遠離這條45°直線，說明用了這個學習器在很小的代價（負例分錯為正例，橫軸）下達到了相對較大的查全率（TPR）。

4. KS曲線，KS值---學習器將正例和反例分開的能力，確定最好的“截斷點”

KS曲線和ROC曲線都用到了TPR，FPR。KS曲線是把TPR和FPR都作為縱座標，而樣本數作為橫座標。

對混淆矩陣、F1-Score、ROC曲線、AUC和KS曲線的理解

（一）混淆矩陣混淆矩陣是除了ROC曲線和AUC之外的另一個判斷分類好壞程度的方法。下面給出二分類的混淆矩陣Predicted as PositivePredicted as NegativeLabeled as Positive True Positive(TP)Fals

分類模型的評價指標--混淆矩陣，F1-score，ROC曲線，AUC，KS曲線

1. 混淆矩陣---確定截斷點後，評價學習器效能 TP（實際為正預測為正），FP（實際為負但預測為正），FN（實際為正但預測為負），TN（實際為負預測為負）通過混淆矩陣我們可以給出各指標的值：查全率（召回率，Recall）：樣本中的正例有多少被預測準確了，衡量的

分類模型的評價指標--混淆矩陣，ROC，AUC，KS，Lift，Gain

對於分類模型，常用的指標有混淆矩陣、ROC曲線，AUC值，KS曲線以及KS值、Lift圖，Gain圖等，查閱了很多的資料，加入自己的理解整理了一下他們的計算方法和意義，希望對大家有幫助。1. 混淆矩陣---確定截斷點後，評價學習器效能假設訓練之初以及預測後，一個樣本是正例還是

機器學習中模型的效能度量方式：混淆矩陣，F1-Score、ROC曲線、AUC曲線。

一、混淆矩陣混淆矩陣也稱誤差矩陣，是表示精度評價的一種標準格式，混淆矩陣的每一列代表了預測類別，每一列的總數表示預測為該類別的資料的數目；每一行代表了資料的真實歸屬類別，每一行的資料總數表示該類別的資料例項的數目。每一列中的數值表示真實資料被預測為該類的數目。

分類精度評價：混淆矩陣+總體精度OA、F1值等

整理歸納舉例記錄一下（一）混淆矩陣混淆矩陣也稱誤差矩陣，是表示精度評價的一種標準格式，用n行n列的矩陣形式來表示。 Predicted as Positive（預測-正例） Predicted as Negative（預測-反例） Label

二分類模型評價指標-AUC

AUC的含義和計算***** AUC針對二分類模型效果進行評價，二分類模型有時可能得到的是一個概率值，這個概率值表明為（0或1類）的可能性（不同於決策樹分類，我們會直接得到一個確切分類），我們劃定一個具體概率值p，大於則為正，小於則為負，然後使用acc或其他指標評價，其實這樣做有很大漏洞

理解分類模型評價指標AUC

ROC(Receiver Operating Characteristic) 受試者工作特性曲線縱軸TPR(真正例率)和橫軸FPR(假正例率)分別為對於二分類問題，預測模型會對每一個樣本預測一個概率p。然後，可以選取一個閾

二分類模型評價指標-Sklearn

Sklearn的metrics模組下有多個計算模型評價指標的函式，本文只介紹二分類的指標函式。 1.準確率 1.1引數說明 sklearn.metrics.accuracy_score(y_true, y_pred, normalize=T

【評價指標】詳解F1-score與多分類MacroF1&MicroF1

文章來自：一個寶藏微信公眾號【機器學習煉丹術】 # 基本概念首先，要背住的幾個概念就是：accuracy,precision,recal, TP,FP,TN,FN - TP:true positive。預測是正確的正樣本 - FP:false positive。預測是錯誤的正樣本 - TN：true neg

R語言︱分類器的效能表現評價（混淆矩陣，準確率，召回率，F1,mAP、ROC曲線）

筆者寄語：分類器演算法最後都會有一個預測精度，而預測精度都會寫一個混淆矩陣，所有的訓練資料都會落入這個矩陣中，而對角線上的數字代表了預測正確的數目，即True Positive+True Nagetive。——————————————————————————相關內容：————

[機器學習]模型評價參數，準確率，召回率，F1-score

就是 ddl .com gpo sci 擔心 height 數據 -s 很久很久以前，我還是有個建築夢的大二少年，有一天，講圖的老師看了眼我的設計圖，說：“我覺得你這個設計做得很緊張”，當時我就崩潰，對緊張不緊張這樣的評價標準理解無能。多年後我終於明白老師當年的意思，然鵝已

機器學習：評價分類結果（實現混淆矩陣、精準率、召回率）

test set 目的 mod 二分參數 nbsp return try 一、實例　1）構造極度偏差的數據 import numpy as np from sklearn import datasets digits = datasets.load_digits

【機器學習】機器學習分類器模型評價指標機器學習分類器模型評價指標

機器學習分類器模型評價指標分類器評價指標主要有： 1，Accuracy 2，Precision 3，Recall 4，F1 score 5，ROC 曲線

【模型評估】混淆矩陣（Confusion matrix）及其指標

混淆矩陣是對有監督學習分類演算法準確率進行評估的工具。通過將模型預測的資料與測試資料進行對比，使用各種指標對模型的分類效果進行度量。 true conditon 真實值 predicted con

準確率，召回率，F1 值、ROC，AUC、mse,mape評價指標

在機器學習、資料探勘領域，工業界往往會根據實際的業務場景擬定相應的業務指標。本文旨在一起學習比較經典的三大類評價指標，其中第一、二類主要用於分類場景、第三類主要用於迴歸預測場景，基本思路是從概念公式，到

準確率，召回率，F1 值、ROC，AUC、mse，mape 評價指標

在機器學習、資料探勘領域，工業界往往會根據實際的業務場景擬定相應的業務指標。本文旨在一起學習比較經典的三大類評價指標，其中第一、二類主要用於分類場景、第三類主要用於迴歸預測場景，基本思路是從概念公式，到優缺點，再到具體應用（分類問題，本文以二分類為例）。 1.準確率P、召回

分類器評價指標 ROC,AUC,precision，recall，F-score

ROC (Receiver Operating Characteristic) 曲線和 AUC (Area Under the Curve) 值常被用來評價一個二值分類器 (binary classifi

機器學習小白看過來，帶你全面瞭解分類器評價指標

AI 研習社按：為你的分類器選擇正確的評價指標十分關鍵。如果選不好，你可能會陷入這樣的困境：你認

機器學習（十四）輕鬆理解模型評價指標

篇首語相信大家都知道下面的圖片是啥意思，每個無論在啥公司、無論哪個行業都有自己的KPI評價指標，公司會根據公司情況設定公司戰略KPI、部門KPI、以及每個人的指標，對於員工也是比較關心自己的KPI因為關係著你

機器學習演算法-模型評價指標

二分類模型指標混淆矩陣 TP（實際為正預測為正），FP（實際為負但預測為正），TN（實際為負預測為負），FN（實際為正但預測為負）準確率 Accuracy=TP+TNTP+FP+TN+FNAccuracy=TP+TNTP+FP+

分類模型的評價指標--混淆矩陣，F1-score，ROC曲線，AUC，KS曲線

相關推薦