效能指標（模型評估）之ROC與AUC

阿新 • • 發佈：2019-01-27

為什麼ROC

在前面已經介紹了mAP效能指標，用於評估模型的效能（查全&查準雙高）了。這裡為什麼還需要介紹ROC呢？他是何方妖孽？

通過前面的P-R曲線可以看出來，選取的top-N隨著N的不同，模型對查全和差準的重視程度各有不同，比如N較小時更看重“查準率”，N越大越重視“查全率”。因此，排序本身的好壞，體現了綜合考慮學習器在不同任務下的“期望泛化效能”的好壞，或者是“一般情況下”泛化效能的好壞。ROC就是從這個角度來研究學習器的泛化效能的有力工具。

什麼是ROC

ROC的全稱是“受試者工作特徵”（receiver operating characteristic）曲線，源於“二戰”敵機檢測的雷達訊號分析技術。這裡為了說清楚他的定義，我們再次回顧下前面提到的表，同時也加入了兩個定義。

表1 測試樣本分類說明（分4類）

真實情況	預測為正	預測為反	召回率
正	TP（真正）	FN（假反）	TPR(或R)=TPTP+FN
反	FP（假正）	TN（真反）	FPR=FPTN+FP
準確率	P=TPTP+FP

準確率

預測結果中，究竟有多少是真的正？（找出來的對的比例）

P=TPTP+FP

召回率

所有正樣本中，你究竟預測對了多少？（找回來了幾個）

R=TPTP+FN

這裡要補充兩個東西

真正例率（True Positive Rate）

TPR=TPTP+FN

假正例率

（False Positive Rate）

FPR=FPTN+FP

看到了嗎？真正例率就是召回率，假正例率就是實際是反的當中，有多少被判為了正。ROC曲線就是以TPR為縱軸，FPR為橫軸的曲線。

中間的對角線對應於“隨機猜測”模型，(0,1)對應所有正例排在反例之前的“理想模型”。值得注意的是，現實任務中通常是利用有限個測試樣例繪製ROC圖，因此不會得到光滑的曲線，只能得到向上面的右圖離散圖形，離散ROC曲線繪製過程和P-R曲線繪製套路相同（就是對預測輸出從高到低排序，然後一次劃分）。同樣地，若一個學習器的ROC曲線被另一個學習器完全包圍，則後者效能更優，當然交叉式就很難說了，此時可比較ROC曲線下的面積，即是AUC，進行比較。

未完待續。。。

效能指標（模型評估）之ROC與AUC

為什麼ROC

什麼是ROC

準確率

召回率

真正例率（True Positive Rate）

假正例率

（False Positive Rate）

效能指標（模型評估）之ROC與AUC

效能指標（模型評估）之mAP

SAR變化檢測的效能指標（kappa係數）——簡化版

事件迴圈（Event Loop）之setTimout與Promise

CTR評估標準及ROC與AUC

機器學習效能指標（ROC、AUC、）

信用風險評估之預測力指標（篩選特徵）

C語言入門（十八）之指標、字串、函式

C語言入門（十七）之指標的基本概念

伺服器效能指標（二）——CPU利用率分析及問題排查

效能測試各效能指標（效能測試面試必問）

準確率召回率以及F1（模型評估方法）

資料預處理備忘（特徵選擇，三大降維技術，資料形態處理，模型評估）

Andrew Ng機器學習課程筆記（十六）之無監督學習之因子分析模型與EM演算法

伺服器效能指標（一）——負載（Load）分析及問題排查

Oracle12c中SQL效能優化（SQL TUNING）新特性之自動重優化（automatic reoptimization）

Deep Learning（深度學習）之（三）Deep Learning的常用模型或者方法

SQL優化（SQL TUNING）之10分鐘完畢億級數據量性能優化（SQL調優）

Python爬蟲從入門到放棄（十一）之 Scrapy框架整體的一個了解

Python爬蟲從入門到放棄（十八）之 Scrapy爬取所有知乎用戶信息(上)

效能指標（模型評估）之ROC與AUC

為什麼ROC

什麼是ROC

準確率

召回率

真正例率（True Positive Rate）

假正例率 （False Positive Rate）

相關推薦

假正例率

（False Positive Rate）