深度學習影象處理（分類or檢測）中結果的評價方法-mAP簡介

阿新 • • 發佈：2019-02-09

多標籤影象分類（Multi-label Image Classification）任務中圖片的標籤不止一個，因此評價不能用普通單標籤影象分類的標準，即mean accuracy，該任務採用的是和資訊檢索中類似的方法—mAP（mean Average Precision）。mAP雖然字面意思和mean accuracy看起來差不多，但是計算方法要繁瑣得多。

P-R曲線的繪製

用訓練好的模型得到所有測試樣本的confidence score，本例中某一類有20個測試樣本。（每一類的P-R曲線、AP均單獨計算）
對該類的confidence score排序，得到：
計算top-1到top-N（N是所有測試樣本個數，本文中為20）對應的precision和recall，這兩個標準的定義如下：

直觀的理解就是，第一次我們排序後第一個樣本的confidence作為劃分正負樣本的閾值，此時，只有第一個判斷為正，其他均為負樣本（因為其他樣本的confidence均小於第一個樣本的confidence），計算該閾值情況下的recall(1/1=1)和precision(1/1=1)；然後第二次將排序後第二個樣本的confidence作為劃分正負樣本的閾值，依次類推到最後一個。顯然隨著閾值的降低，我們選定的樣本越來也多，recall一定會越來越高，而precision整體上會呈下降趨勢。把recall當成橫座標，precision當成縱座標，即可得到常用的precision-recall曲線。這個例子的P-R曲線如下：

AP的計算

PASCAL VOC CHALLENGE自2010年後就換了新計算方法。新的計算方法假設這N個樣本中有M個正例，那麼我們會得到M個recall值（1/M, 2/M, …, M/M）,對於每個recall值r，我們可以計算出對應（r’ > r）的最大precision，然後對這M個precision值取平均即得到最後的AP值。計算方法如下：
這裡寫圖片描述
相應的Precision-Recall曲線中被用於計算AP的部分如下（每一個recall的節點都取precision的最大值連線起來）：

mAP的計算

AP衡量的是學出來的模型在每個類別上的好壞，mAP衡量的是學出的模型在所有類別上的好壞，得到AP後mAP的計算就變得很簡單了，就是取所有AP的平均值。

注：本文修改自原文，有增刪。

深度學習影象處理（分類or檢測）中結果的評價方法-mAP簡介

P-R曲線的繪製

AP的計算

mAP的計算

深度學習影象處理（分類or檢測）中結果的評價方法-mAP簡介

機器學習-深度學習-影象處理-opencv-matlab

[Python] 影象簡單處理（PIL or Pillow）

python----圖像簡單處理（PIL or Pillow）

《深度學習精要（基於R語言）》高清中文版PDF+高清英文版PDF+源代碼

深度學習發展歷程（2012年以前）

深度學習筆記2（手寫字型）

分享《深度學習精要（基於R語言）》+PDF+源碼+Joshua F.Wiley+高蓉

白話深度學習與TensorFlow（高清版）PDF

深度學習基礎2（反向傳播演算法）

數字影象處理（第三版）入門到放棄---第一章緒論

Python（1）：簡單影象處理（圖片->二進位制->圖片）

【影象處理】彩色影象處理（Color Image Processing）

軌跡預處理（停留點檢測）

【課程筆記】opencv+tensorflow入門人工智慧影象處理（2018-4-19）

形態學影象處理（matlab程式碼測試）

影象處理（二十一）基於資料驅動的人臉卡通動畫生成-Siggraph Asia 2014

深度學習影象分類（一）——AlexNet論文理解

矩陣－－演算法－－深度學習－－（影象處理、機器視覺、人工智慧、機器學習）資源整合

深度學習影象分類技術最近進展（以面板癌影象分類為例）

深度學習影象處理（分類or檢測）中結果的評價方法-mAP簡介

P-R曲線的繪製

AP的計算

mAP的計算

相關推薦