機器學習mAP之我見

阿新 • • 發佈：2019-01-04

mAP（mean Average Precision）

Precision and Recall

在模型評估時，我們往往會參照一些效能指標，最基本的如準確率和召回率。看過西瓜書的同學應該對下面這張表格很熟悉：

predicted:P	predicted:F
actual:P	TP	FN
actual:N	FP	TN

這張表其實很好記憶，橫著看(actual:P和actual:N)代表實際所屬的類別;豎著看(predicted:P和predicted:N)代表預測的型別。如果實際和預測都一樣，那就是真正例(TP)和真反例(TN),對應表格的主對角線。如果實際是反例卻預測成了正例，那就是假正例(FP),注意，這都是與實際的標籤(actual)來對比的

，同理可推出FN。
在瞭解了表格的意義之後，就很好解釋準確率(P)和召回率(R)了：

P= $\frac{T P}{T P + F P}$

R= $\frac{T P}{T P + F N}$

準確率P是評估你預測的準不準（看預測列），而召回率R是看你找的全不全(看實際行)。如果處理平衡資料集用這些效能指標還好說，但是一旦你的資料集不平衡，那麼這些指標可參考的價值就不那麼具備參考性了。舉個例子：對於一個二分類問題，如果其中90%是正樣本，只有10%是負樣本的話，而我的模型就是全部輸出為正樣本的分類器，那麼準確率依然高達90%，但是這樣並沒有意義。所以提出了AP的概念。

Average Precision

所謂的AP，其實就是平均準確率。這裡的平均是相對於不同驗證集而言的。
這裡寫圖片描述
假設我們想要訓練一個貓咪分類器，如果是基於畫素點級別的，那麼就可以將它轉換為一個二分類任務，判斷這個畫素點是不是屬於貓的。這樣，我們可以得到屬於貓咪的畫素點的準確率P₁= $\frac{T P}{T P + F P}$ ，當然，我麼還有其他很多的驗證圖片，這樣還可以得到P₂,P₃,…而AP就是對於這些求平均值：
$A P = \frac{\sum_{i = 0}^{N} P i}{N}$ .

mean Average Precision

所謂的mAP，其實就是對m個類別的AP取平均值，對於上文講的貓咪分類器，其實就是一個二分類器，它的mAP就等於正樣本的準確率與負樣本的準確率的平均值，多分類任務也可以如法炮製。
相比於P,R，mAP這個效能指標對於資料不平衡問題就靠譜很多。還是拿之前舉的例子來說：90%的正樣本，10%的負樣本，如果採用全部輸出為正的分類器，那麼P_正

=0.9,P_負=0,而mAP=0.45.

Tips：
1.本文只是一個學習筆記，內容可能會有錯誤，僅供參考。
2.如果你發現文中的錯誤，歡迎留言指正，謝謝！

機器學習mAP之我見

mAP（mean Average Precision）

Precision and Recall

Average Precision

mean Average Precision

機器學習mAP之我見

機器學習實戰之PCA

機器學習入門之四：機器學習的方法-神經網絡（轉載）

機器學習入門之決策樹算法

機器學習入門之python實現圖片簡單分類

機器學習實戰之第二章 k-近鄰算法

（原創）(二)機器學習筆記之數據預處理

Spark2.0機器學習系列之7： MLPC（多層神經網絡）

機器學習總結之第一章緒論

機器學習總結之第二章模型評估與選擇

python機器學習密碼之初來乍到

機器學習入門之使用numpy和matplotlib繪制圖形

機器學習系列之偏差、方差與交叉驗證

機器學習系列之特徵工程

機器學習系列之交叉驗證、網格搜尋

機器學習系列之GBDT

機器學習筆記之（7）——聚類演算法

體驗為王的年代，從視訊優化到QoE，機器學習實踐之路

機器學習入門之房價預測（線性迴歸）

機器學習實戰之迴歸

機器學習mAP之我見

mAP（mean Average Precision）

Precision and Recall

Average Precision

mean Average Precision

相關推薦