分類精度評價
阿新 • • 發佈:2018-12-20
1、混淆矩陣(以二分類為例)
標準集 | ||
驗證集 | 真實的P樣本(positive) | 真實的N樣本(Negtive) |
預測的P樣本 | TP(預測的P是真的) | FP(預測的P是假的) |
預測的N樣本 | FN(預測的N是假的) | TN(預測的N是真的) |
現在開始解釋各種真陽、假陰。
舉例:由醫學引入機器學習;
一個病人,長了個腫瘤,去醫院檢查,分別有以下情況:
1、真實情況:惡性,檢查結果:惡性,這種情況就叫做:true positve,姑且稱為真陽性吧。
2、真實情況:良性,檢查結果:惡性,這種情況就叫做:false positve,假陽性。
3、真實情況:惡性,檢查結果:良性,這種情況就叫做:false negative,假陰性。
4、真實情況:良性,檢查結果:良性,這種情況就叫做:true negtive,真陰性。
好拗口,上表。(注意:陽性是有病,陰性是沒病)
金準集 | ||
某篩檢方法 | 陽性(惡性) | 陰性(良性) |
陽性(惡性) | TP(真陽性) | FP(假陽性) |
陰性(良性) | FN(假陰性) | TN(真陰性) |
發現一切命名以預測的結果為主。
2、真陽率與假陽率
真陽率(True Positive Rate, TPR)就是:
TP/(TP+FN) 含義是檢測出來的真陽性樣本數除以所有真實陽性樣本數。
假陽率(False Positive Rate, FPR)就是:
FP/(FP+TN) 含義是檢測出來的假陽性樣本數除以所有真實陰性樣本數
3、各種率
誤檢率:FP/(FP+TN)
查準率(精確度):TP/(TP+FP) 反映了被分類器判定的正例中真正的正例樣本的比重
查全率(召回率):TP/(TP+FN) 反映了被正確判定的正例佔總比例的比重
漏檢率: FN/(TP+FN)
4、漏警率,虛警率
漏警率: MA = FN/(TP+FN) ; 反映有多少個正例被漏判了。
虛警率: FA = FP/(TP+FP); 反映被判為正例樣本中,有多少個負例。