1. 程式人生 > >分類精度評價

分類精度評價

1、混淆矩陣(以二分類為例)

標準集
驗證集 真實的P樣本(positive) 真實的N樣本(Negtive)
預測的P樣本 TP(預測的P是真的) FP(預測的P是假的)
預測的N樣本 FN(預測的N是假的) TN(預測的N是真的)

現在開始解釋各種真陽、假陰。

舉例:由醫學引入機器學習;

一個病人,長了個腫瘤,去醫院檢查,分別有以下情況:

1、真實情況:惡性,檢查結果:惡性,這種情況就叫做:true positve,姑且稱為真陽性吧。

2、真實情況:良性,檢查結果:惡性,這種情況就叫做:false positve,假陽性。

3、真實情況:惡性,檢查結果:良性,這種情況就叫做:false negative,假陰性。

4、真實情況:良性,檢查結果:良性,這種情況就叫做:true negtive,真陰性。

好拗口,上表。(注意:陽性是有病,陰性是沒病)

金準集
某篩檢方法 陽性(惡性) 陰性(良性)
陽性(惡性) TP(真陽性) FP(假陽性)
陰性(良性) FN(假陰性) TN(真陰性)

發現一切命名以預測的結果為主。

2、真陽率與假陽率

真陽率(True Positive Rate, TPR)就是: 

                                        TP/(TP+FN) 含義是檢測出來的真陽性樣本數除以所有真實陽性樣本數。

假陽率(False Positive Rate, FPR)就是: 

                                          FP/(FP+TN) 含義是檢測出來的假陽性樣本數除以所有真實陰性樣本數

3、各種率

誤檢率:FP/(FP+TN)

查準率(精確度):TP/(TP+FP)   反映了被分類器判定的正例中真正的正例樣本的比重

查全率(召回率):TP/(TP+FN)  反映了被正確判定的正例佔總比例的比重

漏檢率: FN/(TP+FN)

4、漏警率,虛警率

漏警率:  MA = FN/(TP+FN) ; 反映有多少個正例被漏判了。

虛警率: FA = FP/(TP+FP); 反映被判為正例樣本中,有多少個負例。