準確率、查準率、召回率
阿新 • • 發佈:2019-01-25
混淆矩陣
True Positive(真正,TP):將正類預測為正類數
True Negative(真負,TN):將負類預測為負類數
False Positive(假正,FP):將負類預測為正類數誤報
False Negative(假負,FN):將正類預測為負類數→漏報
1、 準確率(Accuracy)
定義:就是被分對的樣本數除以所有的樣本數,通常來說,正確率越高,分類器越好。
反映了分類器統對整個樣本的判定能力——能將正的判定為正,負的判定為負。
2、召回率(Recall)
定義:返回的結果中的正例佔總的正例的比例,總的正例包括返回的正確的正例以及未返回的正例(即錯誤分為負例中的正例)
- 反映了被正確判定的正例佔總的正例的比重。
- 所以為了提高召回率,可以多預測。
eg:有128個樣本,其中32個正,96個負。
我可以說,我預測有128個正樣本。所以recall= 32/32 = 100%
3、精度(Precision)
定義:被分為正例中實際為正例的比例,反映了被分類器判定的正例中真正的正例樣本的比重。
- 為了提高查準率(精度),可以少預測。
eg:還是上面的例子,上面的precision = 32/128 = 25%
我為了提高precision,我可以只預測一個樣本。這樣就有1/4的概率能預測到。假設恰好預測到了正樣本,此時precision = 1/1 = 100%