1. 程式人生 > 實用技巧 >多分類問題的評價指標

多分類問題的評價指標

對於二分類問題,precision,recall,auc,f1_score的計算原理都比較熟悉,但是多分類問題的計算還是有一點小小的區別,在使用sklearn.metrics的時候需要注意一下;

對於sklearn.metrics下的roc_auc_score, precision_score, recall_score, f1_score的幾個引數需要設定:

sklearn.metrics.precision_score(y_true,y_pred,labels=None,pos_label=1,average=’binary’,sample_weight=None)

以precision_score為例,主要是average引數有幾種選擇:

binary:二分類

macro:每個標籤都計算precision,然後求平均,不考慮資料均衡問題

micro:計算全資料的precision

weighted,:每個標籤都計算precision,然後考慮各個類別資料量權重加權求和

samples:多標籤問題使用

所以在資料均衡情況下一般使用macro

f1_score 的計算公式 f1_score = (1+12) * p * r / 12* r + p

從公式中可以看出引數1其實是準確率和召回率的調和引數,小於1則提高準確率的權重,大於1則提高召回率的權重,因此在實際中也有F0.5-score, F2-score的使用