機器學習模型評價指標
阿新 • • 發佈:2018-12-16
1)正確率(accuracy)
正確率是我們最常見的評價指標,accuracy = (TP+TN)/(P+N),這個很容易理解,就是被分對的樣本數除以所有的樣本數,通常來說,正確率越高,分類器越好;
2)錯誤率(error rate)
錯誤率則與正確率相反,描述被分類器錯分的比例,error rate = (FP+FN)/(P+N),對某一個例項來說,分對與分錯是互斥事件,所以accuracy =1 - error rate;
3)靈敏度(sensitive)
sensitive = TP/P,表示的是所有正例中被分對的比例,衡量了分類器對正例的識別能力;
4)特效度(specificity)
specificity = TN/N,表示的是所有負例中被分對的比例,衡量了分類器對負例的識別能力;
5)精度(precision)
精度是精確性的度量,表示被分為正例的示例中實際為正例的比例,precision=TP/(TP+FP);
6)召回率(recall)
召回率是覆蓋面的度量,度量有多個正例被分為正例,recall=TP/(TP+FN)=TP/P=sensitive,可以看到召回率與靈敏度是一樣的。
7)其他評價指標
- 計算速度:分類器訓練和預測需要的時間;
- 魯棒性:處理缺失值和異常值的能力;
- 可擴充套件性:處理大資料集的能力;
- 可解釋性:分類器的預測標準的可理解性,像決策樹產生的規則就是很容易理解的,而神經網路的一堆引數就不好理解,我們只好把它看成一個黑盒子。