【機器學習】混淆矩陣及其繪製
混淆矩陣主要用於表示分類精度,利用橫軸為預測結果縱軸為標準結果的表格圖,視覺化地展示演算法的分類效能。
一個混淆矩陣的例子
其中第一類有10個,第二類有14個,第三類有21個。而實際的預測結果是第一類有一個樣本錯誤預測為了第二類;第二類有5個錯認為第一類,2個錯認為第三類;第三類中有兩個被錯認為第一類,6個第二類。
:D | :D | class 1↓ | class 2↓ | class 3↓ |
---|---|---|---|---|
:D | :D | 實際結果↓ | 實際結果↓ | 實際結果↓ |
預測結果→ | class1 | 9 | 5 | 2 |
預測結果→ | class2 | 1 | 7 | 6 |
預測結果→ | class3 | 0 | 2 | 13 |
而所有正確預測的都在對角線上!通過混淆矩陣可以直觀的看到演算法對於哪些分類存在的問題。(行或者列代表預測結果/真實結果不影響最終矩陣的表現,因為不在對角線的元素才會顯示演算法的效能,交換行列矩陣只會裝置對稱)
混淆矩陣的視覺化
我們在獲得分類結果後,可以使用matplotlib來進行混淆矩陣的視覺化,具體的計算方法可以參考scikit-learn,tensorflow,matlab
五種分類的情況下,假設混淆矩陣如下所示:
class = ['A','B','C','D','E'] #類別標籤
confusion_matrix = [[9 1 3 4 0 0]
[2,13,1,3,4]
[1 4 10 0 13]
[3 1 1 17 0]
[0 0 0 1 14]]
#混淆矩陣
#confusion_matrix
import numpy as np
import matplotlib.pyplot as plt
classes = ['A','B','C','D','E']
confusion_matrix = np.array([(9,1,3,4,0),(2,13,1,3,4),(1,4,10,0,13),(3,1,1,17,0),(0,0,0,1,14)],dtype=np.float64)
plt.imshow(confusion_matrix, interpolation='nearest', cmap=plt.cm.Oranges) #按照畫素顯示出矩陣
plt.title('confusion_matrix')
plt.colorbar()
tick_marks = np.arange(len(classes))
plt.xticks(tick_marks, classes, rotation=-45)
plt.yticks(tick_marks, classes)
thresh = confusion_matrix.max() / 2.
#iters = [[i,j] for i in range(len(classes)) for j in range((classes))]
#ij配對,遍歷矩陣迭代器
iters = np.reshape([[[i,j] for j in range(5)] for i in range(5)],(confusion_matrix.size,2))
for i, j in iters:
plt.text(j, i, format(confusion_matrix[i, j])) #顯示對應的數字
plt.ylabel('Real label')
plt.xlabel('Prediction')
plt.tight_layout()
plt.show()
#iter:https://blog.csdn.net/zlf19910726/article/details/79172333
#np:https://blog.csdn.net/a486259/article/details/85238726
#array manipulate:https://blog.csdn.net/zhangchuang601/article/details/79626511
#color:https://matplotlib.org/users/colormaps.html
ref:
wiki:https://en.wikipedia.org/wiki/Confusion_matrix
scikit-learn:https://scikit-learn.org/stable/auto_examples/model_selection/plot_confusion_matrix.html
matlab:https://www.mathworks.com/help/deeplearning/ref/confusion.html
Tensorflow:https://tensorflow.google.cn/api_docs/python/tf/confusion_matrix
https://www.cnblogs.com/bonelee/p/8610205.html
https://blog.csdn.net/qq_28448117/article/details/78219549
https://blog.csdn.net/wowotuo/article/details/38262057
https://www.cnblogs.com/missidiot/p/9450662.html
https://baike.baidu.com/item/混淆矩陣/10087822?fr=aladdin
pic from ssyer.com