機器學習:理論知識
一、混淆矩陣(Confusion matrix)
混淆矩陣也稱誤差矩陣,是表示精度評價的一種標準格式,用n行n列的矩陣形式來表示。具體評價指標有總體精度、制圖精度、用戶精度等,這些精度指標從不同的側面反映了圖像分類的精度。在人工智能中,混淆矩陣(confusion matrix)是可視化工具,特別用於監督學習,在無監督學習一般叫做匹配矩陣。矩陣的每一行表示預測類中的實例,而每一列表示實際類中的實例(反之亦然)。這個名字源於這樣一個事實,即很容易看出系統是否混淆了兩個類。
二、損失函數(Loss function)
在數學優化,統計學,計量經濟學,決策理論,機器學習和計算神經科學等領域,損失函數或成本函數是將一或多個變量的一個事件或值映射為可以直觀地表示某種與之相關“成本”的實數的函數。
三、先驗知識(prior knowledge)
先驗(apriori; 先天)在拉丁文中指‘來自先前的東西’,或稍稍引申指‘在經驗之前’。近代西方傳統中,認為先驗指無需經驗或先於經驗獲得的知識。先驗知識不依賴於經驗,比如,數學式子2+2=4;恒真命題‘所有的單身漢一定沒有結婚’。
四、參數(parameter)
在數學和統計學裏,參數是使用通用變量來建立函數和變量之間關系(當這種關系很難用方程來闡述時)的一個數量。
五、遷移學習(Transfer learning)
遷移學習是一種機器學習方法,就是把為任務A開發的模型作為初始點,重新使用在為任務B開發模型的過程中。遷移學習是通過從已學習的相關任務中轉移知識來改進學習的新任務
六、準確率(Accuracy)
分類模型的正確預測所占的比例。在多類別分類中,準確率的定義為:正確的預測數/樣本總數。在二元分類中,準確率的定義為:(真正例數+真負例數)/樣本總數。
機器學習:理論知識