1. 程式人生 > >機器學習與深度學習系列連載: 第一部分 機器學習(十八)模型評估

機器學習與深度學習系列連載: 第一部分 機器學習(十八)模型評估

模型評估

模型評估中有三個關鍵問題:
 如何獲得測試結果? 評估方法
 如何評估效能優劣? 效能度量
 如何判斷實質差別? 比較檢驗

2. 效能度量(performance measure)是衡量模型泛化能力的

評價標準,反映了任務需求

(1)錯誤率 VS 精度
在這裡插入圖片描述
(2)查準率 vs. 查全率
在這裡插入圖片描述
(3)PR圖, BEP
在這裡插入圖片描述
(4)F1
在這裡插入圖片描述
(5)ROC, AUC
在這裡插入圖片描述
(6)非均等代價
在這裡插入圖片描述

3. 比較檢驗

在某種度量下取得評估結果後,是否可以直接比較以評判優劣?
在這裡插入圖片描述
機器學習的理論基礎
在這裡插入圖片描述
常用方法:
統計假設檢驗 (hypothesis test) 為學習器效能比較提供了 重要依據
在這裡插入圖片描述
Friedman 檢驗圖:
在這裡插入圖片描述