周志華《機器學習》課後習題解答系列（三）：Ch2

阿新 • • 發佈：2019-01-05

本章概要

本章講述了模型評估與選擇（model evaluation and selection）的相關知識：

2.1 經驗誤差與過擬合（empirical error & overfitting）

精度accuracy、訓練誤差（經驗誤差）training error（empirical error）、泛化誤差**generalization error、過擬合**overfitting、欠擬合underfitting；

2.2 模型評估方法（evaluate method）

測試誤差testing error、留出法hold-out、分層取樣stratified sampling、交叉驗證法cross validation、k-折交叉驗證**k-fold cross validation、留一法leave-one-out（LOO）、

自助法bootstrapping、自助取樣bootstrap sampling、包外估計out-of-bag estimate、調參**parameter tuning、驗證集validation set；

2.3 模型效能度量（performance measure）

錯誤率error rate、查準率（準確率）precision、查全率（召回率）recall、P-R曲線、平衡點BEP、F1/Fβ、混淆矩陣、ROC曲線、AUC、代價敏感cost-sensitive、**代價矩陣**cost matrix、代價曲線cost curve、期望總體代價；

2.4 模型比較檢驗（comparation & testing）

假設檢驗hypothesis test、拒絕假設、t-檢驗t-test、Friedman檢驗、後續檢驗post-hoc test、Friedman檢驗圖；

2.5 偏差與方差（bias & variance）

偏差-方差窘境bias-variance dilemma；

習題解答

2.1 分層抽樣劃分訓練集與測試集

根據分層取樣原則，共有方法：

這裡寫圖片描述 .

2.2 留一法與k-折交叉驗證法比較

因為測試集被劃分到訓練樣本中多的類，設一共100個樣本：

留一法：測試集1個樣本，訓練集99個樣本且有50個與測試集真實類別不同，故測試集無法被劃分到正確的類，錯誤率100%

；

交叉驗證法：在採用分層抽樣的前提下，分類靠隨機猜，錯誤率因為50%；

2.3 F1值與BEP的關聯

首先給出度量定義：

BEP：是P-R曲線上的平衡點座標值，BEP = P = R (即準確率 = 召回率)；
F1值：是P與R的調和平均，1/F1 = (1/P + 1/R) / 2;

所以 BEP = F1 (當P = R時) -> BEP(A) > BEP(B).

2.4 TPR、FPR、P、R之間的關聯

給出混淆矩陣示例如下：

然後給出各度量的定義式：

詳細解釋是：

P，查準率（準確率），（預測正例）中（真實正例）的比例.
R，查全率（召回率），（真實正例）中（預測正例）的比例.
TPR，真正例率，（真實正例）中（預測正例）的比例，TPR = R.
FPR，假正例率，（真實反例）中（預測正例）的比例.

2.5 AUC推導（有限樣例下）

直接給出大致思路如下圖：

這裡寫圖片描述

2.6 錯誤率與ROC曲線的關係

錯誤率可由代價-混淆矩陣得出；

ROC曲線基於TPR與FPR表示了模型在不同截斷點取值下的泛化效能。

ROC曲線上的點越靠近（1，0）學習器越完美，但是常需要通過計算等錯誤率來實現P、R的折衷，而P、R則反映了我們所側重部分的錯誤率。

2.7 ROC曲線與代價曲線的對應關係

ROC曲線的點對應了一對（TPR,FPR），即一對（FNR,FPR），由此可得一條代價線段（0,FPR)–(1,FNR），由所有代價線段構成簇，圍取期望總體代價和它的邊界–代價曲線。所以說，ROC對應了一條代價曲線，反之亦然。

2.8 ROC曲線與代價曲線的關係

比較見表：

Max-min	z-score
方法簡單	計算量相對大一些
容易受高槓杆點和離群點影響	對離群點敏感度相對低一些
當加入新值超出當前最大最小範圍時重新計算所有之前的結果	每加入新值都要重新計算所有之前結果

2.9 卡方檢驗過程

周志華《機器學習》課後習題解答系列（三）：Ch2

本章概要本章講述了模型評估與選擇（model evaluation and selection）的相關知識： 2.1 經驗誤差與過擬合（empirical error & overfitting）精度accuracy、訓練誤差（經驗誤差）

周志華《機器學習》課後習題解答系列（一）：目錄

對機器學習一直很感興趣，也曾閱讀過李航老師的《統計學習導論》和Springer的《統計學習導論-基於R應用》等相關書籍，但總感覺自己缺乏深入的理解和系統的實踐。最近從實驗室角落覓得南京大學周志華老師《機器學習》一書，隨意翻看之間便被本書內容文筆深深吸引，如獲至寶

周志華《機器學習》課後習題解答系列（六）：Ch5.8

SOM神經網路實驗注：本題程式分別基於Python和Matlab實現（這裡檢視完整程式碼和資料集）。 1 基礎概述 1.1 SOM網路概念 SOM(Self-Organizing Map，自組織對映)網路是一種無監督的競爭型神經

周志華《機器學習》課後習題解答系列（六）：Ch5.10

卷積神經網路實驗 - 手寫字元識別注：本題程實現基於python-theano（這裡檢視完整程式碼和資料集）。 1. 基礎知識回顧 1.1. 核心思想卷積神經網路（Convolutional Neural Network, C

周志華《機器學習》課後習題解答系列（六）：Ch5.5

這裡的程式設計基於Python-PyBrain。Pybrain是一個以神經網路為核心的機器學習包，相關內容可參考神經網路基礎 - PyBrain機器學習包的使用 5.5 BP演算法實現實驗過程：基於PyBrain分別實現標準

周志華《機器學習》課後習題解答系列（六）：Ch5.7

5.7. RBF神經網路實驗注：本題程式基於Python實現（這裡檢視完整程式碼和資料集）。 1. RBF網路基礎 RBF網路採用RBF（Radial Basis Function函式）作為隱層神經元啟用函式，是一種區域性逼近神經

周志華《機器學習》課後習題解答系列（五）：Ch4

本章概要本章講述決策樹（decision tree），相關內容包括：決策樹生成（construction）子決策（sub-decision）、遞迴生成演算法（basic algorithm）、最優劃分屬性、純度（purity）、

周志華《機器學習》課後習題解答系列（四）：Ch3.3

思路概要程式設計實現對率迴歸： * 採用sklearn邏輯斯蒂迴歸庫函式實現，通過檢視混淆矩陣，繪製決策區域來檢視模型分類效果； * 自己程式設計實現，從極大化似然函數出發，採用梯度下降法得到最優引數，然後嘗試了隨機梯度下降法來優化過程。

周志華《機器學習》課後習題解答系列（七）：Ch6

本章概要本章講述支援向量機（Support Vector Machine，SVM），相關內容包括：支援向量分類器（SVM classifier）支援向量（support vector）、間隔（margin）、最大間隔（maximum

周志華機器學習總結

Lecture3 線性模型基本形式一般向量形式: 優點: 線性迴歸廣義線性模型對數機率迴歸由對數機率函式確定 $\boldsymbol{\omega}$ 和 $b$

周志華機器學習筆記

第1章 1.4歸納偏好學習演算法自身的歸納偏好與問題是否相配，往往會起到決定作用。對於上面這句話：你的輸入資料被怎麼處理，最終得到什麼結果，我認為偏好指的就是這個處理的過程。線性非線性？那些feature忽略掉？怎麼利用這些資料？更具體一些，你用網路處理，還是傳統方法，資料的分佈和你

周志華機器學習效能度量

2.5 效能度量效能度量（performance measure）是衡量模型泛化能力的評價標準，在對比不同模型的能力時，使用不同的效能度量往往會導致不同的評判結果。本節除2.5.1外，其它主要介紹分類模型的效能度量。 2.5.1 最常見的效能度量在迴歸任務中，即預測連續值的問題，最常

周志華機器學習

盜用weka 緒論 1.2基本術語學習任務大致分為兩類：監督學習：分類、迴歸無監督學習：聚類泛化：訓練得到的模型適用於新樣本的能力機器學習領域最重要的國際學術會議是國際機器學習會議 (ICML)、國

周志華機器學習筆記

http://blog.sina.cn/dpool/blog/s/blog_cfa68e330102ycy9.html?md=gd https://www.cnblogs.com/shiwanghualuo/p/7192678.html 首先的階段由卷積層和池化層組成，卷積的節點組織在特徵對映塊

[機器學習]ID3決策樹詳細計算流程周志華機器學習筆記原創Excel手算方法

1.用到的主要三條熵公式： 1.1 資訊熵詳情見夏農資訊理論概率越平衡事件所含有的資訊量越大 1.2 條件熵代表某一屬性下不同分類的資訊熵之和 1.3 資訊增益等於資訊熵減去條件熵，從數值上，越大的資訊增益在資訊熵一定的情況下，代表條件熵越小，條件熵越

周志華-機器學習-筆記（五）- 強化學習

#### 任務與獎賞 #### 　　“強化學習”(reinforcement learning)可以講述為在任務過程中不斷摸索，然後總結出較好的完成任務策略。　　強化學習任務通常用馬爾可夫決策過程(Markov Decision Process，簡稱M

周志華機器學習筆記（一）

新人一枚，既是機器學習的初學者，也是首次發部落格。謹以此記錄我的學習體會，做一些總結。望與大家共同學習、共同進步。文中若有內容錯誤或有措詞不嚴謹之處，望大家不吝指出。謝謝！機器學習中的基本概念基本術語根據上圖我們可以用一個三維空間來了解以

周志華機器學習讀後總結第10、11章

降維與度量學習什麼是降維學習降維是一種分類演算法，它是一種解決維數災難的重要途徑。例如二維資料經過投影變為一維資料從而更好的表徵資料的特徵，然後再進行識別；這就利用了降維的方法。 K鄰近學習 k近鄰學習是一種監督學習演算法，它給定測試樣本，基於某種距離度量找出與訓練集

周志華機器學習讀後總結第三章

線性模型基本形式線性模型試圖學得一個通過屬性的線性組合來進行預測的函式，即f(x)=w1x1+w2x2+…+wdxd+b,w和b學得之後，模型就得以確定，而w直觀表達了各屬性在預測中的重要性。線性迴歸線性迴歸試圖學得一個線性模型以儘可能準確的預測實值輸出標記。線性迴歸

周志華機器學習讀後總結第12、13章

計算學習理論什麼是計算學習理論計算學習理論是關於機器學習的理論基礎，其目的是分析學習任務的困難本質，為學習演算法提供理論保證，並根據分析結果指導演算法設計。泛化誤差和經驗誤差是計算學習理論的兩個重要概念，現實中我們常用經驗誤差作為泛化誤差的近擬。 PAC學習 PAC學

周志華《機器學習》課後習題解答系列（三）：Ch2

本章概要

習題解答

2.1 分層抽樣劃分訓練集與測試集

2.2 留一法與k-折交叉驗證法比較

2.3 F1值與BEP的關聯

2.4 TPR、FPR、P、R之間的關聯

2.5 AUC推導（有限樣例下）

2.6 錯誤率與ROC曲線的關係

2.7 ROC曲線與代價曲線的對應關係

2.8 ROC曲線與代價曲線的關係

2.9 卡方檢驗過程

相關推薦