周志華《機器學習》課後習題解答系列（七）：Ch6

阿新 • • 發佈：2019-02-18

本章概要

本章講述支援向量機（Support Vector Machine，SVM），相關內容包括：

支援向量分類器（SVM classifier）

支援向量（support vector）、間隔（margin）、最大間隔（maximum margin）、支援向量機（SVM）、對偶問題（dual problem）、拉格朗日乘子法；

核技巧（kernel trick）

特徵空間對映、高維可分、內積（inner product）、核函式（kernel function）、核矩陣（kernel matrix）半正定性、再生希爾伯特空間（RHKS）、核函式選擇、多項式核、高斯核、Sigmoid核；

軟間隔（soft margin）

硬間隔、軟間隔、鬆弛變數（slack variables）、替代損失函式（surrogate loss function）、

支援向量迴歸（SVR）

支援向量機的優劣總結

支援向量機模型的好處很多，這裡不做贅述，下面列出些在使用支援向量機方法時，需要注意的問題：

SVM涉及到求解二次規劃，在大規模資料的訓練時會產生很大的開銷，為此常會引入一些高效演算法來應對，如採用SOM（sequential minimal optimization）來加速二次優化問題求解；

課後練習

6.1 公式推導

這裡寫圖片描述

6.2 不同核函式對應的支援向量差別分析

這裡寫圖片描述

6.3 SVM與BP網路、C4.5決策樹等的對比實驗

這裡寫圖片描述

6.4 線性核SVM與LDA的關聯

這裡寫圖片描述

考慮到線性核SVM的輸入空間與特徵空間相同，那麼取等的條件是：

這裡寫圖片描述

這說明兩者生成的超平面相同，此時等效。

6.5 高斯核SVM與RBF網路的關聯

這裡寫圖片描述

兩種方法均採用徑向基函式（RBF）如下：

SVM的超平面表示為：

這裡寫圖片描述

RBF網路表示為：

這裡寫圖片描述

SVM的分類器表示為：

這裡寫圖片描述

RBF網路分類器表示為：

這裡寫圖片描述

對於兩個分類器，SVM的表示式多出了偏置項，同時其係數項 ω 只與支援向量有關；RBF網路的係數項 ω 與由輸入樣本訓練得到，但是對於非支援向量對應的樣本，其 ω數值相對非常小。

6.6 SVM對噪聲的敏感分析

這裡寫圖片描述

SVM的決策邊界（超平面）是由支援向量所確定的，即是利用相對較少的資料特徵來學得整個資料的特性。由於支援向量相對較少，其上的噪聲會對超平面的確定產生相對較大的影響。

6.7 KKT條件推導

這裡寫圖片描述

參考書中附錄公式B.3，KKT條件即拉格朗日函式在對引數進行偏導取0計算後，為求得最優解，乘子和約束必須滿足其中之一為0的條件。

要獲取式（6.52）的完整KKT條件，只需將式（6.47~6.50）代入該式即可。

6.8 SVR實驗

這裡寫圖片描述

基於python-sklearn工具包，線上性核和高斯核下的SVR擬合如下圖示：

這裡寫圖片描述

可以看出，由於資料自變數與因變數間關係隨機性較強，採用SVR擬合效果不佳，（高斯核SVR的支援向量少一些）；

6.9 核對率迴歸模型設計

這裡寫圖片描述

關於核對率迴歸（KLR），可參考書p132中關於 log 損失函式下SVM與LR的比較，也可參考臺大林軒田-機器學習技法中關於KLR的slide。

簡要說明如下：
這裡寫圖片描述

6.10 SVM改進設計

這裡寫圖片描述

支援向量的規模與SVM計算速度息息相關，在不影響模型效能的情況下減少支援向量數目，能有效提高SVM效率。為此，一些稀鬆演算法如 1-norm SVM, Lp-SVM, 自適應Lp-SVM 被提出，給出兩篇參考文獻如下：

周志華《機器學習》課後習題解答系列（七）：Ch6

本章概要本章講述支援向量機（Support Vector Machine，SVM），相關內容包括：支援向量分類器（SVM classifier）支援向量（support vector）、間隔（margin）、最大間隔（maximum

周志華《機器學習》課後習題解答系列（三）：Ch2

本章概要本章講述了模型評估與選擇（model evaluation and selection）的相關知識： 2.1 經驗誤差與過擬合（empirical error & overfitting）精度accuracy、訓練誤差（經驗誤差）

周志華《機器學習》課後習題解答系列（一）：目錄

對機器學習一直很感興趣，也曾閱讀過李航老師的《統計學習導論》和Springer的《統計學習導論-基於R應用》等相關書籍，但總感覺自己缺乏深入的理解和系統的實踐。最近從實驗室角落覓得南京大學周志華老師《機器學習》一書，隨意翻看之間便被本書內容文筆深深吸引，如獲至寶

周志華《機器學習》課後習題解答系列（六）：Ch5.8

SOM神經網路實驗注：本題程式分別基於Python和Matlab實現（這裡檢視完整程式碼和資料集）。 1 基礎概述 1.1 SOM網路概念 SOM(Self-Organizing Map，自組織對映)網路是一種無監督的競爭型神經

周志華《機器學習》課後習題解答系列（六）：Ch5.10

卷積神經網路實驗 - 手寫字元識別注：本題程實現基於python-theano（這裡檢視完整程式碼和資料集）。 1. 基礎知識回顧 1.1. 核心思想卷積神經網路（Convolutional Neural Network, C

周志華《機器學習》課後習題解答系列（六）：Ch5.5

這裡的程式設計基於Python-PyBrain。Pybrain是一個以神經網路為核心的機器學習包，相關內容可參考神經網路基礎 - PyBrain機器學習包的使用 5.5 BP演算法實現實驗過程：基於PyBrain分別實現標準

周志華《機器學習》課後習題解答系列（六）：Ch5.7

5.7. RBF神經網路實驗注：本題程式基於Python實現（這裡檢視完整程式碼和資料集）。 1. RBF網路基礎 RBF網路採用RBF（Radial Basis Function函式）作為隱層神經元啟用函式，是一種區域性逼近神經

周志華《機器學習》課後習題解答系列（五）：Ch4

本章概要本章講述決策樹（decision tree），相關內容包括：決策樹生成（construction）子決策（sub-decision）、遞迴生成演算法（basic algorithm）、最優劃分屬性、純度（purity）、

周志華《機器學習》課後習題解答系列（四）：Ch3.3

思路概要程式設計實現對率迴歸： * 採用sklearn邏輯斯蒂迴歸庫函式實現，通過檢視混淆矩陣，繪製決策區域來檢視模型分類效果； * 自己程式設計實現，從極大化似然函數出發，採用梯度下降法得到最優引數，然後嘗試了隨機梯度下降法來優化過程。

周志華機器學習總結

Lecture3 線性模型基本形式一般向量形式: 優點: 線性迴歸廣義線性模型對數機率迴歸由對數機率函式確定 $\boldsymbol{\omega}$ 和 $b$

周志華機器學習筆記

第1章 1.4歸納偏好學習演算法自身的歸納偏好與問題是否相配，往往會起到決定作用。對於上面這句話：你的輸入資料被怎麼處理，最終得到什麼結果，我認為偏好指的就是這個處理的過程。線性非線性？那些feature忽略掉？怎麼利用這些資料？更具體一些，你用網路處理，還是傳統方法，資料的分佈和你

周志華機器學習效能度量

2.5 效能度量效能度量（performance measure）是衡量模型泛化能力的評價標準，在對比不同模型的能力時，使用不同的效能度量往往會導致不同的評判結果。本節除2.5.1外，其它主要介紹分類模型的效能度量。 2.5.1 最常見的效能度量在迴歸任務中，即預測連續值的問題，最常

周志華機器學習

盜用weka 緒論 1.2基本術語學習任務大致分為兩類：監督學習：分類、迴歸無監督學習：聚類泛化：訓練得到的模型適用於新樣本的能力機器學習領域最重要的國際學術會議是國際機器學習會議 (ICML)、國

周志華機器學習筆記

http://blog.sina.cn/dpool/blog/s/blog_cfa68e330102ycy9.html?md=gd https://www.cnblogs.com/shiwanghualuo/p/7192678.html 首先的階段由卷積層和池化層組成，卷積的節點組織在特徵對映塊

[機器學習]ID3決策樹詳細計算流程周志華機器學習筆記原創Excel手算方法

1.用到的主要三條熵公式： 1.1 資訊熵詳情見夏農資訊理論概率越平衡事件所含有的資訊量越大 1.2 條件熵代表某一屬性下不同分類的資訊熵之和 1.3 資訊增益等於資訊熵減去條件熵，從數值上，越大的資訊增益在資訊熵一定的情況下，代表條件熵越小，條件熵越

周志華-機器學習-筆記（五）- 強化學習

#### 任務與獎賞 #### 　　“強化學習”(reinforcement learning)可以講述為在任務過程中不斷摸索，然後總結出較好的完成任務策略。　　強化學習任務通常用馬爾可夫決策過程(Markov Decision Process，簡稱M

周志華機器學習筆記（一）

新人一枚，既是機器學習的初學者，也是首次發部落格。謹以此記錄我的學習體會，做一些總結。望與大家共同學習、共同進步。文中若有內容錯誤或有措詞不嚴謹之處，望大家不吝指出。謝謝！機器學習中的基本概念基本術語根據上圖我們可以用一個三維空間來了解以

周志華機器學習讀後總結第10、11章

降維與度量學習什麼是降維學習降維是一種分類演算法，它是一種解決維數災難的重要途徑。例如二維資料經過投影變為一維資料從而更好的表徵資料的特徵，然後再進行識別；這就利用了降維的方法。 K鄰近學習 k近鄰學習是一種監督學習演算法，它給定測試樣本，基於某種距離度量找出與訓練集

周志華機器學習讀後總結第三章

線性模型基本形式線性模型試圖學得一個通過屬性的線性組合來進行預測的函式，即f(x)=w1x1+w2x2+…+wdxd+b,w和b學得之後，模型就得以確定，而w直觀表達了各屬性在預測中的重要性。線性迴歸線性迴歸試圖學得一個線性模型以儘可能準確的預測實值輸出標記。線性迴歸

周志華機器學習讀後總結第12、13章

計算學習理論什麼是計算學習理論計算學習理論是關於機器學習的理論基礎，其目的是分析學習任務的困難本質，為學習演算法提供理論保證，並根據分析結果指導演算法設計。泛化誤差和經驗誤差是計算學習理論的兩個重要概念，現實中我們常用經驗誤差作為泛化誤差的近擬。 PAC學習 PAC學

周志華《機器學習》課後習題解答系列（七）：Ch6

本章概要

支援向量機的優劣總結

課後練習

6.1 公式推導

6.2 不同核函式對應的支援向量差別分析

6.3 SVM與BP網路、C4.5決策樹等的對比實驗

6.4 線性核SVM與LDA的關聯

6.5 高斯核SVM與RBF網路的關聯

6.6 SVM對噪聲的敏感分析

6.7 KKT條件推導

6.8 SVR實驗

6.9 核對率迴歸模型設計

6.10 SVM改進設計

相關推薦