SVM支援向量機（吳恩達課程筆記）

阿新 • • 發佈：2019-02-15

支援向量機（support vector machine） 大概是機器學習中最熱門的演算法之一，但同時也是最難懂的演算法之一。最近看了吳恩達的課程，雖講的比較淺顯，但對於初學者來說不失為一個入門的好路徑。

1. Optimization objective 目標函式

先來回顧一下邏輯迴歸，這是其計算分類概率的函式:
在這裡插入圖片描述

這是邏輯迴歸的cost function:
在這裡插入圖片描述

分y=1和y=2兩種情況來表示z和cost function之間的關係（黑色的細線）：
在這裡插入圖片描述

在這裡插入圖片描述

如果將上圖中邏輯迴歸的代價函式替換為藍色的線，就得到了SVM。

這是邏輯迴歸的目標函式：
在這裡插入圖片描述

這是SVM的目標函式：
在這裡插入圖片描述

可以看到SVM中沒有1/m，並且把λ替換為了C，這裡C=1/λ

。

2. Large margin 大間隔

從SVM的代價函式可以看出，當y=1時，我們希望z>=1，而不僅僅是大於0；同樣的，當y=0，我們希望z<=-1，而不僅僅小於0：
在這裡插入圖片描述

當C非常大的時候，我們可以將SVM代價函式改寫為帶約束的極值問題：
在這裡插入圖片描述

對於一個線性可分的問題，比較大的C會得到一個大間隔的decision bundary(黃色的那條決策邊界):
在這裡插入圖片描述

當存在一個離群的異常點時，較大的C不能容忍分類錯誤的情況，所以會產生黃色的決策邊界。當C不那麼大時，就可以得到更加合理的藍色分界線：
在這裡插入圖片描述

回顧一下向量內積的定義，v 和u的內積等於v 在u上的投影長度p乘以||u||
在這裡插入圖片描述

依據上述定義，將SVM的優化函式改寫為如下形式。要最小化的目標函式是||θ||，P⁽ⁱ⁾

為x⁽ⁱ⁾在θ上的投影。
在這裡插入圖片描述

我們希望p⁽ⁱ⁾*||θ||儘可能大，又希望||θ||儘可能小，所以就需要p⁽ⁱ⁾儘可能大。那麼什麼樣的決策邊界會得到較大的p(i)呢？

如果決策邊界是下圖綠色的那條線(margin比較小)，θ就是與它垂直的那條線。這個時候投影p⁽ⁱ⁾比較小。
在這裡插入圖片描述

如果決策邊界是下圖豎直的那條綠線(margin比較大)，這時θ就是水平的線。此時的投影p⁽ⁱ⁾比較大，滿足我們的之前的要求。
在這裡插入圖片描述

3. Kernals 核函式

核函式可以看做特徵工程的一部分。對於一些線性不可分的樣本，通過核函式將它們的特徵對映到更高/複雜的維度，從而實現在高維新特徵下線性可分的目的。比如下圖的多項式核函式：
在這裡插入圖片描述

最常用的kernel是高斯核函式。首先選幾個landmarks，然後計算樣本點離這些landmarks的距離（相似性）作為新特徵：
在這裡插入圖片描述

由下圖的公式可以看出，當x與landmark很近，高斯相似度接近於1；當x於landmark很遠，高斯相似度接近於0：
在這裡插入圖片描述

SVM中關於引數C和高斯核的引數σ^2的偏差方差分析：
在這裡插入圖片描述

SVM的應用建議，關於kernel和引數的選擇：
在這裡插入圖片描述

邏輯迴歸 VS SVM
在這裡插入圖片描述

SVM支援向量機（吳恩達課程筆記）

支援向量機（support vector machine）大概是機器學習中最熱門的演算法之一，但同時也是最難懂的演算法之一。最近看了吳恩達的課程，雖講的比較淺顯，但對於初學者來說不失為一個入門的好路徑。 1. Optimization objective 目標

機器學習總結（三）：SVM支援向量機（面試必考）

基本思想：試圖尋找一個超平面來對樣本分割，把樣本中的正例和反例用超平面分開，並儘可能的使正例和反例之間的間隔最大。演算法推導過程：（1）代價函式：假設正類樣本y =wTx+ b>=+1,負

機器學習吳恩達課程筆記（自用，持續更新）

機器學習吳恩達簡介本筆記為自用筆記，因此只記錄了自己覺得重要的部分，所以不建議想要系統學習的人閱讀此筆記。緒論監督學習我們給演算法一個數據集，其中包含了正確的答案，目的為給出更多的正確答案 “迴歸問題”：regression “分類問題”：cla

（吳恩達機器學習）單變數線性迴歸

單變數線性迴歸：所謂單變數線性迴歸其實就是一元線性函式方程---Y=AX+B h為假設函式，x為自變數（輸入的資料），y為因變數（輸出的結果）。 &n

（吳恩達機器學習）Logistic 迴歸

邏輯迴歸提出的原因：對於分類問題，為什麼不能用我們之前學習的線性迴歸演算法來解決呢？有以下兩點： 1：不能很好地說明實際情況的真正意義 2：函式值可能大於1或者小於0（對於二類分類0,1）假設函式：為了使函式值在0~1之間，假設函式h(x)從h(

吳恩達機器學習作業Python實現(六)：SVM支援向量機

1 Support Vector Machines 1.1 Example Dataset 1 %matplotlib inline import numpy as np import pandas as pd import matplotlib.pyplot

4.支援向量機（SVM）演算法(下）

1.SVM演算法的特點 1.1 訓練好的模型的演算法複雜度是由支援向量的個數決定的，而不是由資料的維度決定的。所有SVM不太容易產生overfitting 1.2 SVM訓練出來的模型完全依賴於支援向量（Support Vectors），即使訓練集裡面所有非支援向量的點都

3.支援向量機（SVM）演算法(上）

SVM 1.基本概念支援向量機（Support Vector Machine, SVM）的基本模型是在特徵空間上找到最佳的分離超平面使得訓練集上正負樣本間隔最大。SVM是用來解決二分類問題的有監督學習演算法，在引入了核方法之後SVM也可以用來解決非線性問題。一般SVM有下面三

1. 支援向量機（SVM）原理

1. 前言在我沒有學習接觸機器學習之前，我就已經聽說了SVM這個機器學習的方法。SVM自它誕生以來就以優秀的分類效能牢牢佔據了霸主地位。 2. SVM原理支援向量機（Support Vector Machine, SVM）的基本模型是在特徵空間上找到最佳的分離超平面使得訓練集上正負樣本間隔最大。SV

3. 支援向量機（SVM）核函式

1. 前言之前介紹了SVM的原理和SVM的軟間隔，它們已經可以很好的解決有異常點的線性迴歸問題，但是如果本身是非線性的問題，目前來看SVM還是無法很好的解決的。所以本文介紹SVM的核函式技術，能夠順利的解決非線性的問題。 2. 多項式迴歸在線性迴歸一節中我們有介紹線性迴歸解決非線性的一個方法就是多項

邏輯迴歸（LR）和支援向量機（SVM）的區別和聯絡

1. 前言在機器學習的分類問題領域中，有兩個平分秋色的演算法，就是邏輯迴歸和支援向量機，這兩個演算法個有千秋，在不同的問題中有不同的表現效果，下面我們就對它們的區別和聯絡做一個簡單的總結。 2. LR和SVM的聯絡都是監督的分類演算法。都是線性分類方法 (不考慮核函式時）。都是判別

支援向量機（SVM）實現MNIST手寫體數字識別

一、SVM演算法簡述支援向量機即Support Vector Machine，簡稱SVM。一聽這個名字，就有眩暈的感覺。支援(Support)、向量(Vector)、機器(Machine)，這三個毫無關聯的詞，硬生生地湊在了一起。從修辭的角度，這個合成詞最終落腳到”Machine”上，還以

第七章支援向量機（SVM）

1.1 支援向量機 1.1.1 定義支援向量機(support vector machine)是一種二分類模型，它的基本模型是定義在特徵空間上的間隔最大的線性分類器間隔最大使它有別於感知機。支援向量機的學習策略是間隔最大化，支援向量機的學習演算法是求解凸二次規劃的最優化演算法。

機器學習（十一） SVM-支援向量機

春夜喜雨好雨知時節，當春乃發生。隨風潛入夜，潤物細無聲。野徑雲俱黑，江船火獨明。曉看紅溼處，花重錦官城。前言週末很多城市下開了雨，下雨中也不乏忙忙碌碌的人們，有的天不亮已經忙碌匆

支援向量機（SVM） | 文末有福利，絕不是標題黨

1、什麼是SVM 支援向量機（SVM）是一個有監督的機器學習演算法，它可用於分類和迴歸分析，最主要是用在分類問題中。在這個演算法中，根據特徵值，構建一個n維空間（其中n即使特徵數量）把每個資料點投影到此空間內。 2、資料如何分類通過查詢一個超平面，把資料區分成兩類。換句話說，演算法

SVM支援向量機系列理論（九）核嶺迴歸

1. 嶺迴歸問題嶺迴歸就是使用了L2正則化的線性迴歸模型。當碰到資料有多重共線性時（自變良量存在高相關性），我們就會用到嶺迴歸。嶺迴歸模型的優化策略為： minw 1N∑i(yi−w⋅zi)2+λNwTw&nbs

SVM支援向量機系列理論（七）線性支援向量機與L2正則化 Platt模型

7.1 軟間隔SVM等價於最小化L2正則的合頁損失上一篇說到， ξi ξ i \xi_i 表示偏離邊界的度量，若樣本點

SVM支援向量機系列理論（四）軟間隔支援向量機

4.1 軟間隔SVM的經典問題 4.2 軟間隔SVM的對偶問題 4.2.1 軟間隔SVM的對偶問題學習演算法 4.3 軟間

SVM支援向量機系列理論（六） SVM過擬合的原因和SVM模型選擇

6.1 SVM 過擬合的原因實際我們應用的SVM模型都是核函式+軟間隔的支援向量機，那麼，有以下原因導致SVM過擬合：選擇的核函式過於powerful，比如多項式核中的Q設定的次數過高要求的間隔過大，即在軟間隔支援向量機中C的引數過大時，表示比較重視間隔，堅持要資

SVM支援向量機系列理論（五）SVM中幾種核函式的對比

核函式可以代表輸入特徵之間特殊的相似性。 5.1 線性核形式： K(x,x′)=xTx′ K ( x ,

SVM支援向量機（吳恩達課程筆記）

1. Optimization objective 目標函式

2. Large margin 大間隔

3. Kernals 核函式

相關推薦