機器學習筆記（參考吳恩達機器學習視訊筆記）11_支援向量機

阿新 • • 發佈：2018-11-12

11 支援向量機

11.1 支援向量機的優化目標

從邏輯迴歸開始展示我們如何一點一點修改來得到本質上的支援向量機。

如圖，一個y=1的樣本，希望趨近於1，意味著當趨近於1時，應當遠大於0。一個y=0的樣本，希望趨近於0，意味著當趨近於0時，應當遠小於0。

表示一個訓練樣本所對應的表示式。

y=1時，（1-y）為0，此時得到，在這個前提下命名一個新的代價函式，記為，它與曲線非常相似，先是一條斜線，當z大於1後變為一條直線。

y=0時，（1-y）為1，此時得到，在這個前提下命名一個新的代價函式，記為，它與曲線非常相似，先是一條直線，當z大於-1後變為一條斜線。

邏輯迴歸的優化目標表示為：

由上述定義可知，將替換為，即；將替換為，即；按照支援向量機的慣例，書寫會稍微有些不同，代價函式的引數表示也會稍微有些不同。首先，去除，會得出同樣的最優值。接著，針對，上式可以簡化表示為：。可以使用一個不同的引數替換這裡使用的來權衡這A、B兩項。替換後的簡化表示為：。在邏輯迴歸中，如果給定的是一個非常大的值，意味著給予 B 更大的權重。而這裡，就對應於將C設定為非常小的值。將C考慮成，會得出同樣的最優值。

綜上所述，支援向量機的優化目標表示為：

11.2 最小化問題的轉變

如果C非常大，則最小化代價函式的時候，我們將會很希望找到一個使第一項為 0 的最優解。一個訓練樣本，標籤為y=1，要使第一項為0，則

；類似地，y=0，要使第一項為0，則

。在y = 1和y= 0兩種情況下都使得代價函式中左邊的這一項儘量為零的引數。如果我們找到了這樣的引數，則我們的最小化問題便轉變成：

如果引數C設定的非常大，支援向量機的決策邊界如線a所示。如果引數C設定的不是太大，支援向量機的決策邊界如線b所示。當C不是非常非常大的時候，它可以忽略掉一些異常點的影響，得到更好的決策界。回顧，因此：

1）C較大時，相當於較小，可能會導致過擬合，高方差。

2）C較小時，相當於較大，可能會導致低擬合，高偏差。

11.3 核函式

使用高階數的多項式模型來解決上圖中無法用直線進行分隔的分類問題，模型可能為：

的形式。

用一系列的新的特徵來替換模型中的每一項。例如令：，可以利用核函式來計算出新的特徵f。

給定訓練例項x,利用x的各個特徵與預先選定的地標（landmarks）的近似程度來選取新的特徵。

例如：

就是核函式，具體而言，這裡是一個高斯核函式(Gaussian Kernel)。如果一個訓練例項x與地標L之間的距離近似於0，則新特徵近似於=1,如果訓練例項x與地標L之間的距離較遠，則近似於=0。

圖中水平面的座標為而垂直座標軸代表。可以看出，只有當與重合時才具有最大值。隨著的改變，f值改變的速率受到的控制。

圖中紅色的封閉曲線所表示的範圍，便是依據一個單一的訓練例項和選取的地標所得出的判定邊界，在預測時，採用的特徵不是訓練例項本身的特徵，而是通過核函式計算出的新特徵。

地標的選擇：通常是根據訓練集的數量選擇地標的數量，即如果訓練集中有m個例項，則選取m個地標。並且令：。使新特徵是建立在原有特徵與訓練集中所有其他特徵之間距離的基礎之上的。即：

支援向量機的兩個引數C和的影響：

1）C較大時，相當於較小，可能會導致過擬合，高方差；

2）C較小時，相當於較大，可能會導致低擬合，高偏差；

3）較大時，可能會導致低方差，高偏差；

4）較小時，可能會導致低偏差，高方差；

機器學習筆記（參考吳恩達機器學習視訊筆記）16_決策樹

16 決策樹決策樹是一種監督學習演算法，以樹狀圖為基礎，其輸出結果為一系列簡單實用的規則。它就是一系列的if-then語句，既可以用於分類問題，也可以用於迴歸問題。構建決策樹之通常包括三個步驟： 1）特徵選擇 &n

機器學習筆記（參考吳恩達機器學習視訊筆記）15_推薦系統

15 推薦系統一個電影提供商，有5部電影和4個使用者。要求使用者為電影打分：前三部為愛情片，後兩部為動作片。Alice、Bob更傾向於愛情片，Carol、Dave更傾向於動作片。沒有一個使用者給所有的電影打過分。希望構建一個演算法來預測他們每個人可能會給他們每個人可能會給他們沒

機器學習筆記（參考吳恩達機器學習視訊筆記）14_異常檢測

14 異常檢測異常檢測（Anomaly detection）是機器學習演算法的一個常見應用。這種演算法的一個有趣之處在於：它雖然主要用於非監督學習問題，但從某些角度看，它又類似於一些監督學習問題。異常檢測主要用來識別欺騙。例如線上採集而來的有關使用者的資料，一個特徵向量中可能會包含如

機器學習筆記（參考吳恩達機器學習視訊筆記）13_降維

13 降維 13.1 動機一：資料壓縮假設兩個未知的特徵：是用釐米表示長度；是用英寸表示同一物體的長度。這是一種高度冗餘的表示。希望將這個二維的資料降至一維，即資料壓縮。 13.2 動機二：資料視覺化化降維可以使資料視覺化。關於許多不同國家的資料，每一個特徵向量都有50

機器學習筆記（參考吳恩達機器學習視訊筆記）12_聚類

12 聚類監督學習中，訓練集帶有標籤，目標是找到能夠區分正負樣本的決策邊界，需要根據標籤擬合一個假設函式。非監督學習中，需要將無標籤的訓練資料輸入到一個演算法，此演算法可以找到這些資料的內在結構。一個能夠根據資料的內在結構，將它們分成幾個不同的點集（或簇）的演算法，就被稱為聚類演算法。聚類

機器學習筆記（參考吳恩達機器學習視訊筆記）11_支援向量機

11 支援向量機 11.1 支援向量機的優化目標從邏輯迴歸開始展示我們如何一點一點修改來得到本質上的支援向量機。如圖，一個y=1的樣本，希望趨近於1，意味著當趨近於1時，應當遠大於0。一個y=0的樣本，希望趨近於0，意味著當趨近於0時，應當遠小於0。

機器學習筆記（參考吳恩達機器學習視訊筆記）10_機器學習系統的設計

10 機器學習系統的設計 10.1 構建學習演算法的方法以一個垃圾郵件分類器演算法為例。先要做的決定是如何選擇並表達特徵向量x, 可以選擇一個由 100 個最常出現在垃圾郵件中的詞所構成的列表，根據這些詞是否有在郵件中出現，來獲得我們的特徵向量（出現為 1，不出現為 0），尺寸為 10

機器學習筆記（參考吳恩達機器學習視訊筆記）09_應用機器學習的建議

9 應用機器學習的建議機器學習診斷法：是一種測試方法，通過執行這種測試，可以深入瞭解某種演算法到底是否有用。 9.1 評估假設函式通過評估假設函式來，來避免過擬合和欠擬合問題。模型通過訓練集得出引數後，對測試集運用該模型，有兩種方式計算誤差：對於線性迴歸模型，利用測

機器學習筆記（參考吳恩達機器學習視訊筆記）08_神經網路的學習

8 神經網路的學習 8.1 神經網路的代價函式神經網路的訓練樣本有m個，每個包含一組輸入x和一組輸出訊號y，L表示神經網路層數，表示每層的neuron個數（表示輸出層神經元個數），代表最後一層中處理單元的個數。將神經網路的分類定義為兩種情況：二類分類和多類分類。二類分類：=

機器學習筆記（參考吳恩達機器學習視訊筆記）07_神經網路介紹

7 神經網路介紹當特徵太多時，無論是線性迴歸還是邏輯迴歸模型計算的負荷會非常大。這時需要神經網路。神經網路是一種很古老的演算法，它最初產生的目的是製造能模擬大腦的機器。神經網路是計算量有些偏大的演算法。然而大概由於近些年計算機的執行速度變快，才足以真正執行起大規模的神經網路。類似於神

機器學習筆記（參考吳恩達機器學習視訊筆記）06_正則化

6 正則化 6.1 過擬合問題通過學習得到的假設可能能夠非常好地適應訓練集（代價函式可能幾乎為 0），但是可能會不能推廣到新的資料。如何處理過擬合問題： 1）丟棄一些不能幫助我們正確預測的特徵。可以是手工選擇保留哪些特徵，或者使用一些模型選擇的演算法來幫忙（例如 PCA）。 2

機器學習筆記（參考吳恩達機器學習視訊筆記）04_多變數線性迴歸

4 多變數線性迴歸 4.1 多維特徵代表特徵矩陣中第i行的第j個特徵，也就是第i個訓練例項的第j個特徵。支援多變數的假設函式h表示為：，其中，引入。此時模型中的引數是一個n+1維的向量，特徵矩陣X的維度是m*(n+1)。因此公式可以簡化為：。 4.2 多變數梯度下降在多

機器學習筆記（參考吳恩達機器學習視訊筆記）17_貝葉斯分類器

17 貝葉斯分類器貝葉斯分類是一種分類演算法的總稱，這種演算法均以貝葉斯定理為基礎，故統稱為貝葉斯分類。貝葉斯分類器的分類原理是通過某物件的先驗概率，利用貝葉斯公式計算出其後驗概率，即該物件屬於某一類的概率，選擇具有最大後驗概率的類作為該物件所屬的類。 17.1 貝葉斯

吳恩達機器學習 - 無監督學習——K-means演算法吳恩達機器學習 - 無監督學習——K-means演算法

原吳恩達機器學習 - 無監督學習——K-means演算法 2018年06月25日 12:02:37 離殤灬孤狼閱讀數：181

Coursera 深度學習吳恩達 deep learning.ai 筆記整理（3-2）——機器學習策略

新的 bsp 誤差 spa 歸納空間 font 處理整理一、誤差分析定義：有時我們希望算法能夠勝任人類能做的任務，但是當算法還沒達到人類所預期的性能時，人工檢查算法錯誤會讓你知道接下來做什麽，這也就是誤差分析檢查，發現會把夠狗當恒，是否需要做一個項目專門處理狗

吳恩達機器學習筆記（六） —— 支持向量機SVM

次數括號圖片最小我們支持向量機svm UNC 意思 strong 主要內容：一.損失函數二.決策邊界三.Kernel 四.使用SVM 一.損失函數二.決策邊界對於：當C非常大時，括號括起來的部分就接近於0，所以就變成了：

吳恩達機器學習筆記 —— 19 應用舉例：照片OCR（光學字符識別）

參考 https ocr 噪聲也說字符 www. 定位 cnblogs http://www.cnblogs.com/xing901022/p/9374258.html 本章講述的是一個復雜的機器學習系統，通過它可以看到機器學習的系統是如何組裝起來的；另外也說明了一

吳恩達機器學習課程筆記02——處理房價預測問題（梯度下降演算法詳解）

建議記住的實用符號符號含義 m 樣本數目 x 輸入變數 y 輸出變數/目標變數

吳恩達機器學習筆記（一），含作業及附加題答案連結

吳恩達機器學習筆記（一）標籤（空格分隔）：機器學習吳恩達機器學習筆記一一機器學習簡介機器學習的定義監督學習非監督學習

吳恩達機器學習學習筆記（四）（附作業程式碼註釋）

吳恩達機器學習學習筆記（四）標籤：機器學習吳恩達機器學習學習筆記四代價函式與反向傳播Costfunction and Backpropagation 一代價函式 1邏輯分類的評價函式