演算法工程師修仙之路：吳恩達機器學習（十四）

阿新 • • 發佈：2018-12-31

吳恩達機器學習筆記及作業程式碼實現中文版

第十章支援向量機

直觀上對大間隔的理解

人們有時將支援向量機看作是大間距分類器。
支援向量機模型的代價函式，在左邊這裡我畫出了關於 z 的代價函式 $c o s t$

1 ( z ) cost_1(z) $c o s t_{1} (z)$ ，此函式用於正樣本，而在右邊這裡我畫出了關於 z 的代價函式 $cost_0(z)$ ，橫軸表示 z。
最小化代價函式的必要條件
- 如果你有一個正樣本， $y=1$ ，則只有在z >= 1時，代價函式 $cost_1(z)$ 才等於0。換句話說，如果你有一個正樣本，我們會希望 $\theta^Tx>=1$ ，反之，如果 $y=0$ ，函式 $cost_0(z)$ ，它只有在z <= -1的區間裡函式值為 0。
- 事實上，如果你有一個正樣本 $y=1$ ，則其實我們僅僅要求 $\theta^Tx$ 大於等於 0，就能將該樣本恰當分出，這是因為如果 $\theta^Tx>0$ 的話，我們的模型代價函式值為0，類似地，如果你有一個負樣本，則僅需要 $\theta^Tx<=0$ 就會將負例正確分離。
- 但是，支援向量機的要求更高，不僅僅要能正確分開輸入的樣本，即不僅僅要求 $\theta^Tx>0$ ，我們需要的是比0值大很多，比如大於等於1，或者比0小很多，比如我希望它小於等於-1，這就相當於在支援向量機中嵌入了一個額外的安全因子，或者說安全的間距因子。
如果 $C$ 非常大，則最小化代價函式的時候，我們將會很希望找到一個使第一項為 0 的最優解。因此，讓我們嘗試在代價項的第一項為 0 的情形下理解該優化問題。
- 首先支援向量機的代價函式表示如下： $min_\theta C\sum_{i=1}^{m}[y^{(i)}cost_1(\theta^Tx^{(i)})+(1-y^{(i)})cost_0(\theta^Tx^{(i)})]+\frac{1}{2}\sum_{i=1}^{n}\theta_j^2$ 。
- 我們已經看到輸入一個訓練樣本標籤為 $y=1$ ，你想令第一項為 0，你需要做的是找到一個 $\theta$ ，使得 $\theta^Tx>=1$ ，類似地，對於一個訓練樣本，標籤為 $y=0$ ，為了使 $cost_0(z)$ 函式的值為0，我們需要 $\theta^Tx<=-1$ 。
- 因為我們將選擇引數使第一項為0，因此這個函式的第一項為0，因此是 $C$ 乘以 0 加上二分之一乘以第二項。這將遵從以下的約束： $\theta^Tx>=1$ ，如果 $y^{(i)}$ 是等於 1 的， $\theta^Tx<=-1$ ，如果樣本 $y^{(i)}$ 是一個負樣本。
具體而言，如果你考察下面這樣一個數據集，其中有正樣本，也有負樣本，可以看到這個資料集是線性可分的。
支援向量機將會選擇這個黑色的決策邊界，黑線看起來是更穩健的決策界。在分離正樣本和負樣本上它顯得的更好。數學上來講，這條黑線有更大的距離，這個距離叫做間距(margin)。
當畫出兩條額外的藍線，我們看到黑色的決策界和訓練樣本之間有更大的最短距離。然而粉線和藍線離訓練樣本就非常近，在分離樣本的時候就會比黑線表現差。因此，這個距離叫做支援向量機的間距，而這是支援向量機具有魯棒性的原因，因為它努力用一個最大間距來分離樣本，因此支援向量機有時被稱為大間距分類器。
我們將這個大間距分類器中的正則化因子常數 $C$ 設定的非常大，因此對這樣的一個數據集，也許我們將選擇黑線這樣的決策界，從而最大間距地分離開正樣本和負樣本。
在讓代價函式最小化的過程中，我們希望找出在 $y=1$ 和 $y=0$ 兩種情況下都使得代價函式中左邊的這一項儘量為零的引數。如果我們找到了這樣的引數，則我們的最小化問題便轉變成：
事實上，支援向量機現在要比這個大間距分類器所體現得更成熟，尤其是當你使用大間距分類器的時候，你的學習演算法會受異常點(outlier)的影響。
- 比如我們加入一個額外的正樣本：
- 在這裡，如果你加了這個樣本，為了將樣本用最大間距分開，也許我最終會得到一條類似這樣粉色的線的決策界，僅僅基於一個異常值，僅僅基於一個樣本，就將我的決策界從這條黑線變到這條粉線，這實在是不明智的。
- 而如果正則化引數 $C$ 設定的非常大，這事實上正是支援向量機將會做的。它將決策界，從黑線變到了粉線，但是如果 $C$ 設定的小一點，如果你將 $C$ 設定的不要太大，則你最終會得到這條黑線。
- 當然資料如果不是線性可分的，如果你在這裡有一些正樣本或者你在這裡有一些負樣本，則支援向量機也會將它們恰當分開。因此，大間距分類器的描述，僅僅是從直觀上給出了正則化引數 $C$ 非常大的情形。
- $C$ 的作用類似於 $1/\lambda$ ， $\lambda$ 是我們之前使用過的正則化引數。這只是 $C$ 非常大的情形，或者等價 $\lambda$ 非常小的情形。你最終會得到類似粉線這樣的決策界，但是實際上應用支援向量機的時候，當 $C$ 不是非常非常大的時候，它可以忽略掉一些異常點的影響，得到更好的決策界。甚至當你的資料不是線性可分的時候，支援向量機也可以給出好的結果。
$C$ 較大時，相當於 $\lambda$ 較小，可能會導致過擬合，高方差； $C$ 較小時，相當於 $\lambda$ 較大，可能會導致低擬合，高偏差。

演算法工程師修仙之路：吳恩達機器學習（十四）

吳恩達機器學習筆記及作業程式碼實現中文版第十章支援向量機直觀上對大間隔的理解人們有時將支援向量機看作是大間距分類器。支援向量機模型的代價函式，在左邊這裡我畫出了關於 z 的代價函式

演算法工程師修仙之路：吳恩達機器學習（十五）

吳恩達機器學習筆記及作業程式碼實現中文版第十章支援向量機大間隔分類器的數學原理假設我有兩個二維向量 u

演算法工程師修仙之路：吳恩達機器學習（十二）

吳恩達機器學習筆記及作業程式碼實現中文版第九章機器學習系統設計確定執行的優先順序以一個垃圾郵件分類器演算法為例進行討論。為了解決這樣一個問題，我們首先要做的決定是如何選擇並表達特徵向量

演算法工程師修仙之路：吳恩達機器學習（十一）

吳恩達機器學習筆記及作業程式碼實現中文版第八章應用機器學習的建議決定下一步做什麼獲得更多的訓練例項——通常是有效的，但代價較大，下面的方法也可能有效，可考慮先採用下面的幾種方法：嘗試減少特徵的數量；嘗試獲得更多的特徵

演算法工程師修仙之路：吳恩達機器學習（十）

吳恩達機器學習筆記及作業程式碼實現中文版第七章神經網路引數的反向傳播演算法理解反向傳播為了更好地理解反向傳播演算法，我們再來仔細研究一下前向傳播的原理：反向傳播演算法做的是：梯度檢測當我們對一個較為複雜

演算法工程師修仙之路：吳恩達機器學習（九）

吳恩達機器學習筆記及作業程式碼實現中文版神經網路引數的反向傳播演算法代價函式假設神經網路的訓練樣本有 m

演算法工程師修仙之路：吳恩達機器學習（八）

吳恩達機器學習筆記及作業程式碼實現中文版第六章神經網路學習特徵和直觀理解從本質上講，神經網路能夠通過學習得出其自身的一系列特徵。神經網路中，單層神經元（無中間層）的計算可用來表示邏輯運算，比如邏輯與(AND)、邏輯或(OR)。邏輯

演算法工程師修仙之路：吳恩達機器學習（七）

吳恩達機器學習筆記及作業程式碼實現中文版第六章神經網路學習非線性假設無論是線性迴歸還是邏輯迴歸都有這樣一個缺點：當特徵太多時，計算的負荷會非常大。使用非線性的多項式項，能夠幫助我們建立更好的分類模型。假設我們有非常多的特徵，例如大於 100 個

演算法工程師修仙之路：吳恩達機器學習（六）

吳恩達機器學習筆記及作業程式碼實現中文版第五章正則化過擬合問題線性迴歸和邏輯迴歸能夠有效地解決許多問題，但是當將它們應用到某些特定的機器學習應用時，會遇到過擬合(over-fitting)的問題，可能會導致它們效果很差。正則化(regulari

演算法工程師修仙之路：吳恩達機器學習（五）

吳恩達機器學習筆記及作業程式碼實現中文版第四章 Logistic迴歸簡化代價函式與梯度下降邏輯迴歸的代價函式： C

演算法工程師修仙之路：吳恩達機器學習（四）

吳恩達機器學習筆記及作業程式碼實現中文版第四章 Logistic迴歸分類在分類問題中，要預測的變數y是離散的值，邏輯迴歸 (Logistic Regression) 演算法是目前最流行使用最廣泛的一種學習演算法。在分類問題中，我們嘗試預測的是結果

演算法工程師修仙之路：吳恩達機器學習（三）

吳恩達機器學習筆記及作業程式碼實現中文版第三章多變數線性迴歸多維特徵現在我們對房價模型增加更多的特徵，例如房間數樓層等，構成一個含有多個變數的模型，模型中的特徵為

演算法工程師修仙之路：吳恩達機器學習（二）

吳恩達機器學習筆記及作業程式碼實現中文版第二章單變數線性迴歸模型描述我們使用一個監督學習演算法的例子：預測住房價格。我們要使用一個數據集，資料集包含俄勒岡州波特蘭市的住房價格。在這裡，我要根據不同房屋尺寸所售出的價格，畫出我的資

演算法工程師修仙之路：吳恩達機器學習（一）

吳恩達機器學習筆記及作業程式碼實現中文版第一章緒論：初識機器學習什麼是機器學習 Machine Learning(機器學習)是研究計算機怎樣模擬或實現人類的學習行為，以獲取新的知識或技能，重新組織已有的知識結構使之不斷改善自身的效能。機器學習被用

演算法工程師修仙之路：吳恩達機器學習（十三）

吳恩達機器學習筆記及作業程式碼實現中文版第十章支援向量機優化目標在監督學習中，許多學習演算法的效能都非常類似，因此，重要的不是你該選擇使用學習演算法 A 還是學習演算法 B，而更重要的是，所建立的大量資料在應用這些演算法時，表現情況通常依賴於你的水平。比如你

演算法工程師修仙之路：吳恩達機器學習作業（一）

吳恩達機器學習筆記及作業程式碼實現中文版第一個程式設計作業：單變數線性迴歸（python程式碼實現）一元線性迴歸問題描述在本練習的這一部分中，您將使用只有單變數的線性迴歸方法預測餐車的利潤。假設你是一家連鎖餐廳的執行長，正在

吳恩達機器學習（十四）推薦系統（基於梯度下降的協同過濾演算法）

目錄 0. 前言學習完吳恩達老師機器學習課程的推薦系統，簡單的做個筆記。文中部分描述屬於個人消化後的理解，僅供參考。如果這篇文章對你有一點小小的幫助，請給個關注喔~我會非常開心的~ 0. 前言在推薦系統中，主要有兩種方法，基於內容的推薦

演算法工程師修仙之路：python3官方文件筆記（三）

本筆記來自於python手冊的中文版 Python 簡介 Python 中的註釋以 # 字元起始，直至實際的行尾。註釋可以從行首開始，也可以在空白或程式碼之後，但是不出現在字串中。文字字串中的 # 字元僅僅表示 # 。程式碼中的註釋

演算法工程師修仙之路：python3官方文件筆記（二）

本筆記來自於python手冊的中文版使用 Python 直譯器呼叫 Python 直譯器通常你可以在主視窗輸入一個檔案結束符（Unix系統是Control-D，Windows系統是Control-Z）讓直譯器以 0 狀態碼退出。如果那沒有作用，你可以通過輸入

演算法工程師修仙之路：python3廖雪峰教程筆記（一）

此筆記摘錄於廖雪峰先生的教程，感謝廖先生的無私分享，特此致敬！ python簡介 Python是一種什麼語言？用任何程式語言來開發程式，都是為了讓計算機幹活，而計算機幹活的CPU只認識機器指令，所以，儘管不同的程式語言差異極大，最後都得“翻譯”成

演算法工程師修仙之路：吳恩達機器學習（十四）

吳恩達機器學習筆記及作業程式碼實現中文版

第十章 支援向量機

直觀上對大間隔的理解

相關推薦

第十章支援向量機