SVM支援向量機系列理論（七）線性支援向量機與L2正則化 Platt模型

7.1 軟間隔SVM等價於最小化L2正則的合頁損失

上一篇說到， $\xi_i$ 表示偏離邊界的度量，若樣本點 $(x_{i}, y_{i})$

x i , y i ) $(x_i,y_i)$ 滿足約束時，則

ξ_{i} = 0

$\xi_i =0$ ，當不滿足約束時，

ξ_{i} = 1 - y_{i} (w \cdot x_{i} + b)

$\xi_i =1 - y_i(w \cdot x_i + b)$ ,表示偏離margin的度量。

則把上面的合起來：

$\xi_i = max(0, 1 - y_i(w \cdot x_i + b))$
那麼優化目標函式可以寫為：

$min_{ \ w,b} \ \ \frac{1}{2}{||w||}^2 + C \sum_{i=1}^{N}max(0, 1 - y_i(w \cdot x_i + b)) \ \ \ \ \ \ \ \ (1)$

其中，我們把式子中的
$L_{hinge }= max( \ 1-z \ , \ 0)$ 稱為hinge合頁損失函式。

我們可以看到 L2 正則化的合頁損失函式可以等價於軟間隔SVM。
但是，軟間隔SVM的優勢在於：

是一個二次規劃問題（QP），可以利用核技巧
max（0，1-z）不是可微的，難以解決，無法用梯度下降。

7.2 軟間隔SVM與L2正則的0-1損失

軟間隔允許某些樣本不滿足約束
$\ \ \ y_i{(w \cdot x_i + b )}{} \geq {1};$ ，而且我們希望在最大化間隔時，不滿足約束的樣本儘可能少。

那麼優化目標函式可以寫為：

$min_{ \ w,b} \ \ \frac{1}{2}{||w||}^2 + C \sum_{i=1}^{N} L_{0/1}(y_i(w \cdot x_i+b)-1)\ \ \ \ \ \ \ \ (2)$

C 為無窮大時，迫使所有樣本滿足約束，C為有限值時，允許一些樣本不滿足約束。

其中， $L_{0/1}$ 是0-1損失函式，代表當不滿足約束時，記為 1. 但是，0-1損失函式是非凸非連續函式，數學性質不好，通常使用凸函式且是0-1損失函式的上界來代替損失函式：

hinge合頁損失函式：
$L_{hinge }= max( \ 1-z \ , \ 0)$
指數算損失:
$L_{exp}z = e^{ -z}$
對率損失： $L_{log}z = log_2(1+e^{ -z})$

7.3 軟間隔SVM和L2正則的損失函式的對應關係

使用

最大間隔對應L2正則化項
一個大的C對應一個小的 $\lambda$
軟間隔對應特殊的損失

那麼，軟間隔SVM可以視為一個加L2正則化的模型。

7.4 邏輯迴歸模型和線性支援向量機的關係

針對（2）,如果將0-1損失函式 $L_{0/1}$ 替換成對數損失函式 $L_{log}$ (也就是極大似然函式),那麼就幾乎得到了邏輯迴歸模型（周志華《機器學習》P57）。

實際上，支援向量機和邏輯迴歸的優化目標相近，效能也相當。

邏輯迴歸的優勢：

有自然的概率意義，在給出預測標記的同時給出概率。
能應用於多分類任務。

SVM的優勢：

支援向量機的解只依賴於支援向量，邏輯迴歸的解依賴於更多的訓練樣本，預測開銷比較大。

7.5 Platt模型：SVM的概率模型

run SVM on D .得到 $(b_{s v m}, w_{s v m})$

SVM支援向量機系列理論（七）線性支援向量機與L2正則化 Platt模型

7.1 軟間隔SVM等價於最小化L2正則的合頁損失

7.2 軟間隔SVM與L2正則的0-1損失

7.3 軟間隔SVM和L2正則的損失函式的對應關係

7.4 邏輯迴歸模型和線性支援向量機的關係

7.5 Platt模型：SVM的概率模型

SVM支援向量機系列理論（七）線性支援向量機與L2正則化 Platt模型

SVM支援向量機系列理論（三）非線性支援向量機與核函式技巧

SVM支援向量機系列理論（二）線性可分SVM模型的對偶問題

SVM支援向量機系列理論（九）核嶺迴歸

SVM支援向量機系列理論（四）軟間隔支援向量機

SVM支援向量機系列理論（六） SVM過擬合的原因和SVM模型選擇

SVM支援向量機系列理論（五）SVM中幾種核函式的對比

SVM系列理論（十） SVR支援向量迴歸

機器學習算法整理（七）支持向量機

Spring Boot乾貨系列：（七）預設日誌logback配置解析

小鑫の日常系列故事（七）——小紙條

Java NIO系列教程（七） FileChannel

OAuth 2.0系列教程（七）請求和響應

Spring原理與原始碼分析系列（七）- Spring AOP實現過程與實戰

Deep Learning（深度學習）學習筆記整理系列之（七）

《Linux系統》之"皮毛系列"（七）網路通訊設定

深度學習系列（七）：自編碼網路與PCA特徵學習的分類對比實驗

GIS程式設計（七）實現基本向量圖形系統的文件和檢視（1）組織向量圖形系統的圖形元素類

Deep Learning（深度學習）學習筆記整理系列之（七）Convolutional Neural Networks卷積神經網路

【原創】Selenium學習系列之（七）—ConnectDB和複用測試方法

SVM支援向量機系列理論（七） 線性支援向量機與L2正則化 Platt模型

7.1 軟間隔SVM等價於最小化L2正則的合頁損失

7.2 軟間隔SVM與L2正則的0-1損失

7.3 軟間隔SVM和L2正則的損失函式的對應關係

7.4 邏輯迴歸模型和線性支援向量機的關係

7.5 Platt模型：SVM的概率模型

SVM支援向量機系列理論（七）線性支援向量機與L2正則化 Platt模型