1. 程式人生 > >支援向量機之非線性支援向量機(四)

支援向量機之非線性支援向量機(四)

非線性支援向量機與核函式

核技巧

對於非線性分類問題,可以轉換成線性問題求解。
首先,將原始特徵空間資料對映到新的空間
然後,在新的空間利用線性可分支援向量機方法求解

核函式

X是輸入空間,設H是特徵空間,如果存在一個從X>H的對映:ϕ(x):X>H
使得對所有的x,zϵX,核函式滿足:


K(x,z)=ϕ(x)ϕ(z)

則稱K(x,z)是核函式,ϕ(x)為對映函式,ϕ(x)ϕ(z)為內積

在學習中一般情況核函式有自己定義輸入的。

核函式應用到支援向量機

線性支援向量機的對偶問題是:

這裡寫圖片描述

換成核函式只需要將上面的<xi

,xj>的內積換成K(xi,xj)

目標函式是:


w(α)=12Ni=1Nj=1αiαjK(xi,xj)Ni=1αi

分類決策函式是:


f(x)=sign(Ni=1αiyiK(xi,x))+b

常用到的核函式

1.多項式核函式(polynomial kernel function)


K(x,z)=(axz+b)p

a,b,p是常數,p一般取3,有個理論是:三次函式可以擬合出任意形式的函式。
2.高斯核函式(Gaussian kernel function)

K(x,z)=exp(||xz||22σ2)

σ也是自己輸入的
對應的支援向量機是高斯徑向基函式(radial basis function,簡稱RBF)分類器

這兩個比較常見的

非線性支援向量機分類器

最優化問題:
目標函式是:


minα12Ni=1Nj=1αiαjK(xi,xj)Ni=1αi
s.t.Ni=1αiyi=0
0<=αi<=C,i=1,2,...,N

最優解:

α=(α1,α2,...,αN)

選擇α的一個正分量0<αj<C


b=<