1. 程式人生 > >間隔與支援向量

間隔與支援向量

給定一個訓練樣本集

我們想要得到一個劃分超平面,將不同類別的樣本分開來。

如圖,我們應儘可能地使兩個類別的樣本都儘可能地遠離超平面,換句話說,就是使得訓練集之外的未見示例在該超平面的作用下也能正確分類,所以,超平面應該儘可能“正中間”劃分訓練集。

劃分超平面可用以下線性方程表示:

樣本中任意點x到超平面的距離可以表示為:

證明如下:

若能正確分類,我們用y=+1和y=-1表示正例和反例,根據影象有,

(由於向量w可以進行縮放變換,所以我們總能得到式6.3的形式)

我們將使式6.3取得等號的樣本點稱為支援向量,它們到超平面的距離等於1。兩個不同類的樣本到超平面的距離之和為(我們稱之為間隔)

由上面所說,我們應該使“間隔”最大化,也就是

這等價於最大化||w||^2

這就是支援向量機SVM的基本型。