SVM的分類超平面的數學推導
阿新 • • 發佈:2019-01-06
給出數學推導,每個向量的意義不再贅述
轉換原問題
確定每個支援向量下的超平面:min y(w^T+b)/||w||
間隔最大的為所求最優的超平面 max min y(w^T+b)/||w|| ,
即求:
=+1或-1,不影響結果。
為了便於計算,我們可以認為在支援向量上的這一部分為 1,支援向量上的點也為所有點裡的最近的點
那麼其他點滿足不等式:
這個式子轉換為:
即
對於,它取得 max 和 取得 min 的情形是一致的(1/2和平方便於後續計算)
問題轉換為
拉格朗日乘子法
關於拉格朗日乘子法的原理和證明:
深入理解拉格朗日乘子法(Lagrange Multiplier) 和KKT條件
其中嚴謹的拉格朗日對偶的證明沒有明白,但是直觀上是能理解的。
強對偶和KKT條件也非常嚴格,這裡沒有寫出來。
有不等式約束的優化問題,可以寫為:
min f(x),
s.t. g_i(x) <= 0; i =1, ..., n
h_j(x) = 0; j =1, ..., m
對於含有不等式約束的優化問題,如何求取最優值呢?常用的方法是KKT條件.
同樣地,把所有的不等式約束、等式約束和目標函式全部寫為一個式子L(a, b, x)= f(x) + a*g(x)+b*h(x),
KKT條件是說最優值必須滿足以下條件:
1. L(a, b, x)對x求導為零;
2. h(x) =0;
3. a*g(x) = 0;
求取這三個等式之後就能得到候選最優值。其中第三個式子非常有趣,因為g(x)<=0,
如果要滿足這個等式,必須a=0或者g(x)=0. 這是SVM的很多重要性質的來源,如支援向量的概念。
我們按照拉格朗日乘子法:
構造
令其對各分量求偏導等於0,即分別對 ,求導
可以得到
①
②
把上述結論代入 L,
即