搞懂SVM的三個問題,間隔,對偶問題,KKT條件
阿新 • • 發佈:2019-01-10
搞懂間隔
給定訓練樣本集,分類學習最基本的想法就是基於訓練集在樣本空間中找到一個劃分超平面,將類別分開。如下圖所示。
但是能將樣本分開的超平面有很多,直觀上看,應該找兩類訓練樣本“正中間”的超平面,讓兩類“相離”最遠。
超平面可通過如下線性方程來描述:
其中為超平面法向量,決定超平面的方向;b為位移項,決定超平面與原點之間的距離。
超平面記為 ,接下來說明所謂的“間隔”。
如上圖,中間的實現表示的為超平面,假設超平面能正確分類,即對於,若,則有;若,則有。令
在上圖中,距離超平面最近的這幾個樣本點使得上式的等號成立,它們就被稱為支援向量。兩個異類支援向量到超平面之間的距離之和,就是我們要找的間隔。
間隔有函式間隔和幾何間隔,先講函式間隔,設 ,在超平面w*x+b=0確定的情況下, 能夠表示點x到距離超平面的遠近,而通過觀察 的符號與類標記y的符號是否一致可判斷分類是否正確,所以,可以用的正負性來判定或表示分類的正確性。於此,我們便引出了函式間隔(functional margin)的概念。
定義函式間隔(用表示)為:
越大,代表可信度越高,但是函式間隔有問題,假如同時增大,超平面沒有變,但是間隔函式值卻改變了。
事實上,我們可以對法向量w加些約束條件,從而引出真正定義點到超平面的距離–幾何間隔(geometrical margin)的概念,
樣本空間中任意一點到超平面的距離用 表示,根據幾何知識,上圖中有