Free Mind的支援向量機（SVM）系列

本文是“支援向量機系列”的第三篇，參見本系列的其他文章。

前面我們介紹了線性情況下的支援向量機，它通過尋找一個線性的超平面來達到對資料進行分類的目的。不過，由於是線性方法，所以對非線性的資料就沒有辦法處理了。例如圖中的兩類資料，分別分佈為兩個圓圈的形狀，不論是任何高階的分類器，只要它是線性的，就沒法處理，SVM 也不行。因為這樣的資料本身就是線性不可分的。

對於這個資料集，我可以悄悄透露一下：我生成它的時候就是用兩個半徑不同的圓圈加上了少量的噪音得到的，所以，一個理想的分界應該是一個“圓圈”而不是一條線（超平面）。如果用和來表示這個二維平面的兩個座標的話，我們知道一條二次曲線（圓圈是二次曲線的一種特殊情況）的方程可以寫作這樣的形式：

注意上面的形式，如果我們構造另外一個五維的空間，其中五個座標的值分別為 ,,,,，那麼顯然，上面的方程在新的座標系下可以寫作：

關於新的座標，這正是一個 hyper plane 的方程！也就是說，如果我們做一個對映，將按照上面的規則對映為，那麼在新的空間中原來的資料將變成線性可分的，從而使用之前我們推導的線性分類演算法就可以進行處理了。這正是 Kernel 方法處理非線性問題的基本思想。

再進一步描述 Kernel 的細節之前，不妨再來看看這個例子對映過後的直觀例子。當然，我沒有辦法把 5 維空間畫出來，不過由於我這裡生成資料的時候就是用了特殊的情形，具體來說，我這裡的超平面實際的方程是這個樣子（圓心在

軸上的一個正圓）：

因此我只需要把它對映到 ,, 這樣一個三維空間中即可，下圖（這是一個 gif 動畫）即是對映之後的結果，將座標軸經過適當的旋轉，就可以很明顯地看出，資料是可以通過一個平面來分開的：

現在讓我們再回到 SVM 的情形，假設原始的資料時非線性的，我們通過一個對映將其對映到一個高維空間中，資料變得線性可分了，這個時候，我們就可以使用原來的推導來進行計算，只是所有的推導現在是在新的空間，而不是原始空間中進行。當然，推導過程也並不是可以簡單地直接類比的，例如，原本我們要求超平面的法向量，但是如果對映之後得到的新空間的維度是無窮維的（確實會出現這樣的情況，比如後面會提到的 Gaussian Kernel ），要表示一個無窮維的向量描述起來就比較麻煩。於是我們不妨先忽略過這些細節，直接從最終的結論來分析，回憶一下，我們上一次得到的最終的分類函式是這樣的：