1. 程式人生 > >線性可分 線性不可分

線性可分 線性不可分

很多機器學習分類演算法,比如支援向量機(SVM),的介紹都說了假設資料要是線性可分。如果資料不是線性可分的,我們就必須要採用一些特殊的方法,比如SVM的核技巧把資料轉換到更高的維度上,在那個高維空間資料更可能是線性可分的(Cover定理)。

理論上一定能在更高的維度把資料線性可分。

何為線性可分和線性不可分

線性可分就是說可以用一個線性函式把兩類樣本分開,比如二維空間中的直線、三維空間中的平面以及高維空間中的線型函式。
所謂可分指可以沒有誤差地分開;線性不可分指有部分樣本用線性分類面劃分時會產生分類誤差的情況。
在這種情況下,SVM就通過一個非線性對映函式把樣本對映到一個線性可分高維空間,在此高維空間建立線性分類面,而此高維空間的現行分類面對應的就是輸入空間中的非線性分類面。

判斷是否線性可分

不同樣本集用凸包包起來,判斷不同凸包的邊是否有交叉。