支援向量機（svm）新手入門篇

阿新 • • 發佈：2019-01-17

SVM叫做支援向量機( Support Vector Machines)是由Vanpik領導的AT&TBell實驗室研究小組 在1963年提出的一種新的非常有潛力的分類技術, SVM是一種基於統計學習理論的模式識別方法，主要應用於模式識別領域.由於當時這些研究尚不十分完善,在解決模式識別問題中往往趨於保守,且數學上比較艱澀,因此這些研究一直沒有得到充的重視.直到90年代,一個較完善的理論體系—統計學習理論 ( StatisticalLearningTheory,簡稱SLT) 的實現和由於神經網路等較新興的機器學習方法的研究遇到一些重要的困難,比如如何確定網路結構的問題、過學習與欠學習問題、區域性極小點問題等,使得SVM迅速發展和完善,在解決小樣本、非線性及高維模式識別問題中表現出許多特有的優勢,並能夠推廣應用到函式擬合等其他機器學習問題中.從此迅速的發展起來，現在已經在許多領域（生物資訊學，文字和手寫識別等）都取得了成功的應用。

1. 準備工作

1) 確立分類器個數

一般都事先確定分類器的個數，當然，如有必要，可在訓練過程中增加分類器的個數。分類器指的是將樣本中分幾個型別，比如我們從樣本中需要識別出：車輛、行人、非車並非人，則分類器的個數是3。

分類器的個數用k

2) 影象庫建立

SVM方法需要建立一個比較大的樣本集，也就是影象庫，這個樣本集不僅僅包括正樣本，還需要有一定數量的負樣本。通常樣本越多越好，但不是絕對的。

設樣本數為S

3) ROI提取

對所有樣本中的可能包含目標的區域（比如車輛區域）手動或自動提取出來，此時包括正樣本中的目標區域，也包括負樣本中類似車輛特徵的區域或者說干擾區域。

4) ROI預處理

包括背景去除，影象濾波，或者是邊緣增強，二值化等預處理。預處理的方法視特徵的選取而定。

5) 特徵向量確定

描述一個目標，打算用什麼特徵，用幾個特徵，給出每個特徵的標示方法以及總的特徵數，也就是常說的特徵向量的維數。

對於車輛識別，可用的特徵如：車輛區域的灰度均值、灰度方差、對稱性、資訊熵、傅立葉描述子等等。

設特徵向量的維數是L。

6) 特徵提取

確定採取的特徵向量之後，對樣本集中所有經過預處理之後的ROI區域進行特徵提取，也就是說計算每個ROI區域的所有特徵值，並將其儲存。

7) 特徵向量的歸一化

常用的歸一化方法是：先對相同的特徵（每個特徵向量分別歸一化）進行排序，然後根據特徵的最大值和最小值重新計算特徵值。

8) 核的選定

SVM的構造主要依賴於核函式的選擇，由於不適當的核函式可能會導致很差的分類結果，並且目前尚沒有有效的學習使用何種核函式比較好，只能通過實驗結果確定採用哪種核函式比較好。訓練的目標不同，核函式也會不同。

核函式其實就是採用什麼樣的模型描述樣本中目標特徵向量之間的關係。如常用的核函式：Gauss函式

對樣本的訓練就是計算p矩陣，然後得出描述目標的模板和代表元。

2. 訓練

訓練就是根據選定的核函式對樣本集的所有特徵向量進行計算，構造一個使樣本可分的特徵空間。

其訓練步驟如下：

1) 用分類器將所有樣本集的特徵分類

2) 根據選定的核函式分別計算每個分類器中每個特徵向量的有關值

3) 根據這些特徵相關值計算協方差矩陣空間

4) 對這個協方差矩陣空間進行Householder變換，也就是說將一個向量變換為由一個超平面反射的映象，是一種線性變換。超平面的法向量被稱作Householder向量。因為SVM就是在特徵空間中構造最優超平面。

具體變換方法可參照相關文章。裡面涉及大量的矩陣運算。

5) 計算特徵係數

得到協方差矩陣以及其對應的超平面矩陣，根據這兩個矩陣分別計算每個特徵的特徵係數，並將特徵係數對協方差矩陣進行縮放。

6) 獲得模型引數paramInvSigma，paramLogSigma

對縮放後的協方差矩陣paramSigma求逆後，計算模型引數。其計算方法參照程式：

for (i=0; i<numClass; i++)

{

for(j=0; j<size; j++)

{

sigma.pdata[j]= this->paramSigma[i*size+j];

}

sigma.inv(invSigma);

for(j=0; j<size; j++)

{

this->paramInvSigma[i*size+j]= invSigma.pdata[j];

}

this-> paramLogSigma[i] = log(sigma.det())-2*log(((DOUBLE)classSample[i])/((DOUBLE)totalSample));

}

3. 比較測試

比較測試是SVM方法的最後一步，也就是說通過訓練得到訓練模型引數之後，就可根據模型引數對一個ROI區域進行計算，判斷其歸類。

比較測試首先是對測試影象進行預處理，然後提取特徵，將這些特徵引數與訓練結果的模型引數進行比對，比對方法可參照文獻中介紹的：

得到對應的類別標誌：

4. 總結

SVM方法最主要的工作是樣本訓練，獲得訓練模型引數。

由於時間關係，暫時只對SVM有這些瞭解，只能算對SVM有一個初步的認識。並且上述總結都是在閱讀文獻之後的認識，難免有不少錯誤和不足，所以本文只能作為一個小參考。在對SVM有個初步的認識之後，需要仔細閱讀其原理，分析其中的矩陣運算及思想。SVM中涉及大量的矩陣運算和推導，需要弄清楚，這樣才能明白模型引數的含義，以便於判斷當前選定的核函式是否合適。

支援向量機（svm）新手入門篇

支援向量機（svm）新手入門篇

支援向量機（SVM）從入門到放棄再到掌握

4.支援向量機（SVM）演算法(下）

3.支援向量機（SVM）演算法(上）

1. 支援向量機（SVM）原理

3. 支援向量機（SVM）核函式

邏輯迴歸（LR）和支援向量機（SVM）的區別和聯絡

支援向量機（SVM）實現MNIST手寫體數字識別

第七章支援向量機（SVM）

支援向量機（SVM） | 文末有福利，絕不是標題黨

python opencv3.x中支援向量機（svm）模型儲存與載入問題

支援向量機（SVM）和python實現（三）

支援向量機（SVM）和邏輯迴歸(LR)

簡單粗暴理解支援向量機（SVM）及其MATLAB例項

[譯] 支援向量機（SVM）教程

機器學習-支援向量機（SVM）演算法學習筆記

機器學習筆記（五）：支援向量機（SVM）

時間序列（arima）+支援向量機（svm）+優化=組合預測

TensorFlow深度學習框架學習（二）：TensorFlow實現線性支援向量機（SVM）

機器學習——支援向量機（SVM）

支援向量機（svm）新手入門篇

相關推薦