使用libsvm分類和預測詳細說明（python）

阿新 • • 發佈：2019-02-19

Libsvm使用詳細介紹

optimization finished, #iter= 162 //iter為迭代次數，

nu = 0.431029 //nu是你選擇的核函式型別的引數

obj = -100.877288, rho =0.424462 // rho為判決函式的偏置項b

// obj為SVM檔案轉換為的二次規劃求解得到的最小值

nSV = 132, nBSV = 107 // nSV為標準支援向量個數(0<a[i]<c)

//nBSV為邊界上的支援向量個數(a[i]=c)

Total nSV = 132

//TotalnSV為支援向量總個數（對於兩類來說，因為只有一個分類模型TotalnSV = nSV

，但是對於多類，這個是各個分類模型的nSV之和）。

用法：

svmscale[-l lower] [-u upper] //將資料進行歸一化處理

[-y y_lower y_upper]

[-s save_filename]

[-r restore_filename]filename

其中，[]中都是可選項：

-l：設定資料下限；lower：設定的資料下限值，預設為-1

-u：設定資料上限；upper：設定的資料上限值，預設為 1

-y：是否對目標值同時進行縮放；y_lower為下限值，y_upper為上限值；

-ssave_filename：表示將縮放的規則儲存為檔案save_filename

；

-rrestore_filename：表示將按照已經存在的規則檔案restore_filename進行縮放；

filename：待縮放的資料檔案，檔案格式按照libsvm格式。

首先開啟cmd，進入libsvm>windows資料夾

預設情況下，只需要輸入要縮放的檔名就可以了：比如(已經存在的檔案為test.txt)

svm-scaletest.txt

這時，test.txt中的資料已經變成[-1,1]之間的資料了。但是，這樣原來的資料就被覆蓋了，為了讓規劃好的資料另存為其他的檔案，我們用一個dos的重定向符 > 來另存為(

假設為out.txt)：

svm-scale test.txt > out.txt

執行後，我們就可以看到目錄下多了一個out.txt檔案，那就是規範後的資料。假如，我們想設定資料範圍[0,1]，並把規則儲存為test.range檔案:

svm-scale –l 0 –u 1 –s test.range test.txt > out.txt

這時，目錄下又多了一個test.range檔案，可以用記事本開啟，下次就可以用

-r test.range來載入了。

grid.py //暴力試參

首先進入libsvm>tools資料夾，找到grid.py，開啟原始碼修改gnuplot_exe（需要另下載）的路徑

開啟cmd，進入libsvm>tools資料夾

輸入python grid.py test.txt

可選引數[-log2cbegin,end,step] [-log2g begin,end,step] [-v fold]

//使用者自定義的引數 c和g 的範圍 begin~end 以及步長 step，幾折交叉驗證

得到引數c和g的值以及交叉驗證準確率

注意：text.txt裡面的資料，每一行的的鍵必須從小到大依次排列，否則報錯，libsvm其他方法處理的時候，則不需要

使用時調入模組

（1）svm_read_problem() : read the data from a LIBSVM-format file

（2）svm_problem():

（3）svm_parameter():引數為字串

其中的c和g引數根據之前除錯的引數進行修改

svm_train的引數：

-s SVM的型別(svm_type)

0 -- C-SVC(預設)使用懲罰因子(Cost)的處理噪聲的多分類器

1 -- nu-SVC(多分類器)按照錯誤樣本比例處理噪聲的多分類器

2 -- one-class SVM一類支援向量機，可參見"SVDD"的相關內容

3 -- epsilon-SVR(迴歸)epsilon支援向量迴歸

4 -- nu-SVR(迴歸)

-t核函式型別(kernel_type)

0 -- linear(線性核):u'*v

1 -- polynomial(多項式核):(gamma*u'*v +coef0)^degree

2 -- radial basisfunction(RBF,徑向基核/高斯核):exp(-gamma*|u-v|^2)

3 -- sigmoid(S型核):tanh(gamma*u'*v + coef0)

4 -- precomputed kernel(預計算核)：

核矩陣儲存在training_set_file中

下面是調整SVM或核函式中引數的選項：

-d調整核函式的degree引數，預設為3

-g調整核函式的gamma引數，預設為1/num_features

-r調整核函式的coef0引數，預設為0

-c調整C-SVC, epsilon-SVR 和 nu-SVR中的Cost引數，預設為1

-n調整nu-SVC, one-class SVM 和 nu-SVR中的錯誤率nu引數，預設為0.5

-p調整epsilon-SVR的loss function中的epsilon引數，預設0.1

-m調整內緩衝區大小,以MB為單位，預設100

-e調整終止判據，預設0.001

-wi調整C-SVC中第i個特徵的Cost引數

調整演算法功能的選項：

•-b是否估算正確概率,取值0 - 1，預設為0

•-h是否使用收縮啟發式演算法(shrinkingheuristics),取值0- 1，預設為0

•-v交叉校驗

• -q靜默模式

（4）svm_train()

svm_train有3個過載：

l model = svm_train(y, x [,'training_options'])

l model = svm_train(prob [,'training_options'])

l model = svm_train(prob, param)

（5）svm_save_model() : save model to a file.

將訓練好的svm_model儲存到檔案中：

svm_save_model('model_file',model)

model_file的內容：

svm_typec_svckernel_typelinearnr_class 2 total_sv 2 rho 0 label 1 -1probA 0.693147 probB 2.3919e-16 nr_sv 1 1 SV 0.25 1:1 2:1-0.25 1:-1 2:-1

（6）svm_load_model() : load a LIBSVM model.

讀取儲存在檔案中的svm_model:

model =svm_load_model('model_file')

（7）svm_predict()

呼叫語法：

p_labs, p_acc, p_vals =svm_predict(y, x, model [,'predicting_options'])

引數：

y測試資料的標籤x測試資料的輸入向量model為訓練好的SVM模型。

返回值：

p_labs是儲存預測標籤的列表。

p_acc儲存了預測的精確度，均值和迴歸的平方相關係數。

p_vals在指定引數'-b 1'時將返回判定係數(判定的可靠程度)。

這個函式不僅是測試用的介面，也是應用狀態下進行分類的介面。比較奇葩的是需要輸入測試標籤y才能進行預測，因為y不影響預測結果可以用0向量代替。

使用libsvm分類和預測詳細說明（python）

Libsvm使用詳細介紹optimization finished, #iter= 162 //iter為迭代次數，nu = 0.431029 //nu是你選擇

紅黑樹原理和演算法詳細介紹（Java）

R-B Tree簡介 R-B Tree，全稱是Red-Black Tree，又稱為“紅黑樹”，它一種特殊的二叉查詢樹。紅黑樹的每個節點上都有儲存位表示節點的顏色，可以是紅(Red)或黑(Black)。紅黑樹的特性: （1）每個節點或者是黑色，或者是紅

lambda函式詳細介紹（Python）

定義在Python中，除了使用def關鍵字宣告普通函式外，還提供了一種使用表示式生成函式物件的形式。由於它與LISP語言中的一個工具很相似，所以稱為lambda。 lambda函式也叫匿名函式，即沒有具體名稱的函式，它允許快速定義單行函式，可以用在任何需要

用線性分類器實現預測鳶尾花的種類（python）

rom dir Coding and func shape 交叉驗證 pri state 這是個人學習時跑的代碼，結果就不貼了，有需要的可以自己運行，僅供參考，有不知道的可以私下交流，有問題也可以聯系我。當然了我也只能提供一點建議，畢竟我也只是初學者第一個頁面 # -*-

第5章 IP地址和子網劃分（2）_IP地址分類和NAT技術

sts 端口主機數 int 2.3 主機ip 主機和源找到 3. IP地址的分類（1）五類IP地址（2）數軸表示法 4. 保留地址（1）網段的地址：主機ID全0。如192.168.100.0/24，其中的192.168.10.0指的是網段。（2）廣播地

python 零寬負預測先行斷言（心得）

ont 不能 pos nor 如果後綴 multi group reply 零寬（環視）負預測先行斷言(負向前視斷言)： (?!exp)，它斷言在此位置前面不能匹配表達式，所以它只會匹配後綴exp不存在的位置。零寬度，說明它是不占字符寬度的. Ex： 1 &g

流暢的python和cookbook學習筆記（一）

構造函數推導笛卡爾 expr 列表推導叠代建立笛卡兒 imp 1.數據結構 1.1 內置序列類型　　四種序列類型：　　1.容器序列：list、tuple和collections.deque 　　2.扁平序列：str、bytes、bytearray、memory

流暢的python和cookbook學習筆記（五）

pytho col () 學習 util 學習筆記取出 minute python 1.隨機選擇　　python中生成隨機數使用random模塊。　　1.從序列中隨機挑選元素，使用random.choice() >>> import random

流暢的python和cookbook學習筆記（八）

不可變 pri 列表改變如果 book 影響 color print 1.函數的默認參數必須不可變　　如果函數的默認參數為可變的對象，那麽默認參數在函數外被修改也會影響到函數本身的。 >>> def spam(a, b=None): # b要為不

python學習--如何實現可叠代對象（itearable）和叠代器（iterator）

dict 作用 pri 返回 -- 生成器 ble ear item 關於可叠代對象Iterable 和叠代器對象iterator 可叠代對象：可以直接作用於for循環的對象統稱為可叠代對象：Iterable。可叠代對象包含一個__iter__方法，或__getitem_

Python學習--和 Oracle 交互（2）

nvi imp chinese import 方案 set utf-8 acl 字符編碼當在 mac 電腦上用 Python 讀取 oracle 數據庫中的中文時，有可能返回數據為“?” 解決方案：在數據庫操作的函數前添加以下代碼， import sysreload

探究 encode 和 decode 的使用問題（Python）

gbk nco com 程序 mage python 文件 height pre 很多時候在寫Python程序的時候都要在頭部添加這樣一行代碼 #coding: utf-8 或者是這樣 # -*- coding:utf-8 -*- 等等這行代

測試工程師的一些面試題目（python）和總結

pat 實現 cci strong 表現用法工程重點性能（一）說明 1、記錄自己面試測試工程師時遇到的一些編程題（python）。 2、回顧下面試的過程，做個總結。（二）題目 1、輸入：JSON {"a":"aa","b":"bb",

泰坦尼克號生存預測（python）

scores k近鄰 ace gbdt dom png 記錄 inline sse 1 數據探索對數據進行一個整體的理解 1.1 查看數據都有一些什麽特征 import pandas as pd import seaborn as sns %matplotlib inl

python多線程和多進程（一）

5.0 16px time img 繼承 total 線程鎖 nco 第一次一、多線程 Python的標準庫提供了兩個模塊：_thread和threading，_thread是低級模塊，threading是高級模塊，對_thread進行了封裝。絕大多數情況下，只需要使用

python多線程和多進程（二）

模型 pre 否則 sel main 競爭並發執行 turn 定制 ---恢復內容開始--- 一、多進程　　1、multiprocessing模塊用來開啟子進程，並在子進程中執行我們定制的任務（比如函數），該模塊與多線程模塊threading的編程接口類似。 impo

BP算法實例—鳶尾花的分類（Python）

weight 1.0 pandas update dom 零矩陣 shuffle == 不同首先了解下Iris鳶尾花數據集： Iris數據集（https://en.wikipedia.org/wiki/Iris_flower_data_set）是常用的分類實

分類和迴歸的區別（在CNN中）

兩者的本質相同，分類和迴歸的區別在於輸出變數的型別。定量——連續——迴歸定性——離散——分類用於迴歸：最後一層有m個神經元，每個神經元輸出一個標量，m個神經元的輸出可以看作向量V，現全部連到一個神經元上，則這個神經元的輸出為wx+b,是一個連續值，可以處理迴歸問題用於分類：現

轉發和重定向（python）

轉發和重定向轉發：只有一次請求和響應重定向：兩對以上的請求和響應使用： render render(request, template_name[, context]) 結合一個給定的模板和一個給定的上下文字典，並返回一個渲染後的Htt

一分鐘學會讀csv檔案和寫csv檔案（python實現）

import csv with open('Python-Predict/Data/train.csv') as tra: rdr = csv.reader(tra) items = list(rdr) print("rdr:",rdr) print(items)

使用libsvm分類和預測詳細說明（python）

相關推薦