sklearn中的svm.SVC

阿新 • • 發佈：2019-01-02

svm是sklearn中一個關於支援向量機的包，比較常用，在使用過程中若是不熟悉各個引數的意義，總以預設引數進行機器學習，則不能做到最優化使用SVM，這就是一個較為遺憾的事情了。為了加深理解和方便呼叫，根據現有理解，結合官方文件，對其中的引數做一些記錄，方便自己時常溫習，也給閱讀者進行一些粗淺的介紹，如果有理解錯誤的地方，希望閱讀者能夠指出。

以svm中的支援向量分類SVC作為介紹，所有引數如下：

class sklearn.svm.SVC(
            C=1.0, 
            kernel='rbf', 
            degree=3, 
            gamma='auto' 
, 
            coef0=0.0, 
            shrinking=True, 
            probability=False, 
            tol=0.001, 
            cache_size=200, 
            class_weight=None, 
            verbose=False, 
            max_iter=-1, 
            decision_function_shape='ovr', 
            random_state=None)

具體每個引數的使用方法介紹如下：

C : float, optional (default=1.0)

    誤差項的懲罰引數，一般取值為10的n次冪，如10的-5次冪，10的-4次冪。。。。10的0次冪，10，1000,1000，在python中可以使用pow（10，n） n=-5~inf
    C越大，相當於懲罰鬆弛變數，希望鬆弛變數接近0，即對誤分類的懲罰增大，趨向於對訓練集全分對的情況，這樣會出現訓練集測試時準確率很高，但泛化能力弱。
    C值小，對誤分類的懲罰減小，容錯能力增強，泛化能力較強。

kernel : string, optional (default=’rbf’)

    svc中指定的kernel型別。
    可以是： ‘linear’, ‘poly’, ‘rbf’, ‘sigmoid’, ‘precomputed’ 或者自己指定。 預設使用‘rbf’ 。

degree : int, optional (default=3)

    當指定kernel為 ‘poly’時，表示選擇的多項式的最高次數，預設為三次多項式。
    若指定kernel不是‘poly’,則忽略，即該引數只對‘poly’有作用。

gamma : float, optional (default=’auto’)

    當kernel為‘rbf’, ‘poly’或‘sigmoid’時的kernel係數。
    如果不設定，預設為 ‘auto’ ，此時，kernel係數設定為：1/n_features

coef0 : float, optional (default=0.0)

    kernel函式的常數項。
    只有在 kernel為‘poly’或‘sigmoid’時有效，預設為0。

probability : boolean, optional (default=False)
    是否採用概率估計。
    必須在fit（）方法前使用，該方法的使用會降低運算速度，預設為False。

shrinking : boolean, optional (default=True)

    如果能預知哪些變數對應著支援向量，則只要在這些樣本上訓練就夠了，其他樣本可不予考慮，這不影響訓練結果，但降低了問題的規模並有助於迅速求解。進一步，如果能預知哪些變數在邊界上(即a=C)，則這些變數可保持不動，只對其他變數進行優化，從而使問題的規模更小，訓練時間大大降低。這就是Shrinking技術。

    Shrinking技術基於這樣一個事實：支援向量只佔訓練樣本的少部分，並且大多數支援向量的拉格朗日乘子等於C。

tol : float, optional (default=1e-3)

    誤差項達到指定值時則停止訓練，預設為1e-3，即0.001。

cache_size : float, optional

    指定核心快取的大小，預設為200M。

class_weight : {dict, ‘balanced’}, optional

    權重設定。如果不設定，則預設所有類權重值相同。
    以字典形式傳入。
    ##（這個具體使用還不是很清楚）##
    Set the parameter C of class i to class_weight[i]*C for SVC. If not given, all classes are supposed to have weight one. The “balanced” mode uses the values of y to automatically adjust weights inversely proportional to class frequencies in the input data as n_samples / (n_classes * np.bincount(y))

verbose : bool, default: False

    是否啟用詳細輸出。
    多執行緒時可能不會如預期的那樣工作。預設為False。

max_iter : int, optional (default=-1)

    強制設定最大迭代次數。
    預設設定為-1，表示無窮大迭代次數。
    Hard limit on iterations within solver, or -1 for no limit.

decision_function_shape : ‘ovo’, ‘ovr’, default=’ovr’

    ##這個用法也不是很理解##
    Whether to return a one-vs-rest (‘ovr’) decision function of shape (n_samples, n_classes) as all other classifiers, or the original one-vs-one (‘ovo’) decision function of libsvm which has shape (n_samples, n_classes * (n_classes - 1) / 2).

    Changed in version 0.19: decision_function_shape is ‘ovr’ by default.

    New in version 0.17: decision_function_shape=’ovr’ is recommended.

    Changed in version 0.17: Deprecated decision_function_shape=’ovo’ and None.

random_state : int, RandomState instance or None, optional (default=None)

    偽隨機數使用資料。

一些屬性介紹：

Attributes: 

support_ : array-like, shape = [n_SV]

    Indices of support vectors.

support_vectors_ : array-like, shape = [n_SV, n_features]

    Support vectors.

n_support_ : array-like, dtype=int32, shape = [n_class]

    Number of support vectors for each class.

dual_coef_ : array, shape = [n_class-1, n_SV]

    Coefficients of the support vector in the decision function. For multiclass, coefficient for all 1-vs-1 classifiers. The layout of the coefficients in the multiclass case is somewhat non-trivial. See the section about multi-class classification in the SVM section of the User Guide for details.

coef_ : array, shape = [n_class-1, n_features]

    Weights assigned to the features (coefficients in the primal problem). This is only available in the case of a linear kernel.

    coef_ is a readonly property derived from dual_coef_ and support_vectors_.

intercept_ : array, shape = [n_class * (n_class-1) / 2]

    Constants in decision function.

sklearn中SVM調參說明

his suppose ise which tin chan erl adjust only 寫在前面之前只停留在理論上，沒有實際沈下心去調參，實際去做了後，發現調參是個大工程（玄學）。於是這篇來總結一下sklearn中svm的參數說明以及調參經驗。方便以後查詢和回憶。

sklearn中SVM簡單使用

在看周志華老師的機器學習書時，利用sklearn中的SVM解決第六章的一些課後習題。 **********************************************************************************************

使用sklearn中svm做多分類時難點解惑

一，parameters: decision_function_shape: 兩種方法one v one 或者 one v rest decision_function_shape : ‘ovo’, ‘ovr’ or None, default=

sklearn中SVM與AdaBoost對手寫體數字進行識別

最近比較忙，自從寫了第一篇部落格之後，好久沒寫部落格。最近自己搗鼓了一下基於SVM與AdaBoost的手寫體數字識別，和大家分享一下這個過程吧。首先，資料集的準備，選用的是比較有名的MINIST資料集（資料集可以在這個地方下載點選開啟連結,其實

SKLearn中SVM引數自動選擇的最簡單示例（使用GridSearchCV）

大家都知道，SVM如果在調參比較好的情況下，可以達到很好的分類效果，不過SVM也確實引數比較多，例如在這裡介紹的：也有些朋友對調參過程做了比較詳細的解釋：據網友介紹，SVM調參過程中應主要調kernel，C 和gamma，對於SKLearn，我們可以使用GridSearchC

如何使用sklearn中的SVM（SVC;SVR）

SVM分類演算法我們前面已經講過了，那麼我們平時要用到SVM的時候，除了在MATLAB中呼叫libsvm之外，我們的Python中的sklean也已經集成了SVM演算法。這篇部落格就講一下sklearn中的SVM如何呼叫。我們先說個例子，看看簡單

sklearn中的svm.SVC

svm是sklearn中一個關於支援向量機的包，比較常用，在使用過程中若是不熟悉各個引數的意義，總以預設引數進行機器學習，則不能做到最優化使用SVM，這就是一個較為遺憾的事情了。為了加深理解和方便呼叫，根據現有理解，結合官方文件，對其中的引數做一些記錄，方便自己時常溫習，也給閱讀者進行一些粗淺的介

【sklearn】SVM用於分類（SVC）

API說明：中文：http://sklearn.apachecn.org/cn/0.19.0/modules/svm.html 英文：https://scikit-learn.org/stable/modules/svm.html API使用：（SVC）（Su

SVM基本概要與sklearn.svm.svc 引數說明

SVM的基本概念先介紹一些簡單的基本概念：分隔超平面：將資料集分割開來的直線叫做分隔超平面。超平面：如果資料集是N維的，那麼就需要N-1維的某物件來對資料進行分割。該物件叫做超平面，也就是分類的決策邊界。間隔：一個點到分割面的距離，稱為點相對

機器學習：sklearn.svm.SVC 引數說明

2.sklearn.svm.SVC()引數引數： l C：C-SVC的懲罰引數C?預設值是1.0 C越大，相當於懲罰鬆弛變數，希望鬆弛變數接近0，即對誤分類的懲罰增大，趨向於對訓練集全分對的情況，這樣對訓練集測試時準確率很高，但泛化能力弱。C值小，對誤分類的懲罰

sklearn.svm.SVC 引數說明

經常用到sklearn中的SVC函式，這裡把文件中的引數翻譯了一些，以備不時之需。本身這個函式也是基於libsvm實現的，所以在引數設定上有很多相似的地方。（PS: libsvm中的二次規劃問題的解決演算法是SMO）。sklearn.svm.SVC(C=1.0, ker

sklearn.svm.SVC的方法decision_function_shape：ovr 或者 ovo

　　SVM演算法最初是為二值分類問題設計的，當處理多類問題時，就需要構造合適的多類分類器。　　目前，構造SVM多類分類器的方法主要有兩類：一類是直接法，直接在目標函式上進行修改，將多個分類面的引數求解合併到一個最優化問題中，通過求解該最優化問題“一

機器學習筆記(12)---使用Sklearn中的SVM

svm理論太難理解了，先上個sklearn中的SVM程式碼提升點信心吧，理論後續補上。 import numpy as np from sklearn import datasets from s

sklearn通過OneVsRestClassifier實現svm.SVC的多分類

這個repo 用來記錄一些python技巧、書籍、學習連結等，歡迎star svm.SVC 支援向量機分類是一個很有效的分類方式，但是其只對2分類有效(sklearn中並不是，針對多分類其使用

機器學習筆記：python中使用sklearn中的svm進行分類demo，並輸入分類概率

from sklearn import svm# 使用svm分類demo# sklearn.svm.SVC(C=1.0, kernel='rbf', degree=3, gamma='auto', coef0=0.0, shrinking=True, probability=

sklearn.svm.SVC引數說明

摘自：https://blog.csdn.net/szlcw1/article/details/52336824 本身這個函式也是基於libsvm實現的，所以在引數設定上有很多相似的地方。（PS: libsvm中的二次規劃問題的解決演算法是SMO）。sklearn.svm

python 利用庫sklearn 中的 grid_search對svm 引數尋優（借鑑）

import time from sklearn import metrics import numpy as np import pickle from sklearn.tree import DecisionTreeClassifier def svm

關於sklearn.svm.SVC與.NuSVC的區別以及引數介紹

0. 區別 SVC與NuSVC是類似的方法，但是接受稍微不同的引數集合並具有不同的數學公式，並且NuSVC可以使用引數來控制支援向量的個數 , 以下程式碼預設的是多分類 1. SVC # coding:utf-8 from sklearn i

sklearn中各算法類的fit，fit_transform和transform函數

結果但是 transform 區別通過 ans 變量必須 com 在使用PCA和NFC中有三個函數fit，fit_transform，transform區分不清各自的功能。通過測試，勉強了解各自的不同，在這裏做一些筆記。 1.fit_transform是fit和tra

sklearn中樹模型可視化的方法

方法 ron 問題 style 業界們的 graphviz 還需要 plus 在機器學習的過程中，我們常常會用到樹模型的方式來解決我們的問題。在工業界，我們不僅要針對某個問題利用機器學習的方法來解決問題，而且還需要能力解釋其中的原理或原因。今天主要在這裏記錄一下樹模型是怎

sklearn中的svm.SVC

相關推薦