【sklearn】SVM用於分類（SVC）

阿新 • • 發佈：2018-11-20

API說明：

中文：http://sklearn.apachecn.org/cn/0.19.0/modules/svm.html

英文：https://scikit-learn.org/stable/modules/svm.html

API使用：（SVC）（Support Vector Classification.）

from sklearn import svm
X = [[0, 0], [1, 1]]
y = [0, 1]
clf = svm.SVC()
clf.fit(X, y) 

#預測
clf.predict([[2., 2.]])

# 獲得支援向量
clf.support_vectors_


# 獲得支援向量的索引get indices of support vectors
clf.support_ 

# 為每一個類別獲得支援向量的數量
clf.n_support_

用於多分類：

X = [[0], [1], [2], [3]]
Y = [0, 1, 2, 3]
clf = svm.SVC(decision_function_shape='ovo')#一對一
clf.fit(X, Y) 

dec = clf.decision_function([[1]])
dec.shape[1] # 4 classes: 4*3/2 = 6

clf.decision_function_shape = "ovr"#一對多
dec = clf.decision_function([[1]])
dec.shape[1] # 4 classes

引數說明：

https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html

class sklearn.svm.SVC(C=1.0, kernel=’rbf’, degree=3, gamma=’auto_deprecated’, coef0=0.0, shrinking=True, probability=False, tol=0.001,

cache_size=200, class_weight=None, verbose=False

, max_iter=-1, decision_function_shape=’ovr’, random_state=None)

引數：

C：懲罰項，預設1.0

kernel：核函式，預設‘rbf’。可自定義，根據其預先計算核心矩陣【n_samples, n_samples】

degree：多項式核函式的次數（'poly'）。被所有其他核心忽略。

gamma ：'rbf'，'poly'和'sigmoid'的核係數。當前預設值為'auto'，它使用1 / n_features，如果gamma='scale'傳遞，則使用1 /（n_features * X.std（））作為gamma的值。當前預設的gamma''auto'將在版本0.22中更改為'scale'。

coef0 ：預設0.0.核函式中的獨立項。它只在'poly'和'sigmoid'中很重要。

shrinking：預設True。是否使用收縮啟發式。

probability：預設False。是否啟用概率估計。必須在呼叫fit之前啟用它，並且會減慢該方法的速度。

tol ：預設0.001.容忍停止標準。

cache_size：指定核心快取的大小（MB）

class_weight ：{dict，'balanced'}。將類i的引數C設定為SVC的class_weight [i] * C. 如果沒有給出，所有類都應該有一個權重。“平衡”模式使用y的值自動調整與輸入資料中的類頻率成反比的權重n_samples / (n_classes * np.bincount(y))

verbose：預設False。啟用詳細輸出。請注意，此設定利用libsvm中的每程序執行時設定，如果啟用，則可能無法在多執行緒上下文中正常執行。

max_iter ：迭代的硬限制。預設-1（無限制）

decision_function_shape ：預設’ovr‘。

random_state ：預設無。偽隨機數生成器的種子在對資料進行混洗以用於概率估計時使用。如果是int，則random_state是隨機數生成器使用的種子; 如果是RandomState例項，則random_state是隨機數生成器; 如果沒有，隨機數生成器所使用的RandomState例項np.random。

屬性：

support_ ：支援向量索引。

support_vectors_ ：支援向量。

n_support_ ：每一類的支援向量數目

dual_coef_ ：決策函式中支援向量的係數

coef_ ：賦予特徵的權重（原始問題中的係數）。這僅適用於線性核心。

intercept_ ：決策函式中的常量。

例項：

https://scikit-learn.org/stable/auto_examples/svm/plot_iris.html#sphx-glr-auto-examples-svm-plot-iris-py
def make_meshgrid(x, y, h=.02):
    """Create a mesh of points to plot in

    Parameters
    ----------
    x: data to base x-axis meshgrid on
    y: data to base y-axis meshgrid on
    h: stepsize for meshgrid, optional

    Returns
    -------
    xx, yy : ndarray
    """
    x_min, x_max = x.min() - 1, x.max() + 1
    y_min, y_max = y.min() - 1, y.max() + 1
    xx, yy = np.meshgrid(np.arange(x_min, x_max, h),
                         np.arange(y_min, y_max, h))
    return xx, yy
np.meshgrid：meshgrid函式將兩個輸入的陣列x和y進行擴充套件，前一個的擴充套件與後一個有關，後一個的擴充套件與前一個有關，前一個是豎向擴充套件，後一個是橫向擴充套件。
def plot_contours(ax, clf, xx, yy, **params):
    """Plot the decision boundaries for a classifier.

    Parameters
    ----------
    ax: matplotlib axes object
    clf: a classifier
    xx: meshgrid ndarray
    yy: meshgrid ndarray
    params: dictionary of params to pass to contourf, optional
    """
    Z = clf.predict(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)
    out = ax.contourf(xx, yy, Z, **params)
    return out
np.r_是按列連線兩個矩陣，就是把兩矩陣上下相加，要求列數相等，類似於pandas中的concat()。

np.c_是按行連線兩個矩陣，就是把兩矩陣左右相加，要求行數相等，類似於pandas中的merge()。

ax.contourf(xx, yy, Z, **params)：contourf：將不會再繪製等高線（顯然不同的顏色分界就表示等高線本身），
import numpy as np
import matplotlib.pyplot as plt
from sklearn import svm, datasets

# import some data to play with
iris = datasets.load_iris()
# Take the first two features. We could avoid this by using a two-dim dataset
X = iris.data[:, :2]
y = iris.target

# we create an instance of SVM and fit out data. We do not scale our
# data since we want to plot the support vectors
C = 1.0  # SVM regularization parameter
models = (svm.SVC(kernel='linear', C=C),
          svm.LinearSVC(C=C),
          svm.SVC(kernel='rbf', gamma=0.7, C=C),
          svm.SVC(kernel='poly', degree=3, C=C))
models = (clf.fit(X, y) for clf in models)

# title for the plots
titles = ('SVC with linear kernel',
          'LinearSVC (linear kernel)',
          'SVC with RBF kernel',
          'SVC with polynomial (degree 3) kernel')
# Set-up 2x2 grid for plotting.
fig, sub = plt.subplots(2, 2)
plt.subplots_adjust(wspace=0.4, hspace=0.4)

X0, X1 = X[:, 0], X[:, 1]
xx, yy = make_meshgrid(X0, X1)

for clf, title, ax in zip(models, titles, sub.flatten()):
    plot_contours(ax, clf, xx, yy,
                  cmap=plt.cm.coolwarm, alpha=0.8)
    ax.scatter(X0, X1, c=y, cmap=plt.cm.coolwarm, s=20, edgecolors='k')
    ax.set_xlim(xx.min(), xx.max())
    ax.set_ylim(yy.min(), yy.max())
    ax.set_xlabel('Sepal length')
    ax.set_ylabel('Sepal width')
    ax.set_xticks(())
    ax.set_yticks(())
    ax.set_title(title)

plt.show()
plt.subplots_adjust(wspace=0.4, hspace=0.4)：調整子圖間距。（還可以調節上下左右）

zip(models, titles, sub.flatten())：

zip() 函式用於將可迭代的物件作為引數，將物件中對應的元素打包成一個個元組，然後返回由這些元組組成的列表。

sub.flatten()：

將陣列拉直成一維。

cmap=plt.cm.coolwarm

colormap設定。

【sklearn】SVM用於分類（SVC）

API說明：中文：http://sklearn.apachecn.org/cn/0.19.0/modules/svm.html 英文：https://scikit-learn.org/stable/modules/svm.html API使用：（SVC）（Su

【opencv、機器學習】opencv中的SVM影象分類（二）

上一篇博文對影象分類理論部分做了比較詳細的講解，這一篇主要是對影象分類程式碼的實現進行分析。理論部分我們談到了使用BOW模型，但是BOW模型如何構建以及整個步驟是怎麼樣的呢？可以參考下面的部落格http://www.cnblogs.com/yxy8023ustc/p/33

【opencv、機器學習】opencv中的SVM影象分類（一）

一、影象分類概述本模組是用在影象內容識別的部分，影象分類是利用計算機對影象進行定量分析，把影象中的每個像元或區域劃歸為若干個類別中的一種，以代替人工視覺判讀的技術。從目視角度來說，對影象進行提高對比度、增加視覺維數、進行空間濾波或變換等處理的目的就是使人們能夠憑藉知識

【PAT】B1012 數字分類（20 分）

數字 include sca pat ont 輸入 pri amp print #include<stdio.h> int arr[1005]; int main(){ int N,yu,A1,A2,flag2=1,A3,A4,A4a,A5,A5a=0;

【TP5】無極限分類（樹狀型）

author：咔咔 wechat：fangkangfk 這個用法只限於在一級和二級導航在一塊的情況，如果是分開的，就去看另一篇無極限分類 // 遞迴：選單分類顯示 public function levelList($table ='mvc_ca

【PAT】1012 數字分類（20 分）

1012 數字分類（20 分）給定一系列正整數，請按要求對數字進行分類，並輸出以下 5 個數字： A1 = 能被 5 整除的數字中所有偶數的和； A2 = 將被 5 除後餘 1 的數字按給出順序進行交錯求和，即計算&nb

【php】面向對象（一）

打電話成員方法駝峰命名 bject 內部自動正在自己 div 1. 學習面向對象的目標：　　a) 語法的學習：　　b) 編程思想的學習：　　　　i. 過程化：　　　　ii. 面向對象：2. 比較（有對象和沒對象的區別）　　a) 沒對象：　　　　i. 我餓了自己

【php】面向對象（五）

row 操作類面向對象 ssa getline var pre span 錯誤信息一、類型約束：　　a) 約束函數可傳入的參數類型二、類的遍歷　　a) Foreach　　b) 可以將類當中的所有成員屬性遍歷出來三、關於操作類與對象的一些函數：　　a) 判斷函數　　

【php】面向對象（三）

lamp1 變量步驟 efi 第一個面向對象我們 ati 單例知識點關鍵詞：FSCICATS一、 f => final：　　a) 是一個修飾符，用來修飾類和成員方法　　b) 使用final修飾符修飾的類不能被繼承，使用final修飾符修飾的成員方法，不能被重寫

Android自己定義組件系列【6】——進階實踐（3）

err ack XML @+ layout apk get ast edi 上一篇《Android自己定義組件系列【5】——進階實踐（2）》繼續對任老師的《可下拉的PinnedHeaderExpandableListView的實現》進行了分析，這一篇計劃中間插一段“知識點

Android自己定義組件系列【5】——進階實踐（2）

col fonts tle 適配 pack tom ica void log 上一篇《Android自己定義組件系列【5】——進階實踐（1）》中對任老師的《可下拉的PinnedHeaderExpandableListView的實現》前一部分進行了實現，這一篇我們來看看Ex

Python自動化開發課堂筆記【Day06】 - Python進階（類）

擴展性程序 lex 類名人物優點 ini 參數 self. 類與對象面向過程的程序設計：　　優點：極大的降低了程序的復雜度　　缺點：一套流水線或者流程就是用來解決一個問題，生產汽水的流水線無法生產汽車，即使能，也是得大改，改一個組件，牽一發而動全身面向對象的程序設計

【原創】淺談webview（一）——驚鴻一瞥

版本開發 spa 占用混合原創大量功能性內存泄漏眾所周知，APP開發過程中經常會通過webview實現HTML5(H5)的渲染，實現H5和Native的混合開發(Hybrid Development)。Hybrid Development可以加速

luogu_3379 【模板】最近公共祖先（LCA）

span oid ont return mes ace print next using #include<bits/stdc++.h>using namespace std;#define N 500010*2struct edge{int v,next;}

【轉】Nodejs學習筆記（一）--- 簡介及安裝Node.js開發環境

ack 目錄 javascrip 難度時間網站開發 clas jetbrains 常用目錄學習資料簡介安裝Node.js npm簡介開發工具 Sublime Node.js開發環境配置擴展：安裝多版本管理器學習資料　　1.深入淺出Node.j

【二】遺傳算法（GA）的MATLAB實現

tool view ima baidu ges matlab實現編程 from 函數調用 essay from：https://wenku.baidu.com/view/ce45bbf44693daef5ef73df3.html 一、MATLAB編程實現GA

P3391 【模板】文藝平衡樹（Splay）

spa 標題 -s gets 需要 () 序列代碼輸入題目背景這是一道經典的Splay模板題——文藝平衡樹。題目描述您需要寫一種數據結構（可參考題目標題），來維護一個有序數列，其中需要提供以下操作：翻轉一個區間，例如原有序序列是5 4 3 2 1，翻轉區間是[2

【轉載】CSS3之Clip（裁剪）拓展閱讀

很多 fix 以及 flow script stat browser hid 一定的 Clip屬性是大家經常會誤解的一個屬性，這篇文章幫助大家充分的了解和學習clip屬性，用這個屬性制作出更好的效果。我可以確定Clip屬性有很多同學並不知道，因為這個屬性使用率非常的底，我

【51nod1519】拆方塊[Codeforces]（dp）

mes str time get view space return .com sed 　　題目傳送門：1519 拆方塊　　首先，我們可以發現，如果第i堆方塊被消除，只有三種情況：　　1、第i-1堆方塊全部被消除；　　2、第i+1堆方塊全部被消除；（因為兩側的方塊能夠

【bfs】奇怪的電梯（P1135）

site 而且 empty ans 整數 print bsp size col 題目描述呵呵，有一天我做了一個夢，夢見了一種很奇怪的電梯。大樓的每一層樓都可以停電梯，而且第i層樓(1<=i<=N)上有一個數字Ki(0<=Ki<=N)。電梯只有四個

【sklearn】SVM用於分類（SVC）

相關推薦