TensorFlow HOWTO 2.3 支援向量分類（高斯核）

阿新 • • 發佈：2018-12-03

遇到非線性可分的資料集時，我們需要使用核方法，但為了使用核方法，我們需要返回到拉格朗日對偶的推導過程，不能簡單地使用 Hinge 損失。

操作步驟

匯入所需的包。

import tensorflow as tf
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
import sklearn.datasets as ds
import sklearn.model_selection as ms

為了展示非線性可分的資料集，我們需要把它創建出來。依舊把標籤變成 1 和 -1，原標籤為 0 的樣本標籤為 1。

circles = ds.make_circles(n_samples=500, factor=0.5, noise=0.1)

x_ = circles[0]
y_ = (circles[1] == 0).astype(int)
y_[y_ == 0] = -1
y_ = np.expand_dims(y_ , 1)
x_train_, x_test_, y_train_, y_test_ = \
    ms.train_test_split(x_, y_, train_size=0.7, test_size=0.3

定義超引數。

變數	含義
`n_batch`	樣本批量大小
`n_input`	樣本特徵數
`n_epoch`	迭代數
`lr`	學習率
`gamma`	高斯核係數

n_batch = len(x_train_)
n_input = 2
n_epoch = 2000
lr = 0.05
gamma = 10

搭建模型。首先定義佔位符（資料）和變數（模型引數）。

由於模型引數a和樣本x是對應的，不像之前的w, b

那樣和類別對應，所以需要傳入批量大小。並且在預測時，也需要訓練集，所以在計算圖中，要把訓練集和測試集分開。

變數	含義
`x_train`	輸入，訓練集的特徵
`y_train`	訓練集的真實標籤
`a`	模型引數

x_train = tf.placeholder(tf.float64, [n_batch, n_input])
y_train =  tf.placeholder(tf.float64, [n_batch, 1])
a = tf.Variable(np.random.rand(n_batch, 1))

定義高斯核。由於高斯核函式是個相對獨立，又反覆呼叫的東西，把它寫成函式抽象出來。

它的定義是這樣的： $\exp(- \gamma \|x - y\|^2)$ ，x和y是兩個向量。

但在這裡，我們要為兩個矩陣的每一行計算這個函式，用了一些小技巧。（待補充）

def rbf_kernel(x, y, gamma):
    x_3d_i = tf.expand_dims(x, 1)
    y_3d_j = tf.expand_dims(y, 0)
    kernel = tf.reduce_sum((x_3d_i - y_3d_j) ** 2, 2)
    kernel = tf.exp(- gamma * kernel)
    return kernel

kernel = rbf_kernel(x_train, x_train, gamma)

定義損失。我們使用的損失為：

$\frac{1}{n} \big(\sum_{i,j}a_i a_j y^{(i)}y^{(j)}K(x^{(i)},x^{(j)}) - \sum_i a_i \big)$

這個公式的來歷請見擴充套件閱讀的第一個連結。

變數	含義
`loss`	損失
`op`	優化操作

a_cross = a * tf.transpose(a)
y_cross = y_train * tf.transpose(y_train)
loss = tf.reduce_sum(a_cross * y_cross * kernel)
loss -= tf.reduce_sum(a)
loss /= n_batch
op = tf.train.AdamOptimizer(lr).minimize(loss)

定義度量指標。我們在測試集上計算它，為此，我們在計算圖中定義測試集。

變數	含義
`x_test`	測試集的特徵
`y_test`	測試集的真實標籤
`y_hat`	標籤的預測值

x_test = tf.placeholder(tf.float64, [None, n_input])
y_test = tf.placeholder(tf.float64, [None, 1])
kernel_pred = rbf_kernel(x_train, x_test, gamma)
y_hat = tf.transpose(kernel_pred) @ (y_train * a)
y_hat = tf.sign(y_hat - tf.reduce_mean(y_hat))
acc = tf.reduce_mean(tf.to_double(tf.equal(y_hat, y_test)))

使用訓練集訓練模型。

losses = []
accs = []

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    
    for e in range(n_epoch):
        _, loss_ = sess.run([op, loss], feed_dict={x_train: x_train_, y_train: y_train_})
        losses.append(loss_)

使用訓練集和測試集計算準確率。

        acc_ = sess.run(acc, feed_dict={x_train: x_train_, y_train: y_train_, x_test: x_test_, y_test: y_test_})
        accs.append(acc_)

每一百步列印損失和度量值。

        if e % 100 == 0:
            print(f'epoch: {e}, loss: {loss_}, acc: {acc_}')

得到決策邊界：

    x_plt = x_[:, 0]
    y_plt = x_[:, 1]
    c_plt = y_.ravel()
    x_min = x_plt.min() - 1
    x_max = x_plt.max() + 1
    y_min = y_plt.min() - 1
    y_max = y_plt.max() + 1
    x_rng = np.arange(x_min, x_max, 0.05)
    y_rng = np.arange(y_min, y_max, 0.05)
    x_rng, y_rng = np.meshgrid(x_rng, y_rng)
    model_input = np.asarray([x_rng.ravel(), y_rng.ravel()]).T
    model_output = sess.run(y_hat, feed_dict={x_train: x_train_, y_train: y_train_, x_test: model_input}).astype(int)
    c_rng = model_output.reshape(x_rng.shape)

輸出：

epoch: 0, loss: 3.71520431509184, acc: 0.9666666666666667
epoch: 100, loss: -0.0727806862453766, acc: 0.9733333333333334
epoch: 200, loss: -0.1344057865226747, acc: 0.9666666666666667
epoch: 300, loss: -0.19954100171678735, acc: 0.9666666666666667
epoch: 400, loss: -0.26744944765154044, acc: 0.9666666666666667
epoch: 500, loss: -0.3376130527328746, acc: 0.9666666666666667
epoch: 600, loss: -0.40968204759135396, acc: 0.9666666666666667
epoch: 700, loss: -0.48337264821214987, acc: 0.9666666666666667
epoch: 800, loss: -0.5584322960888252, acc: 0.9666666666666667
epoch: 900, loss: -0.634641530183908, acc: 0.9666666666666667
epoch: 1000, loss: -0.7118203254530981, acc: 0.9666666666666667
epoch: 1100, loss: -0.7898283716352298, acc: 0.9666666666666667
epoch: 1200, loss: -0.8685602440121085, acc: 0.9666666666666667
epoch: 1300, loss: -0.9479390005125, acc: 0.9666666666666667
epoch: 1400, loss: -1.02791046598349, acc: 0.9666666666666667
epoch: 1500, loss: -1.1084388930145652, acc: 0.9666666666666667
epoch: 1600, loss: -1.1895038125649773, acc: 0.9666666666666667
epoch: 1700, loss: -1.2710975807209766, acc: 0.9666666666666667
epoch: 1800, loss: -1.3532232661574393, acc: 0.9666666666666667
epoch: 1900, loss: -1.4358926633795104, acc: 0.9733333333333334

繪製整個資料集以及決策邊界。

plt.figure()
cmap = mpl.colors.ListedColormap(['r', 'b'])
plt.scatter(x_plt, y_plt, c=c_plt, cmap=cmap)
plt.contourf(x_rng, y_rng, c_rng, alpha=0.2, linewidth=5, cmap=cmap)
plt.title('Data and Model')
plt.xlabel('x')
plt.ylabel('y')
plt.show()

繪製訓練集上的損失。

plt.figure()
plt.plot(losses)
plt.title('Loss on Training Set')
plt.xlabel('#epoch')
plt.ylabel('SVM Loss')
plt.show()

繪製測試集上的準確率。

plt.figure()
plt.plot(accs)
plt.title('Accurary on Testing Set')
plt.xlabel('#epoch')
plt.ylabel('Accurary')
plt.show()

擴充套件閱讀

TensorFlow HOWTO 2.3 支援向量分類（高斯核）

遇到非線性可分的資料集時，我們需要使用核方法，但為了使用核方法，我們需要返回到拉格朗日對偶的推導過程，不能簡單地使用 Hinge 損失。操作步驟匯入所需的包。 import tensorflow as tf import numpy as np import matplo

TensorFlow HOWTO 2.1 支援向量分類（軟間隔）

在傳統機器學習方法，支援向量機算是比較厲害的方法，但是計算過程非常複雜。軟間隔支援向量機通過減弱了其約束，使計算變得簡單。操作步驟匯入所需的包。 import tensorflow as tf import numpy as np import matplotlib as

3.支援向量機（SVM）演算法(上）

SVM 1.基本概念支援向量機（Support Vector Machine, SVM）的基本模型是在特徵空間上找到最佳的分離超平面使得訓練集上正負樣本間隔最大。SVM是用來解決二分類問題的有監督學習演算法，在引入了核方法之後SVM也可以用來解決非線性問題。一般SVM有下面三

3. 支援向量機（SVM）核函式

1. 前言之前介紹了SVM的原理和SVM的軟間隔，它們已經可以很好的解決有異常點的線性迴歸問題，但是如果本身是非線性的問題，目前來看SVM還是無法很好的解決的。所以本文介紹SVM的核函式技術，能夠順利的解決非線性的問題。 2. 多項式迴歸在線性迴歸一節中我們有介紹線性迴歸解決非線性的一個方法就是多項

林軒田--機器學習技法--SVM筆記2--對偶支援向量機（dual+SVM）

對偶支援向量機咦？怎麼還有關於支援向量機的內容，我們不是在上一講已經將支援向量機解決了麼？怎麼又引入了對偶這個概念？ 1.動機我們在上一講已經講過，可以使用二次規劃來解決支援向量機的問題。如果現在想要解決非線性的支援向量機的問題，也很簡單，如下圖所

51Nod1010 只包含因子2 3 5的數（打表+ lower_bound）

lower_bound這個函式挺好用的。 #include<iostream> #include<algorithm> #include<cstring> using namespace std; typedef long long ll; c

支援向量機（support vector machine）（一）：線性可分SVM

總結一下，不然過段時間就全忘了，加油~ 1、問題描述假設，存在兩類資料A，B，如圖1所示，A中資料對應於圖中的實心點，B中資料對應圖中的空心點，現在我們需要得到一條直線，能夠將二者進行區分，這樣的線存在無數條，如圖1中的黑色直線所示，這些線都能夠

支援向量機（support vector machine）（二）：線性SVM

通常情況下，存在以下兩種情況： 1、分類完全正確的超平面不一定是最好的； 2、樣本資料不是線性可分的；如圖1所示，如果按照完全分對這個準則來劃分時，L1為最優分割超平面，但是實際情況如果按照L2來進行劃分，效果可能會更好，分類結果會更加魯棒。

機器學習總結（三）：SVM支援向量機（面試必考）

基本思想：試圖尋找一個超平面來對樣本分割，把樣本中的正例和反例用超平面分開，並儘可能的使正例和反例之間的間隔最大。演算法推導過程：（1）代價函式：假設正類樣本y =wTx+ b>=+1,負

關於tp3.2.3檔案匯入資料庫（去除重複資料）、寫日誌和下載問題

假設我們有一個student.csv檔案和一個student庫，現在要將student.csv檔案匯入資料庫。1.關於去掉重複資料匯入資料庫的基本思路（1）首先我們將student資料庫裡的學號（no）取出來，放在$arrNo數組裡。（2）然後，

淺談支援向量機（Support Vector Machine）

自從在學校安定下來後，小編的學習效率和時長提高了不少。在最近五天的時間裡，看了大約20節視訊並做了對應章節的程式設計練習。上一篇文章介紹了欠擬合和過擬合的知識，這次給小夥伴們介紹下支援向量機的知識。支援向量機和邏輯迴歸（Logistic Regression）很相像，從一方面

支援向量機（Support Vector machines）

本節主要是觀看Andrew Ng的斯坦福大學系列視訊CS299第6講、第7講等後，加上個人理解，對支援向量機部分做的一個筆記整理。本文順序是：綜述各個部分關係最大間隔分類器軟、硬間隔分類核函式 2 最大間隔分類器首先，我們應該知道求超

[完]機器學習實戰第六章支援向量機（Support Vector Machine）

[參考] 機器學習實戰（Machine Learning in Action）本章內容支援向量機（Support Vector Machine）是最好的現成的分類器，“現成”指的是分類器不加修改即可直接使用。基本形式的SVM分類器就可得到低錯

Tensorflow：實戰Google深度學習框架（高清版）PDF

Tensorflow：實戰Google深度學習框架（高清版）PDF百度網盤連結：https://pan.baidu.com/s/1GrKn451PECK0wupXcQDZ3g 提取碼：tw9k 複製這段內容後開啟百度網盤手機App，操作更方便哦哦內容簡介 · · · · · · TensorFlow是谷歌20