TensorFlow HOWTO 2.2 支援向量迴歸（軟間隔）

阿新 • • 發佈：2018-11-29

將上一節的假設改一改，模型就可以用於迴歸問題。

操作步驟

匯入所需的包。

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
import sklearn.datasets as ds
import sklearn.model_selection as ms

匯入資料，並進行預處理。我們使用鳶尾花資料集中的後兩個品種，根據萼片長度預測花瓣長度。

iris = ds.load_iris()

x_ = iris.data[50:, 0]
y_ = iris.data[50 
:, 2]
x_ = np.expand_dims(x_, 1)
y_ = np.expand_dims(y_, 1)

x_train, x_test, y_train, y_test = \
    ms.train_test_split(x_, y_, train_size=0.7, test_size=0.3)

定義所需超引數。

變數	含義
`n_input`	樣本特徵數
`n_epoch`	迭代數
`lr`	學習率
`eps`	支援邊界到決策邊界的函式距離
`lam`	L2 正則化函式

n_input = 1
n_epoch = 2000
lr = 0.05
eps = 0.5
lam = 0.05

搭建模型。

變數	含義
`x`	輸入
`y`	真實標籤
`w`	權重
`b`	偏置
`z`	輸出，也就是標籤預測值

x = tf.placeholder(tf.float64, [None, n_input])
y = tf.placeholder(tf.float64, [None, 1])
w = tf.Variable(np.random.rand(n_input, 1))
b = tf.Variable(np.random.rand(1, 1))
z = x @ w + b

定義損失、優化操作、和 R 方度量指標。

我們使用 Hinge 損失和 L2 的組合。和上一節相比，Hinge 需要改一改：

$mean(\max(|Z - Y| - \epsilon, 0))$

在迴歸問題中，模型約束相反，是樣本落在支援邊界內部，也就是 $|Z - Y| \le \epsilon$ 。我們仍然將其加到損失中，於是，對於滿足約束的點，損失為零。對於不滿足約束的點，損失為 $|Z - Y| - \epsilon$ 。這樣讓樣本儘可能到支援邊界之內。

L2 損失仍然用於最小化支援邊界的幾何距離，也就是 $\frac{2}{\|w\|}$ 。

變數	含義
`hinge_loss`	Hinge 損失
`l2_loss`	L2 損失
`loss`	總損失
`op`	優化操作
`y_mean`	`y`的均值
`r_sqr`	R 方值

hinge_loss = tf.reduce_mean(tf.maximum(tf.abs(z - y) - eps, 0))
l2_loss = lam * tf.reduce_sum(w ** 2)
loss = hinge_loss + l2_loss
op = tf.train.AdamOptimizer(lr).minimize(loss)

y_mean = tf.reduce_mean(y)
r_sqr = 1 - tf.reduce_sum((y - z) ** 2) / tf.reduce_sum((y - y_mean) ** 2)

使用訓練集訓練模型。

losses = []
r_sqrs = []

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    for e in range(n_epoch):
        _, loss_ = sess.run([op, loss], feed_dict={x: x_train, y: y_train})
        losses.append(loss_)

使用測試集計算 R 方。

        r_sqr_ = sess.run(r_sqr, feed_dict={x: x_test, y: y_test})
        r_sqrs.append(r_sqr_)

每一百步列印損失和度量值。

        if e % 100 == 0:
            print(f'epoch: {e}, loss: {loss_}, r_sqr: {r_sqr_}')

得到擬合直線：

    x_min = x_.min() - 1
    x_max = x_.max() + 1
    x_rng = np.arange(x_min, x_max, 0.1)
    x_rng = np.expand_dims(x_rng, 1)
    y_rng = sess.run(z, feed_dict={x: x_rng})

輸出：

epoch: 0, loss: 2.595811345519854, r_sqr: -7.63455623000992
epoch: 100, loss: 0.09490037816660063, r_sqr: 0.6870450579269822
epoch: 200, loss: 0.0945981212813202, r_sqr: 0.6919725995177556
epoch: 300, loss: 0.0943360378730447, r_sqr: 0.6972100379246203
epoch: 400, loss: 0.0942670608490176, r_sqr: 0.7011480891041979
epoch: 500, loss: 0.09420861968646403, r_sqr: 0.7023977527848786
epoch: 600, loss: 0.09420462812797847, r_sqr: 0.7033420189633286
epoch: 700, loss: 0.09420331500841268, r_sqr: 0.7040990336920706
epoch: 800, loss: 0.09420013554417629, r_sqr: 0.7049244708036546
epoch: 900, loss: 0.09419894883980164, r_sqr: 0.7058068427331468
epoch: 1000, loss: 0.09419596028573823, r_sqr: 0.7063798499792275
epoch: 1100, loss: 0.09439172532153575, r_sqr: 0.7082249152615245
epoch: 1200, loss: 0.0942860145903332, r_sqr: 0.7082847730551416
epoch: 1300, loss: 0.09419431250773326, r_sqr: 0.7085666625849087
epoch: 1400, loss: 0.09419430203474248, r_sqr: 0.7086043351158677
epoch: 1500, loss: 0.09419435727421285, r_sqr: 0.7085638764264852
epoch: 1600, loss: 0.09419436716550869, r_sqr: 0.7085578243219421
epoch: 1700, loss: 0.09422521775113285, r_sqr: 0.7085955861355715
epoch: 1800, loss: 0.09419408061180848, r_sqr: 0.709039512302889
epoch: 1900, loss: 0.09425026677323756, r_sqr: 0.7088910272655065

繪製整個資料集的預測結果以及支援邊界。

plt.figure()
plt.plot(x_, y_, 'b.', label='Data')
plt.plot(x_rng.ravel(), y_rng.ravel(), 'r', label='Model')
plt.plot(x_rng.ravel(), (y_rng + eps).ravel(), 'r--')
plt.plot(x_rng.ravel(), (y_rng - eps).ravel(), 'r--')
plt.title('Data and Model')
plt.legend()
plt.show()

繪製訓練集上的損失。

plt.figure()
plt.plot(losses)
plt.title('Loss on Training Set')
plt.xlabel('#epoch')
plt.ylabel('MSE')
plt.show()

繪製測試集上的 R 方。

plt.figure()
plt.plot(r_sqrs)
plt.title('$R^2$ on Testing Set')
plt.xlabel('#epoch')
plt.ylabel('$R^2$')
plt.show()

擴充套件閱讀

Wikipedia: Support vector machine

TensorFlow HOWTO 2.2 支援向量迴歸（軟間隔）

將上一節的假設改一改，模型就可以用於迴歸問題。操作步驟匯入所需的包。 import tensorflow as tf import numpy as np import matplotlib.pyplot as plt import sklearn.datasets as

TensorFlow HOWTO 2.1 支援向量分類（軟間隔）

在傳統機器學習方法，支援向量機算是比較厲害的方法，但是計算過程非常複雜。軟間隔支援向量機通過減弱了其約束，使計算變得簡單。操作步驟匯入所需的包。 import tensorflow as tf import numpy as np import matplotlib as

林軒田--機器學習技法--SVM筆記2--對偶支援向量機（dual+SVM）

對偶支援向量機咦？怎麼還有關於支援向量機的內容，我們不是在上一講已經將支援向量機解決了麼？怎麼又引入了對偶這個概念？ 1.動機我們在上一講已經講過，可以使用二次規劃來解決支援向量機的問題。如果現在想要解決非線性的支援向量機的問題，也很簡單，如下圖所

支援向量機2—線性支援向量機與軟間隔最大化

1、線性支援向量機線性可分問題的支援向量機學習方法，對線性不可分訓練資料是不適用的。因為這時上述方法中的不等式約束並不能都成立。這時就需要修改硬間隔最大化，使其成為軟間隔最大化。假設給定一個特徵空間上的訓練資料集T={（x1,y1），（x2,y2），...，（xN,yN）}，

機器學習----支援向量機（軟間隔與正則化）

Soft Margin 前面的假設一直都是線性可分，可是如果對所有樣本不能線性可分（比如有noisy）怎麼辦？或者過擬合怎麼辦？緩解該問題的一個方法就是允許支援向量機在一些樣本上出錯，為此引入軟間隔(soft margin)這個概念。即允許在一些樣本

TensorFlow HOWTO 2.3 支援向量分類（高斯核）

遇到非線性可分的資料集時，我們需要使用核方法，但為了使用核方法，我們需要返回到拉格朗日對偶的推導過程，不能簡單地使用 Hinge 損失。操作步驟匯入所需的包。 import tensorflow as tf import numpy as np import matplo

支援向量機（Python實現）

這篇文章是《機器學習實戰》（Machine Learning in Action）第六章支援向量機演算法的Python實現程式碼。 1 參考連結（1）支援向量機通俗導論(理解SVM的三層境界) （2）支援向量機—SMO論文詳解（序列最小最優化演算法） 2 實現程式

《機器學習》周志華學習筆記第六章支援向量機（課後習題）python 實現

一、 1.間隔與支援向量 2.對偶問題 3.核函式 xi與xj在特徵空間的內積等於他們在原始yangben空間中通過函式k(.,.)計算的結果。核矩陣K總是半正定的。 4.軟間隔與正則化軟間隔允許某些samples不滿足約束鬆弛變數 5.支援

TensorFlow HOWTO 5.1 迴圈神經網路（時間序列）

5.1 迴圈神經網路（時間序列）迴圈神經網路（RNN）用於建模帶有時間關係的資料。它的架構是這樣的。在最基本的 RNN 中，單元（方框）中的操作和全連線層沒什麼區別，都是線性變換和啟用。它完全可以看做多個全連線層的橫向擴充套件。但是運算元量多了之後，就會有梯度消失

詳解SVM系列（四）：線性支援向量機與軟間隔最大化

線性支援向量機線性可分問題的支援向量機學習方法，對線性不可分訓練資料是不適用的，因為這時上述方法的不等式約束並不能都成立。舉2個例子：如果沒有混入異常點，導致不能線性可分，則資料可以按上面的實線來做超平面分離的。這種情況雖然不是不可分的，但是由於其中的一個藍色點不滿足線性

機器學習筆記8-支援向量機（3/3）

機器學習筆記8-支援向量機（3/3） scikit-learn中的SVM函式機器學習庫scikit-learn中也集成了SVM的函式，可以方便的進行呼叫，可用來分類、迴歸和異常點檢測。支援向量機的優點有： i)在高維空間效果很好 ii)當維度數大於樣本點數時，效果仍然不錯 i

資料探勘十大演算法——支援向量機SVM（二）：線性支援向量機的軟間隔最大化模型

首先感謝“劉建平pinard”的淵博知識以及文中詳細準確的推導！！！支援向量機原理SVM系列文章共分為5部分：（一）線性支援向量機（二）線性支援向量機的軟間隔最大化模型（三）線性不可分支援向量機與核函式（四）SMO演算法原理（五）線性支援迴歸

十大經典預測演算法（四）----支援向量機（SVM演算法）

一、概念：SVM思想和線性迴歸很相似，兩個都是尋找一條最佳直線。不同點：最佳直線的定義方法不一樣，線性迴歸要求的是直線到各個點的距離最近，SVM要求的是直線離兩邊的點距離儘量大。 SVM本質，　　距離測度，即把點的座標轉換成點到幾個固定點的距離，從而實現升維。

【機器學習】支援向量機（4）——非線性支援向量機（核函式）

前言當訓練資料集線性可分或者近似線性可分時，前面我們在文一以及文二已經介紹了線性可分支援向量機和線性支援向量機。但是有時訓練資料集是非線性的，這時就可以使用非線性支援向量機。非線性支援向量機的主要特點就是利用了核技巧。非線性分類問題如

機器學習----支援向量機（核函式）

#線性不可分我們的SVM是找到一條分割直線，但是如果線性不可分怎麼辦？如下圖：可以看出，是有一個明顯的分割線的，但是不是直線，這種情況下我們怎麼用SVM呢？我們可以找到一種變化，讓變換後的資料線性可分，用圖形象的表示為：圖中的ϕ就是我們

(3).支援向量機SVM——軟間隔最大化公式手寫詳細推導

線性可分問題的支援向量機學習方法，對線性不可分訓練資料是不適應的，因為這時上一節中不等式約束不能成立，如何擴充套件到線性不可分問題呢？這就需要修改硬間隔最大化，使其成為軟間隔最大化。通常情況下訓練資料中有一些特異的點，將這些特異的點去處後，剩下的樣本組成的集合是線性可分的。線性不可分的意思

SVM支援向量機原理(二) 線性支援向量機的軟間隔最大化模型

在支援向量機原理(一) 線性支援向量機中，我們對線性可分SVM的模型和損失函式優化做了總結。最後我們提到了有時候不能線性可分的原因是線性資料集裡面多了少量的異常點，由於這些異常點導致了資料集不能線性可分，本篇就對線性支援向量機如何處理這些異常點的原理方法做一個總結。 1

TensorFlow HOWTO 4.2 多層感知機迴歸（時間序列）

4.2 多層感知機迴歸（時間序列）這篇教程中，我們使用多層感知機來預測時間序列，這是迴歸問題。操作步驟匯入所需的包。 import tensorflow as tf import numpy as np import pandas as pd import matp

邏輯迴歸（LR）和支援向量機（SVM）的區別和聯絡

1. 前言在機器學習的分類問題領域中，有兩個平分秋色的演算法，就是邏輯迴歸和支援向量機，這兩個演算法個有千秋，在不同的問題中有不同的表現效果，下面我們就對它們的區別和聯絡做一個簡單的總結。 2. LR和SVM的聯絡都是監督的分類演算法。都是線性分類方法 (不考慮核函式時）。都是判別

SVM系列理論（十） SVR支援向量迴歸

1 敏感度損失函式 2 支援向量迴歸模型的匯出 3 對偶形式的匯出 4 KKT條件匯出支援向量 5 KKT條件匯出b的值

TensorFlow HOWTO 2.2 支援向量迴歸（軟間隔）

操作步驟

擴充套件閱讀

相關推薦