利用線性函式實現鳶尾花資料集分類

阿新 • • 發佈：2019-02-11

在空間中，我們定義分類的線性函式為： $g(x)=w^{T}x+b$
其中樣本 $x=(x_{1},x_{2},...,x_{l})^{T}$ ，權向量 $w=(w_{1},w_{2},...,w_{l})^{T}$ ,偏移量是 $b$ 。
在這裡插入圖片描述
上圖展示了權向量和樣本的關係，由公式： $\cos{<w,x_{i}>}=\frac{w \cdot x_{i}}{\left \| w \right \|\left \| x_{i}\right \|}$

cos < w, x_{i} > = ∥ w ∥ ∥ x _{i} ∥ w \cdot x _{i}

可得到

x_{i}

到

w

方向上投影為：

\cos{&lt;w,x_{i}&gt;\left \| x_{i}\right \|}=\frac{w \cdot x_{i}}{\left \| w \right \|}

分類的超平面（hyperplane）方程為

g(x)=\bm{w}^{T}\bm{x}+b=0

此時所有在超平面上的樣本到

w

方向上的投影長度為:

\frac{|\bm{w}^{T}\bm{x}|}{||\bm{w}||}=\frac{|-\bm{w}_{0}| }{\left \| \bm{w} \right \|}

因為投影是垂直的，所以超平面與權向量

w

垂直。
推導樣本到超平面的距離：
在這裡插入圖片描述

取任意一點超平面右側的

\bm{x}

，

\bm{x}_{p}

為

\bm{x}

在超平面上的投影，

z

為投影：

\bm{w^{T}x_{p}}+b=0\\ z=\frac{\bm{w}^{T}(x-x_{p})}{||\bm{w}||}=\frac{\bm{w}^{T}\bm{x}+b}{||\bm{w}||}

同理，設

\bm{x}

在超平面左側，

\bm{x}_{p}

為

\bm{x}

在超平面上的投影，

z

為投影：

z=\frac{\bm{w}^{T}(x_{p}-x)}{||\bm{w}||}=\frac{-(\bm{w}^{T}\bm{x}+b)}{||\bm{w}||}

\bm{x}

到超平面的距離為:

|z|=\frac{|\pm(\bm{w}^{T}x+b)|}{||\bm{w}||}=\frac{|g(\bm{x})|}{||\bm{w}||}

g(\bm{x})=\bm{w}^{T}\bm{x}+b=||\bm{w}||z

線性分類函式

g(x)

刻畫了樣本與超平面之間的距離。

從鳶尾花資料集中挑選山鳶尾(iris-Setosa)和變色鳶尾(iris-Versicolor) 兩種花的資訊作為測試資料。出於視覺化的原因，只考慮資料集中萼片長度(sepla length)和花瓣長度(petal length)這兩個特徵。

import pandas as pd
df = pd.read_csv(r'http://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data')
df.tail()

5.1	3.5	1.4	0.2	Iris-setosa
144	6.7	3.0	5.2	2.3	Iris-virginica
145	6.3	2.5	5.0	1.9	Iris-virginica
146	6.5	3.0	5.2	2.0	Iris-virginica
147	6.2	3.4	5.4	2.3	Iris-virginica
148	5.9	3.0	5.1	1.8	Iris-virginica

y = df.iloc[0:99, 4].values
y

import numpy as np
import matplotlib.pyplot as plt
y = np.where(y == 'Iris-setosa', -1, 1)
x = df.iloc[0: 99, [0, 2]].values
plt.scatter(x[:49, 0], x[:49, 1], color='red', marker='o', label='setosa')
plt.scatter(x[49:99, 0], x[49: 99, 1], color='blue', marker='x', label='versicolor')
plt.xlabel('petal length')
plt.ylabel('sepal length')
plt.legend(loc='upper left')
plt.show()

這裡寫圖片描述

這裡需要定義出一條線性迴歸線用於分類，需要再圖中定義分類的線性函式：
權值向量為 $w= \begin{bmatrix} w_{0}\\ w_{1}\\ w_{2} \end{bmatrix}$ , $x= \begin{bmatrix} 1\\ x_{1}\\ x_{2} \end{bmatrix}$ $z=w_{0}+x_{1}w_{1}+x_{2}w_{2}=w^{T}x$
標籤判定函式：
$\phi (z)=\left\{\begin{matrix} 1, z\geq 0 \\ -1, z<0 \end{matrix}\right.$

誤差函式：
$J(w)=\frac{1}{2n}\sum_{i}(y^{i}-z^{i})^{2}$
求解偏導數：
$\frac{\partial J (w)}{\partial w_{j}} = \frac{1}{2 n} \sum$

利用線性函式實現鳶尾花資料集分類

利用線性函式實現鳶尾花資料集分類

分類問題（一）：SVM(Python——基於skearn實現鳶尾花資料集分類)

實現鳶尾花資料集分類

人工智慧深度學習TensorFlow通過感知器實現鳶尾花資料集分類

利用softmax函式對mnist資料集簡單分類

XGBoost實現對鳶尾花資料集分類預測

TensorFlow之神經網路簡單實現MNIST資料集分類

TensorFlow之卷積神經網路(CNN)實現MNIST資料集分類

神經網路實現Mnist資料集簡單分類

利用 sklearn SVM 分類器對 IRIS 資料集分類

決策樹分類鳶尾花資料集

Logistics迴歸分類鳶尾花資料集

【阿里2017】利用分片線性模型實現大規模資料點選率預估

[Keras深度學習淺嘗]實戰三·CNN實現Fashion MNIST 資料集分類

[Keras深度學習淺嘗]實戰四· Embedding實現 IMDB資料集影評文字分類

[Keras深度學習淺嘗]實戰二·CNN實現Fashion MNIST 資料集分類

[Keras深度學習淺嘗]實戰一·DNN實現Fashion MNIST 資料集分類

【python資料探勘課程】十九.鳶尾花資料集視覺化、線性迴歸、決策樹花樣分析

Python 3實現k-鄰近演算法以及 iris 資料集分類應用

樸素貝葉斯對鳶尾花資料集進行分類

利用線性函式實現鳶尾花資料集分類

相關推薦