TensorFlow HOWTO 4.1 多層感知機（分類）

阿新 • • 發佈：2018-12-28

4.1 多層感知機（分類）

這篇文章開始就是深度學習了。多層感知機的架構是這樣：

輸入層除了提供資料之外，不幹任何事情。隱層和輸出層的每個節點都計算一次線性變換，並應用非線性啟用函式。隱層的啟用函式是壓縮性質的函式。輸出層的啟用函式取決於標籤的取值範圍。

其本質上相當於廣義線性迴歸模型的整合。

操作步驟

匯入所需的包。

import tensorflow as tf
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
import sklearn.datasets as 
 ds
import sklearn.model_selection as ms

匯入資料，並進行預處理。我們使用鳶尾花資料集所有樣本。根據萼片長度和花瓣長度預測樣本是不是雜色鳶尾（第二種）。要注意雜色鳶尾在另外兩種之間，所以它不是線性問題。

iris = ds.load_iris()

x_ = iris.data[:, [0, 2]]
y_ = (iris.target == 1).astype(int)
y_ = np.expand_dims(y_ , 1)


x_train, x_test, y_train, y_test = \
    ms.train_test_split( 
x_, y_, train_size=0.7, test_size=0.3)

定義超引數。

變數	含義
`n_input`	樣本特徵數
`n_epoch`	迭代數
`n_hidden1`	隱層 1 的單元數
`n_hidden2`	隱層 2 的單元數
`lr`	學習率
`threshold`	如果輸出超過這個概率，將樣本判定為正樣本

n_input = 2
n_hidden1 = 4
n_hidden2 = 4
n_epoch = 2000
lr = 0.05
threshold = 0.5

搭建模型。要注意隱層的啟用函式使用了目前暫時最優的 ELU。由於這個是二分類問題，輸出層啟用函式只能是 Sigmoid。

變數	含義
`x`	輸入
`y`	真實標籤
`w_l{1,2,3}`	第`{1,2,3}`層的權重
`b_l{1,2,3}`	第`{1,2,3}`層的偏置
`z_l{1,2,3}`	第`{1,2,3}`層的中間變數，前一層輸出的線性變換
`a_l{1,2,3}`	第`{1,2,3}`層的輸出，其中`a_l3`樣本是正樣本的概率

x = tf.placeholder(tf.float64, [None, n_input])
y = tf.placeholder(tf.float64, [None, 1])
w_l1 = tf.Variable(np.random.rand(n_input, n_hidden1))
b_l1 = tf.Variable(np.random.rand(1, n_hidden1))
w_l2 = tf.Variable(np.random.rand(n_hidden1, n_hidden2))
b_l2 = tf.Variable(np.random.rand(1, n_hidden2))
w_l3 = tf.Variable(np.random.rand(n_hidden2, 1))
b_l3 = tf.Variable(np.random.rand(1, 1))
z_l1 = x @ w_l1 + b_l1
a_l1 = tf.nn.elu(z_l1)
z_l2 = a_l1 @ w_l2 + b_l2
a_l2 = tf.nn.elu(z_l2)
z_l3 = a_l2 @ w_l3 + b_l3
a_l3 = tf.sigmoid(z_l3)

定義交叉熵損失、優化操作、和準確率度量指標。

變數	含義
`loss`	損失
`op`	優化操作
`y_hat`	標籤的預測值
`acc`	準確率

loss = - tf.reduce_mean(y * tf.log(a_l3) + (1 - y) * tf.log(1 - a_l3))
op = tf.train.AdamOptimizer(lr).minimize(loss)

y_hat = tf.to_double(a_l3 > threshold)
acc = tf.reduce_mean(tf.to_double(tf.equal(y_hat, y)))

使用訓練集訓練模型。

losses = []
accs = []

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    
    for e in range(n_epoch):
        _, loss_ = sess.run([op, loss], feed_dict={x: x_train, y: y_train})
        losses.append(loss_)

使用測試集計算準確率。

        acc_ = sess.run(acc, feed_dict={x: x_test, y: y_test})
        accs.append(acc_)

每一百步列印損失和度量值。

        if e % 100 == 0:
            print(f'epoch: {e}, loss: {loss_}, acc: {acc_}')

得到決策邊界：

    x_plt = x_[:, 0]
    y_plt = x_[:, 1]
    c_plt = y_.ravel()
    x_min = x_plt.min() - 1
    x_max = x_plt.max() + 1
    y_min = y_plt.min() - 1
    y_max = y_plt.max() + 1
    x_rng = np.arange(x_min, x_max, 0.05)
    y_rng = np.arange(y_min, y_max, 0.05)
    x_rng, y_rng = np.meshgrid(x_rng, y_rng)
    model_input = np.asarray([x_rng.ravel(), y_rng.ravel()]).T
    model_output = sess.run(y_hat, feed_dict={x: model_input}).astype(int)
    c_rng = model_output.reshape(x_rng.shape)

輸出：

epoch: 0, loss: 8.951598255929909, acc: 0.28888888888888886
epoch: 100, loss: 0.5002945631529941, acc: 0.7333333333333333
epoch: 200, loss: 0.10712651780120697, acc: 0.9333333333333333
epoch: 300, loss: 0.08321807852608396, acc: 0.9333333333333333
epoch: 400, loss: 0.08013835031876741, acc: 0.9333333333333333
epoch: 500, loss: 0.07905186419367002, acc: 0.9333333333333333
epoch: 600, loss: 0.07850865683940819, acc: 0.9333333333333333
epoch: 700, loss: 0.07808251016428093, acc: 0.9333333333333333
epoch: 800, loss: 0.07780712763974691, acc: 0.9333333333333333
epoch: 900, loss: 0.07759866398922599, acc: 0.9333333333333333
epoch: 1000, loss: 0.07744327666591566, acc: 0.9333333333333333
epoch: 1100, loss: 0.07731295774932465, acc: 0.9333333333333333
epoch: 1200, loss: 0.07721162022836371, acc: 0.9333333333333333
epoch: 1300, loss: 0.07712807776857629, acc: 0.9333333333333333
epoch: 1400, loss: 0.07735547120278226, acc: 0.9333333333333333
epoch: 1500, loss: 0.07700215794853897, acc: 0.9333333333333333
epoch: 1600, loss: 0.07695230759382654, acc: 0.9333333333333333
epoch: 1700, loss: 0.07690933782097598, acc: 0.9333333333333333
epoch: 1800, loss: 0.07687191279304387, acc: 0.9333333333333333
epoch: 1900, loss: 0.07683911419647445, acc: 0.9333333333333333

繪製整個資料集以及決策邊界。

plt.figure()
cmap = mpl.colors.ListedColormap(['r', 'b'])
plt.scatter(x_plt, y_plt, c=c_plt, cmap=cmap)
plt.contourf(x_rng, y_rng, c_rng, alpha=0.2, linewidth=5, cmap=cmap)
plt.title('Data and Model')
plt.xlabel('Petal Length (cm)')
plt.ylabel('Sepal Length (cm)')
plt.show()

繪製訓練集上的損失。

plt.figure()
plt.plot(losses)
plt.title('Loss on Training Set')
plt.xlabel('#epoch')
plt.ylabel('Cross Entropy')
plt.show()

繪製測試集上的準確率。

plt.figure()
plt.plot(accs)
plt.title('Accurary on Testing Set')
plt.xlabel('#epoch')
plt.ylabel('Accurary')
plt.show()

擴充套件閱讀

TensorFlow HOWTO 4.1 多層感知機（分類）

4.1 多層感知機（分類）這篇文章開始就是深度學習了。多層感知機的架構是這樣：輸入層除了提供資料之外，不幹任何事情。隱層和輸出層的每個節點都計算一次線性變換，並應用非線性啟用函式。隱層的啟用函式是壓縮性質的函式。輸出層的啟用函式取決於標籤的取值範圍。其本質上相當於

TensorFlow HOWTO 4.2 多層感知機迴歸（時間序列）

4.2 多層感知機迴歸（時間序列）這篇教程中，我們使用多層感知機來預測時間序列，這是迴歸問題。操作步驟匯入所需的包。 import tensorflow as tf import numpy as np import pandas as pd import matp

Deep learning with Theano 官方中文教程（翻譯）（三）——多層感知機（MLP）

供大家相互交流和學習，本人水平有限，若有各種大小錯誤，還請巨牛大牛小牛微牛們立馬拍磚，這樣才能共同進步！若引用譯文請註明出處http://www.cnblogs.com/charleshuang/。下面。http://deeplearning.net/tutorial/mlp.html#mlp 的中

多層感知機（MLP）演算法原理及Spark MLlib呼叫例項（Scala/Java/Python）

多層感知機演算法簡介：多層感知機是基於反向人工神經網路（feedforwardartificial neural network）。多層感知機含有多層節點，每層節點與網路的下一層節點完全連線。輸入層的節點代表輸入資料，其他層的節點通過將輸入資料與層上節點

深度學習基礎（二）—— 從多層感知機（MLP）到卷積神經網路（CNN）

經典的多層感知機（Multi-Layer Perceptron）形式上是全連線（fully-connected）的鄰接網路（adjacent network）。 That is, every neuron in the network is connec

深度學習筆記二：多層感知機（MLP）與神經網路結構

為了儘量能形成系統的體系，作為最基本的入門的知識，請參考一下之前的兩篇部落格：神經網路(一):概念神經網路(二):感知機上面的兩篇部落格讓你形成對於神經網路最感性的理解。有些看不懂的直接忽略就行，最基本的符號的記法應該要會。後面會用到一這兩篇部落格中

MLlib--多層感知機（MLP）演算法原理及Spark MLlib呼叫例項（Scala/Java/Python）

來源：http://blog.csdn.net/liulingyuan6/article/details/53432429 多層感知機演算法簡介：多層感知機是基於反向人工神經網路（feedforwardartificial neural net

多層感知機（MLP）

　　最終還是沒有憋住，寫下了這篇博文，最近真的是感慨很多啊，真的很想找個人說說。還有那麼多的東西要看要學。　　最近一直在搞神經網路方面的東西，看了MLP的講解，但都是講解結構，我就是想知道MLP到底

Keras簡單實現多層感知機（MLP）程式碼

import keras from keras.model import Sequential from keras.layers import Dense,Dropout from keras.op

TensorFlow學習筆記（4）--實現多層感知機（MNIST資料集）

前面使用TensorFlow實現一個完整的Softmax Regression，並在MNIST資料及上取得了約92%的正確率。現在建含一個隱層的神經網路模型（多層感知機）。 import tensorflow as tf import numpy as np

[keras]1.多層感知機實現

“` 創建於星期二星期六14:42:13 2018 @author：yuyangyg“”“＃baseline MLP for mnist dataset import numpy from keras.datasets import mnist from ke

TensorFlow上實現MLP多層感知機模型

一、多層感知機簡介 Softmax迴歸可以算是多分類問題logistic迴歸，它和神經網路的最大區別是沒有隱含層。理論上只要隱含節點足夠多，即時只有一個隱含層的神經網路也可以擬合任意函式，同時隱含層越多，越容易擬合複雜結構。為了擬合複雜函式需要的隱含節點的數目，基本上隨著隱

用pytorch實現多層感知機（MLP)（全連線神經網路FC）分類MNIST手寫數字體的識別

1.匯入必備的包 1 import torch 2 import numpy as np 3 from torchvision.datasets import mnist 4 from torch import nn 5 from torch.autograd import Variable 6

gluon 實現多層感知機MLP分類FashionMNIST

from mxnet import gluon,init from mxnet.gluon import loss as gloss, nn from mxnet.gluon import data as gdata from mxnet import nd,autograd import gl

多層感知機（Multilayer Perceptron）

在本節中，假設你已經瞭解了使用邏輯迴歸進行MNIST分類。同時本節的所有程式碼可以在這裡下載. 下一個我們將在Theano中使用的結構是單隱層的多層感知機（MLP）。MLP可以被看作一個邏輯迴歸分類器。這個中間層被稱為隱藏層。一個單隱層對於MLP成為通用近似器

MLP多層感知機（人工神經網路）原理及程式碼實現

一、多層感知機（MLP）原理簡介多層感知機（MLP，Multilayer Perceptron）也叫人工神經網路（ANN，Artificial Neural Network），除了輸入輸出層，它中間可以有多個隱層，最簡單的MLP只含一個隱層，即三層的結構，如下圖：從上圖可以看

【TensorFlow】TensorFlow 的多層感知器（MLP）

前面有幾篇博文講了使用 TensorFlow 實現線性迴歸和邏輯斯蒂迴歸，這次來說下多層感知器（Multi-Layer Perceptron）的 TensorFlow 實現。本篇博文的程式碼及結果圖片等可以在這裡下載，裡面包含TensorFlow的實現和sk

神經網路/多層感知器（MLP）架構：選擇隱藏層數量和大小的標準

隱藏層個數：一個零隱藏層的模型可以解決線性可分資料。所以除非你早知道你的資料線性不可分，證明它也沒什麼壞處—為什麼使用比任務需求更困難的模型？如果它是線性可分的那麼一個更簡單的技術可以工作，感知器也可以。假設您的資料確實需要通過非線性技術進行分離，則始終

TensorFlow-多層感知機(MLP)

訓練感知 set equal () closed batch BE lac TensorFlow訓練神經網絡的4個步驟： 1、定義算法公式，即訓練神經網絡的forward時的計算 2、定義損失函數和選擇優化器來優化loss 3、訓練步驟 4、對模型進行準確率評測附Mul

tensorflow實現多層感知機進行手寫字識別

logits=multilayer_perceptron(X) #使用交叉熵損失 loss_op=tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=logits,labels=Y))

TensorFlow HOWTO 4.1 多層感知機（分類）

4.1 多層感知機（分類）

操作步驟

擴充套件閱讀

相關推薦