LSTM對MNIST資料集做分類

阿新 • • 發佈：2019-01-14

https://morvanzhou.github.io/tutorials/machine-learning/tensorflow/5-08-RNN2/

1.設定 RNN 的引數

RNN 從每張圖片的第一行畫素讀到最後一行, 然後再進行分類判斷.

（1）匯入 MNIST 資料並確定 RNN 的各種引數

下載地址: http://yann.lecun.com/exdb/mnist/
在這裡插入圖片描述

import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
tf.set_random_seed(1)   # set random seed

# 匯入資料
mnist = input_data.read_data_sets('MNIST_data', one_hot=True)

# hyperparameters
lr = 0.001                  # learning rate
training_iters = 100000     # train step 上限
batch_size = 128
n_inputs = 28               # MNIST data input (img shape: 28*28)
n_steps = 28                # time steps
n_hidden_units = 128        # neurons in hidden layer
n_classes = 10              # MNIST classes (0-9 digits)

（2）定義 x, y 的 placeholder 和 weights, biases 的初始狀況

x = tf.placeholder(tf.float32, [None, n_steps, n_inputs])
y = tf.placeholder(tf.float32, [None, n_classes])

weights = {
    # shape (28, 128)
    'in': tf.Variable(tf.random_normal([n_inputs, n_hidden_units])),
    # shape (128, 10)
    'out': tf.Variable(tf.random_normal([n_hidden_units, n_classes]))
        }
biases = {
    # shape (128, )
    'in': tf.Variable(tf.constant(0.1, shape=[n_hidden_units, ])),
    # shape (10, )
    'out': tf.Variable(tf.constant(0.1, shape=[n_classes, ]))
        }

2.定義 RNN 的主體結構

RNN 總共有 3 個組成部分 ( input_layer, cell, output_layer)

 # （1）input_layer
def RNN(X, weights, biases):
    # 原始的 X 是 3 維資料, 我們需要把它變成 2 維資料才能使用 weights 的矩陣乘法
    # X ==> (128 batches * 28 steps, 28 inputs)
    X = tf.reshape(X, [-1, n_inputs])

    # X_in = W*X + b
    X_in = tf.matmul(X, weights['in']) + biases['in']
    # X_in ==> (128 batches, 28 steps, 128 hidden) 換回3維
    X_in = tf.reshape(X_in, [-1, n_steps, n_hidden_units])

    # （2）cell
    # 使用 basic LSTM Cell.
    lstm_cell = tf.nn.rnn_cell.BasicLSTMCell(n_hidden_units, forget_bias=1.0, state_is_tuple=True)
    init_state = lstm_cell.zero_state(batch_size, dtype=tf.float32) # 初始化全零 state

    # （3）output_layer
    outputs, states = tf.nn.dynamic_rnn(lstm_cell, X_in, initial_state=init_state, time_major=False)
    results = tf.matmul(states[1], weights['out']) + biases['out']
    return results

3.計算 cost 和 train_op

pred = RNN(x, weights, biases)
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=pred, labels=y))
train_op = tf.train.AdamOptimizer(lr).minimize(cost)

4.訓練 RNN

correct_pred = tf.equal(tf.argmax(pred, 1), tf.argmax(y, 1))
accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))
init = tf.initialize_all_variables()

with tf.Session() as sess:
    sess.run(init)
    step = 0
    while step * batch_size < training_iters:
        batch_xs, batch_ys = mnist.train.next_batch(batch_size)
        batch_xs = batch_xs.reshape([batch_size, n_steps, n_inputs])
        sess.run([train_op], feed_dict={
            x: batch_xs,
            y: batch_ys,
        })
        if step % 20 == 0:
            print(sess.run(accuracy, feed_dict={
            x: batch_xs,
            y: batch_ys,
        }))
        step += 1

5.結果展示

0.265625
0.7265625
0.828125
0.8828125
0.84375
0.859375
0.8984375
0.890625
0.84375
0.90625
0.921875
0.90625
0.9140625
0.9140625
0.9375
0.9609375
0.953125
0.921875
0.9453125
0.96875
0.9375
0.9609375
0.890625
0.984375
0.953125
0.953125
0.9453125
0.9453125
0.96875
0.9375
0.953125
0.96875
0.9375
0.9921875
0.9609375
0.9609375
0.953125
0.9609375
0.96875
0.96875

Process finished with exit code 0

視訊詳細教學: https://www.bilibili.com/video/av16001891/?p=33

LSTM對MNIST資料集做分類

https://morvanzhou.github.io/tutorials/machine-learning/tensorflow/5-08-RNN2/ 1.設定 RNN 的引數 RNN 從每張圖片的第一行畫素讀到最後一行, 然後再進行分類判斷. （1）匯入 MN

深度學習入門專案：用keras構建CNN或LSTM對minist資料集做簡單分類任務

深度學習入門專案：用keras構建CNN或LSTM或RNN對Minist資料集做簡單分類任務參考keras中文文件 ——keras：是一個高階神經網路庫，用 Python 語言寫成，可以執行在 TensorFlow 或者 Theano 之上（即以此為後端）。

Tensorflow學習教程------利用卷積神經網路對mnist資料集進行分類_利用訓練好的模型進行分類

#coding:utf-8 import tensorflow as tf from PIL import Image,ImageFilter from tensorflow.examples.tutorials.mnist import input_data def imageprepare(ar

keras RNN、LSTM對IMDB資料集進行分類

本文介紹如何基於keras採用RNN和LSTM對IMDB資料集進行分類。示例程式碼： from keras.layers import SimpleRNN from keras.models import Sequential from keras.layers import Embedd

利用softmax函式對mnist資料集簡單分類

mnist資料集的特點每一張圖片包含28**28個畫素，我們把這一個陣列展開成一個向量，長度是28*28=784。因此在 MNIST訓練資料集中mnist.train.images 是一個形狀為 [60000, 784] 的張量，第一個維度數字用來索引圖片

TensorFlow深度學習實戰（一）：AlexNet對MNIST資料集進行分類

概要進來一段時間在看深度學習中經典的CNN模型相關論文。同時，為了督促自己學習TensorFlow，通讀論文之後開始，利用TensorFlow實現各個模型，復現相關實驗。這是第一篇論文講解的是AlexNet，論文下載網址為：ImageNet Classific

深度學習入門教程UFLDL學習實驗筆記二：使用向量化對MNIST資料集做稀疏自編碼

今天來做UFLDL的第二個實驗，向量化。我們都知道，在matlab裡面基本上如果使用for迴圈，程式是會慢的一逼的（可以說基本就執行不下去）所以在這呢，我們需要對程式進行向量化的處理，所謂向量化就是將matlab裡面所有的for迴圈用矩陣運算的方法實現，在這裡呢，因為之前的實驗我已經是按照向量化的形式編寫的程

Tensorflow（五）使用CNN對MNIST資料集進行分類

在tensorflow（二）中對MNIST資料集進行分類使用單層神經網路，梯度下降法以0.2的學習因子迭代了100次取得了92%的準確率，這個網路很簡單，使用較大的學習因子也不會出現梯度爆炸或者梯度消失的情況，但是在複雜些的網路，比如這裡用到的三層CNN網路使用0.2的學習因

R語言對MNIST資料集分析：探索手寫數字分類

資料科學和機器學習之間區別的定義：資料科學專注於提取洞察力，而機器學習對預測有興趣。我還注意到這兩個領域大相徑庭：我在我的工作中同時使用了機器學習和資料科學：我可能會使用堆疊溢位流量資料的模型來確定哪些使用者可能正在尋找工作（機器學習），但是會構建摘要和視覺化來檢查為什麼（資

tensorflow實現LSTM進行MNIST資料集分類

大大的部落格講得很詳細，先拿過來分享一下：http://blog.csdn.net/jerr__y/article/details/61195257 自己組合的第一部分程式碼： import sys reload(sys) sys.setdefaultencoding('

神經網路實現Mnist資料集簡單分類

本文針對mnist手寫數字集，搭建了四層簡單的神經網路進行圖片的分類，詳細心得記錄下來分享我是採用的TensorFlow框架進行的訓練 import tensorflow as tf from tensorflow.examples.tutorials.mnist import in

Bobo老師機器學習筆記第七課-使用PCA對MNIST資料集進行降噪

問題1：什麼是MNIST資料集？ MNIST 資料集來自美國國家標準與技術研究所, National Institute of Standards and Technology (NIST). 訓練集 (training set) 由來自 250 個不同人手寫的數字構成

[PyTorch小試牛刀]實戰三·DNN實現邏輯迴歸對FashionMNIST資料集進行分類

[PyTorch小試牛刀]實戰三·DNN實現邏輯迴歸對FashionMNIST資料集進行分類內容還包括了網路模型引數的保存於載入。資料集下載地址程式碼部分 import torch as t import torchvision as tv import numpy as n

使用libsvm對MNIST資料集進行實驗

svm_type c_svc kernel_type linear 使用線性分類器 nr_class 2二分類 total_sv 15支援向量個數 rho 0.307309 label 1 -1 nr_sv 8 7正負類的支援向量（SV）個數 SV 1 1:7.213038 2:0.198066 1 1:-