深度學習之LSTM實現

阿新 • • 發佈：2019-01-10

LSTM之keras實現

import numpy as np
np.random.seed(2017)  #為了復現
from __future__ import print_function
from keras.datasets import mnist
from keras.utils import np_utils
from keras.models import Sequential
from keras.layers import LSTM, Activation, Dense
from keras.optimizers import Adam

(X_train, y_train), (X_test, y_test) = mnist.load_data()

#引數 

#學習率
learning_rate = 0.001 
#迭代次數
epochs = 2
#每塊訓練樣本數
batch_size = 128
#輸入
n_input = 28
#步長
n_step = 28
#LSTM Cell
n_hidden = 128
#類別
n_classes = 10

#x標準化到0-1  y使用one-hot  輸入 nxm的矩陣 每行m維切成n個輸入
X_train = X_train.reshape(-1, n_step, n_input)/255.
X_test = X_test.reshape(-1, n_step, n_input)/255.

y_train = np_utils.to_categorical(y_train, num_classes=10 
)
y_test = np_utils.to_categorical(y_test, num_classes=10)

model = Sequential()
model.add(LSTM(n_hidden,
               batch_input_shape=(None, n_step, n_input),
               unroll=True))

model.add(Dense(n_classes))
model.add(Activation('softmax'))

adam = Adam(lr=learning_rate)
#顯示模型細節
model.summary()
model.compile(optimizer=adam,
              loss='categorical_crossentropy' 
,
              metrics=['accuracy'])

model.fit(X_train, y_train,
          batch_size=batch_size,
          epochs=epochs,
          verbose=1, #0不顯示 1顯示
          validation_data=(X_test, y_test))

scores = model.evaluate(X_test, y_test, verbose=0)
print('LSTM test score:', scores[0]) #loss
print('LSTM test accuracy:', scores[1])

TensorFlow之LSTM

import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data

# set random seed for comparing the two result calculations
tf.set_random_seed(1)

# this is data
mnist = input_data.read_data_sets('MNIST_data', one_hot=True)

# hyperparameters
lr = 0.001
training_iters = 100000
batch_size = 128

n_inputs = 28   # MNIST data input (img shape: 28*28)
n_steps = 28    # time steps
n_hidden_units = 128   # neurons in hidden layer 隱藏神經元個數
n_classes = 10      # MNIST classes (0-9 digits)

# tf Graph input
x = tf.placeholder(tf.float32, [None, n_steps, n_inputs])
y = tf.placeholder(tf.float32, [None, n_classes])

# Define weights
weights = {
    # (28, 128)
    'in': tf.Variable(tf.random_normal([n_inputs, n_hidden_units])),
    # (128, 10)
    'out': tf.Variable(tf.random_normal([n_hidden_units, n_classes]))
}
biases = {
    # (128, )
    'in': tf.Variable(tf.constant(0.1, shape=[n_hidden_units, ])),
    # (10, )
    'out': tf.Variable(tf.constant(0.1, shape=[n_classes, ]))
}


def RNN(X, weights, biases):
    # hidden layer for input to cell
    ########################################

    # transpose the inputs shape from
    # X ==> (128 batch * 28 steps, 28 inputs)
    X = tf.reshape(X, [-1, n_inputs])

    # into hidden
    # X_in = (128 batch * 28 steps, 128 hidden)
    X_in = tf.matmul(X, weights['in']) + biases['in']
    # X_in ==> (128 batch, 28 steps, 128 hidden)
    X_in = tf.reshape(X_in, [-1, n_steps, n_hidden_units])

    # cell
    ##########################################

    # basic LSTM Cell.
    cell = tf.contrib.rnn.BasicLSTMCell(n_hidden_units)
    # lstm cell is divided into two parts (c_state, h_state)
    init_state = cell.zero_state(batch_size, dtype=tf.float32)

    # You have 2 options for following step.
    # 1: tf.nn.rnn(cell, inputs);
    # 2: tf.nn.dynamic_rnn(cell, inputs).
    # If use option 1, you have to modified the shape of X_in, go and check out this:
    # https://github.com/aymericdamien/TensorFlow-Examples/blob/master/examples/3_NeuralNetworks/recurrent_network.py
    # In here, we go for option 2.
    # dynamic_rnn receive Tensor (batch, steps, inputs) or (steps, batch, inputs) as X_in.
    # Make sure the time_major is changed accordingly.
    outputs, final_state = tf.nn.dynamic_rnn(cell, X_in, initial_state=init_state, time_major=False)

    # hidden layer for output as the final results
    #############################################
    # results = tf.matmul(final_state[1], weights['out']) + biases['out']

    # # or
    # unpack to list [(batch, outputs)..] * steps #交換維度
    outputs = tf.unstack(tf.transpose(outputs, [1,0,2]))
    results = tf.matmul(outputs[-1], weights['out']) + biases['out']    # shape = (128, 10)

    return results


pred = RNN(x, weights, biases)
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=pred, labels=y))
train_op = tf.train.AdamOptimizer(lr).minimize(cost)

correct_pred = tf.equal(tf.argmax(pred, 1), tf.argmax(y, 1))
accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))

with tf.Session() as sess:
    init = tf.global_variables_initializer()
    sess.run(init)
    step = 0
    while step * batch_size < training_iters:
        batch_xs, batch_ys = mnist.train.next_batch(batch_size)
        batch_xs = batch_xs.reshape([batch_size, n_steps, n_inputs])
        sess.run([train_op], feed_dict={
            x: batch_xs,
            y: batch_ys,
        })
        if step % 20 == 0:
            print(sess.run(accuracy, feed_dict={
            x: batch_xs,
            y: batch_ys,
            }))
        step += 1

深度學習之LSTM實現

LSTM之keras實現 import numpy as np np.random.seed(2017) #為了復現 from __future__ import print_function from keras.datasets impor

深度學習之CNN實現

CNN 實現 CNN相比與傳統神經網路，主要區別是引入了卷積層和池化層卷積是使用tf.nn.conv2d, 池化使用tf.nn.max_pool CNN之keras實現 import numpy as np np.random.seed(201

深度學習之LSTM時間序列預測

LSTM（long short-term memory,LSTM）:長短時記憶網路，是迴圈神經網路（recurrent neural network,RNN）的一個重要結構，迴圈神經的主要用途是處理和預測序列資料。全連線神經網路（感知機，BP神經網路，RBF 神經網路等）或卷

4.keras實現-->生成式深度學習之DeepDream

DeepDream是一種藝術性的影象修改技術，它用到了卷積神經網路學到的表示，DeepDream由Google於2015年釋出。這個演算法與卷積神經網路過濾器視覺化技術幾乎相同，都是反向執行一個卷積神經網路:對卷積神經網路的輸入做梯度上升，以便將卷積神經網路靠頂部的某一層的某個過濾器啟用最大化。但有以下幾個簡

深度學習之TensorFlow使用CNN測試Cifar-10資料集（Python實現）

題目描述： 1. 對Cifar-10影象資料集，用卷積神經網路進行分類，統計正確率。 2.選用Caffe, Tensorflow, Pytorch等開源深度學習框架之一，學會安裝這些框架並呼叫它們的介面。 3.直接採用這些深度學習框架針對Cifar-10資料集已訓練好的網路模型，只

深度學習之網路設計時優化【Dropout，Batch Normalization及其python實現】

一、Dropout 隨機失活是一種簡單但非常有效的神經網路訓練效果提升技巧，原理大概是它在一定程度上避免了某些特定特徵組合對訓練造成的負面影響。在正向傳播時隨機挑選一部分神經元失活。在反向傳播時梯度只流經沒有失活的神經元。圖1 使用Dropout的網路結構示意

深度學習之PyTorch —— CNN實現MNIST手寫數字分類

#　運用ＣＮＮ分析ＭＮＩＳＴ手寫數字分類 import torch import numpy as np from torch.utils.data import DataLoader from torchvision.datasets import mnist fro

深度學習之目標檢測object_detection程式碼實現

基於tensorflow的object_detection框架和slim框架，實現一個目標檢測系統：一：資料及準備 1.資料標註，使用labelImg對資料集進行標註，生成對應的xml檔案 2.使用create_pet_tf_record.py指令碼生成tfrec

深度學習之啟用函式（Python實現）

import matplotlib.pyplot as plt import numpy as np import tensorflow as tf from tensorflow.python.framework import ops ops.reset_defau

深度學習之卷積神經網路CNN及tensorflow程式碼實現示例詳細介紹

一、CNN的引入在人工的全連線神經網路中，每相鄰兩層之間的每個神經元之間都是有邊相連的。當輸入層的特徵維度變得很高時，這時全連線網路需要訓練的引數就會增大很多，計算速度就會變得很慢，例如一張黑白的 28×28 的手寫數字圖片，輸入層的神經元就有784個，如下圖所示：

深度學習之卷積神經網路CNN及tensorflow程式碼實現示例

一、CNN的引入在人工的全連線神經網路中，每相鄰兩層之間的每個神經元之間都是有邊相連的。當輸入層的特徵維度變得很高時，這時全連線網路需要訓練的引數就會增大很多，計算速度就會變得很慢，例如一張黑白的 28×28 的手寫數字圖片，輸入層的神經元就有784個，如下圖

深度學習之卷積神經網路程式設計實現（二）

void conv_bprop(Layer *layer, Layer *prev_layer, bool *pconnection) { int index = 0; int size = prev_layer->map_w * prev_layer->map_h; // delta

深度學習之影象分類模型AlexNet結構分析和tensorflow實現

在ImageNet上的影象分類challenge上，Hinton和他的學生Alex Krizhevsky提出的AlexNet網路結構模型贏得了2012屆的冠軍，重新整理了Image Classification的機率。因此，要研究CNN型別深度學習模型在影象分

深度學習之物體檢測——YOLO(二)_用作者提供的YOLO實現進行檢測

使用訓練好的YOLO進行檢測首先安裝Darknet git clone https://github.com/pjreddie/darknet cd darknet make 下載預訓練得到的權重檔案 YOLO的配置檔案在./cfg/資料夾

深度學習之物體檢測——YOLO(三)_PyTorch實現

過程構建26層網路作者採用GoogLeNet作為網路結構，但是並不使用inception模組，而是採用1x1和3x3大小的濾波器進行替代。具體的網路結構請參考部落格：深度學習之物體檢測——YOLO(一)_介紹。計算損失 YOLO模型的損失函

文字挖掘深度學習之word2vec的R語言實現

筆者寄語：2013年末，Google釋出的 word2vec工具引起了一幫人的熱捧，大家幾乎都認為它是深度學習在自然語言領域的一項了不起的應用，各種歡呼“深度學習在自然語言領域開始發力了”。基於word2vec現在還出現了doc2vec，word2vec相比傳統，考慮單

Tensorflow深度學習之二十一：LeNet的實現（CIFAR-10資料集）

一、LeNet的簡介 LeNet是一個用來識別手寫數字的最經典的卷積神經網路，是Yann LeCun在1998年設計並提出的。Lenet的網路結構規模較小，但包含了卷積層、池化層、全連線層，他們都構成了現代CNN的基本元件。 LeNet包含輸入層在內共有

Tensorflow深度學習之二十二：AlexNet的實現（CIFAR-10資料集）

二、工程結構由於我自己訓練的機器記憶體視訊記憶體不足，不能一次性讀取10000張圖片，因此，在這之前我按照圖片的類別，將每一張圖片都提取了出來，儲存成了jpg格式。與此同時，在儲存圖片的過程中，儲存了一個python的dict結構，鍵為每一張圖片的相對地

深度學習之圖片語義分割程式碼實現

使用tensorflow和python，vgg基礎上實現FCN8s網路，實現圖片語義分割：資料集：VOC2012/ImageSets/Segmentation中，分為train.txt 1464張圖片和val.txt1449張圖片。 # class classes

深度學習之收斂問題

bat 模擬訓練 gin i-o 都是 wid 分類 number http://blog.csdn.net/xlbryant/article/details/48470987 1.數據庫太小一般不會帶來不收斂的問題，只要你一直在train總會收斂（rp問題跑飛了不算）。

深度學習之LSTM實現

LSTM之keras實現

TensorFlow之LSTM

相關推薦