LSTM模型簡介及Tensorflow實現

阿新 • • 發佈：2019-01-31

LSTM模型在RNN模型的基礎上新增加了單元狀態C(cell state)。

一. 模型的輸入和輸出

在t時刻，LSTM的輸入有3個：
(1) 當前時刻LSTM的輸入值x(t);
(2) 上一時刻LSTM的輸出值h(t-1);
(3) 上一時刻的單元狀態c(t-1);

LSTM的輸出有2個：
(1) 當前時刻LSTM的輸出值h(t)；
(2) 當前時刻的單元狀態c(t)；

二. 模型的計算

這裡寫圖片描述

(1) 遺忘門：forget gate，控制上一時刻的單元狀態有多少傳入：

這裡寫圖片描述

(2) 輸入門：input gate，控制上一時刻LSTM的輸出有多少傳入：

這裡寫圖片描述

(3) 當前時刻輸入的單元狀態：

這裡寫圖片描述

(4) 當前時刻LSTM的單元狀態：

這裡寫圖片描述

(5) 輸出門：output gate，控制有多少傳入到LSTM當前時刻的輸出：

這裡寫圖片描述

(6) 當前時刻LSTM的輸出：

這裡寫圖片描述

note：公式中的X表示對應元素相乘；

三. TensorFlow實現LSTM-regression模型

# load module
from tensorflow.example.tutorial.mmist import input_data
import tensorflow as tf
import numpy as np

# definite hyperparameters
BATCH_SIZE = 64 

TIME_STEP = 28
INPUT_SIZE = 28
LR = 0.01

# load data
mnist = input_data.read_data_sets('mnist', one_hot=True)

# test data
test_x = mnist.test.images[:2000]
test_y = mnist.test.labels[:2000]

# placeholder
tf_x = tf.placeholder(tf.float32, [None, TIME_STEP * INPUT_SIZE])
image = tf.reshape(tf_x, [-1, TIME_STEP, INPUT_SIZE])
tf_y = tf.placeholder(tf.int32, [None 
, 10])

# RNN
rnn_cell = tf.contrib.rnn.BasicLSTMCell(num_units=64)
outputs, (h_c, h_n) = tf.nn.dynamic_rnn(rnn_cell, image, dtype=tf.float32)
loss = tf.losses.softmax_cross_entropy(onehot_labels=tf_y, logits=output)
train_op = tf.train.AdamOptimizer(LR).minimize(loss)
accuracy = tf.metrics.accuracy(labels=tf.argmax(tf_y, axis=1), predictions=tf.argmax(output, axis=1),)[1]

# open an tf session
sess = tf.Session()
init_op = tf.group(tf.global_variables_initializer(), tf.local_variables_initializer())
sess.run(init_op)

# train
for step in range(1200):
    b_x, b_y = mnist.train.next_batch(BATCH_SIZE)
    _, loss_ = sess.run([train_op, loss], {tf_x: b_x, tf_y: b_y})
    if step % 50 == 0:
        accuracy_ = sess.run(accuracy, {tf_x: test_x, tf_y: test_y})
        print('train loss: %.4f' % loss_, '| test accuracy: %.2f' % accuracy_)

test_output = sess.run(output, {tf_x: test_x[: 10]})
pred_y = np.argmax(test_output, 1)
print(pred_y, 'prediction_number')
print(np.argmax(test_y[: 10], 1), 'real number')

四. 參考

LSTM模型簡介及Tensorflow實現

LSTM模型在RNN模型的基礎上新增加了單元狀態C(cell state)。一. 模型的輸入和輸出在t時刻，LSTM的輸入有3個： (1) 當前時刻LSTM的輸入值x(t); (2) 上一時刻LSTM的輸出值h(t-1); (3) 上一時刻的單

深度學習模型的優化演算法及tensorflow實現

模型的優化對於傳統機器學習和深度學習都是很重要的，尤其是深度學習，在訓練過中很可能需要解決一些更加困難的挑戰。目前來說，流行且使用較廣泛的優化演算法有隨機梯度下降，具動量的隨機梯度下降，RMSProp演算法，具動量的RMSProp，AdaDelta和Adam等，

原始GAN論文筆記及TensorFlow實現

Welcome To My Blog 引言在GAN誕生之前,比起生成模型而言,判別模型更受關注,比如Alex Net,VGG,Google Net,因為典型的生成模型往往具有原理複雜,推導複雜,實現複雜的特點對於生成模型而言,通常有兩種建模方式

[資料結構]Trie簡介及Python實現

Trie簡介及Python實現 Trie簡介 Python實現 Trie簡介 Trie即字首樹或字典樹，利用字串公共字首降低搜尋時間。速度為 O

交叉熵損失函式及Tensorflow實現

一、交叉熵損失原理一般情況下，在分類任務中，神經網路最後一個輸出層的節點個數與分類任務的標籤數相等。假設最後的節點數為N，那麼對於每一個樣例，神經網路可以得到一個N維的陣列作為輸出結果，陣列中每一個維度會對應一個類別。在最理想的情況下，如果一個樣本屬於k，那麼這個類別所對應的第k個輸出節

Bi-LSTM的理解以及 Tensorflow實現

Bidirectional LSTM，由兩個LSTMs上下疊加在一起組成。輸出由這兩個LSTMs的隱藏層的狀態決定。 def bilstm(self,x): # 輸入的資料格式轉換 # x.shape [batch_size, time_

AES簡介及原始碼實現(C)

AES簡介及原始碼實現© 本blog的目的僅僅是記錄一個AES原理及其C程式碼實現，轉載自：https://blog.csdn.net/qq_28205153/article/details/55798628 感謝分享。高階加密標準(AES,Advanced Encr

AVL樹簡介及Java實現

AVL樹簡介 AVL樹是被最先發明的一種較為簡單的平衡二叉查詢樹。它的特點是： 1.本身首先是一棵二叉查詢樹。 2.帶有平衡條件：每個結點的左右子樹的高度之差的絕對值（平衡因子LoadFactor）最多為1。（設根結點的高度為1）上面的兩張圖片，左邊的是AV

李航統計學習方法之樸素貝葉斯法（含python及tensorflow實現）

樸素貝葉斯法樸素貝葉斯法數學表示式後驗概率最大化的含義樸素貝葉斯是一個生成模型。有一個強假設：條件獨立性。我們先看下樸素貝葉斯法的思想，然後看下條件獨立性具體數學表示式是什麼樣的。

AlexNet原理及Tensorflow實現

AlexNet的出現點燃了深度學習的熱潮,下面對其進行介紹,並使用tensorflow實現. 1. AlexNet網路結構圖片來源:AlexNet的論文整個網路有8個需要訓練的層,前5個為卷積層,最後3層為全連線層. 第一個卷積層輸入的

VGGNet原理及Tensorflow實現

VGGNet是常用的網路，通常可以直接拿來用，或者可以將前面的層拿出進行fine-tune，用於訓練我們自己的模型，同時vgg的官方對訓練的引數進行了開源，便於進行transfer-learning.

粒子群優化演算法（PSO）簡介及MATLAB實現

目錄粒子群優化演算法概述 • 粒子群優化(PSO, particle swarm optimization)演算法是計算智慧領域，除了蟻群演算法，魚群演算法之外的一種群體智慧的優化演算法，該演算法最早由Kennedy和Eberhart在1995年提出的，

LeNet-5 神經網路模型分析及其 TensorFlow 實現

一、LeNet-5 簡介 LeNet-5 是 Yann Lecun 於1998提出的神經網路架構，更是卷積神經網路的開山鼻祖，雖然該網路模型僅有 7 層神經網路結構，但在 MNIST 資料集上的識別精度高達 99.2%，是卷積神經網路首次在數字影象識別領域的成功運用。但是需要說明

目標檢測之YoloV1論文及tensorflow實現

You Only Look Once: Unified, Real-Time Object Detection Abstract 作者提出了一種新的物體檢測方法YOLO。YOLO之前的物體檢測方法主要是通過region proposal產生大量的可能包含待檢測物體的 po

信用評分卡（A卡/B卡/C卡）的模型簡介及開發流程｜乾貨

如今在銀行、消費金融公司等各種貸款業務機構，普遍使用信用評分，對客戶實行打分制，以期對客戶有一個優質與否的評判。但是不是所有人都知道信用評分卡還分A,B,C卡三類！ A卡（Application score card）申請評分卡 B卡（Behavior score car

【深度學習】谷歌deepdream原理及tensorflow實現

什麼是DeepDream？ DeepDream是谷歌釋出的對卷積神經網路（CNN）進行視覺化的方法，當然它的用途不僅限於此，我們可以通過它讓機器“做夢”，以下是一些效果：可以看到計算機將自然影象的

deeplabcv2 的 Atrous Convolution(帶孔卷機核)，感受野，及tensorflow實現crf的一點理解。

首先是因為做影象分割，所以使用deeplab。思想基本和fcn一樣。先卷機提取特徵，然後闊尺寸至原影象大小。普通fcn先把影象padding至很大（據說是邊緣補100個0），然後一層層下來，pool （stride＝2）或者是卷機（ stride＝2）5次，影象縮小了32

風格遷移背後原理及tensorflow實現

前言本文分為以下部分：第一節：深度學習在風格遷移上的背後原理；第二節：風格遷移的程式碼詳解第三節：總結影象風格遷移指的是將影象A的風格轉換到影象B中去，得到新的影象，取個名字為new B，其中new B中既包含影象B的內容，也包含

自編碼器（AutoEncoder）入門及TensorFlow實現

自編碼器（Autoencoder,AE）,是一種利用反向傳播演算法使得輸出值等於輸入值的神經網路，它先將輸入壓縮成潛在空間表徵，然後通過這種表徵來重構輸出。自編碼器由兩部分組成：編碼器（encoder）:這部分能將輸入壓縮成潛在空間表徵，可以用編碼函式h=f(x)表示。解碼器

TensorFlow 實現基於LSTM的語言模型

一、LSTM的相關概念部落格上有很多講解的很好的博主，我看的是這個博主的關於LSTM的介紹，感覺很全面，如果對LSTM原理不太明白的，可以點選這個連結。LSTM相關概念，這裡就不多做介紹了哈！二、GRU介紹這裡為什麼要介紹下GRU呢！因為在RNN的各種變種中，除了LSTM，另

LSTM模型簡介及Tensorflow實現

一. 模型的輸入和輸出

二. 模型的計算

三. TensorFlow實現LSTM-regression模型

四. 參考

相關推薦