Tensorflow建立迴圈神經網路

阿新 • • 發佈：2018-12-02

雖然已經接觸deep learning很長一段時間了，也看了很久rnn相關的程式碼，但是突然想用tensorflow實現一些功能的時候，突然發現絲毫沒有頭緒，找了一些資料，學習了一波，記錄一下。

一、tensorflow實現RNN cell

tensorflow由於不同的版本改動較大，在1.0版本之後，可以使用如下語句來建立一個cell：
from tensorflow.contrib import rnn
cell_fun = rnn.GRUCell(rnn_hidden_size)

在tensorflow中，上述GRUCell的實現如下（可以在GitHub上看到原始碼）：

class GRUCell(RNNCell):
  """Gated Recurrent Unit cell (cf. http://arxiv.org/abs/1406.1078)."""

  def __init__(self, num_units, input_size=None, activation=tanh):
    if input_size is not None:
      logging.warn("%s: The input_size parameter is deprecated.", self)
    self._num_units = num_units
    self._activation = activation

  @property 

  def state_size(self):
    return self._num_units

  @property
  def output_size(self):
    return self._num_units

  def __call__(self, inputs, state, scope=None):
    """Gated recurrent unit (GRU) with nunits cells."""
    with vs.variable_scope(scope or "gru_cell"):
      with vs.variable_scope("gates" 
):  # Reset gate and update gate.
        # We start with bias of 1.0 to not reset and not update.
        r, u = array_ops.split(
            value=_linear(
                [inputs, state], 2 * self._num_units, True, 1.0, scope=scope),
            num_or_size_splits=2,
            axis=1)
        r, u = sigmoid(r), sigmoid(u)
      with vs.variable_scope("candidate"):
        c = self._activation(_linear([inputs, r * state],
                                     self._num_units, True,
                                     scope=scope))
      new_h = u * state + (1 - u) * c
    return new_h, new_h

注意到這裡面有一個call函式，這個函式表示的意思就是，把類的物件可以當做函式來使用，比如上面的GRUCell這個類有個物件gru，那麼我們可以直接使用 ’ gru(input, last_state) ‘；

其實一開始並不知道tensorflow中有這個，所以還自己寫了一個GRU的cell，僅供參考:

# -*- coding: utf-8 -*-
# @Last Modified    : 5/23/2017 1:56 PM
# @Author  : SummmerSnow
# @Description:

import tensorflow as tf

class GRU(object):

    def __init__(self, name, input_len, hidden_len):
        self.name = name
        self.input_len = input_len
        self.hidden_len = hidden_len

    def define_param(self):
        self.W = tf.Variable("_W", self.input_len, 3*self.hidden_len)
        self.U = tf.Variable("_U", self.hidden_len, 3*self.hidden_len)
        self.B = tf.Variable("_B", 3*self.hidden_len)

    def build_net(self, input_data, last_hidden):
        xW = tf.add(tf.matmul(input_data, self.W), self.B)
        hU = tf.matmul(last_hidden, self.U)
        xw1, xw2, xw3 = tf.split(xW, 3, 1)
        hu1, hu2, hu3 = tf.split(hU, 3, 1)
        r = tf.sigmoid(xw1 + hu1)
        z = tf.sigmoid(xw2 + hu2)
        h1 = tf.tanh(xw3, r*hu3)
        h = (h1 - last_hidden) * z + last_hidden

        return h

二、tensorflow建立RNN

上一章其實只是建立了一個rnncell，那麼問題就在於如何寫出一個迴圈的神經網路，loss如何計算。【注意，這裡這是在講述如何實現RNN，假設的是已經瞭解RNN的原理，如果對原理還是很懂，可以看相關資料】
幾種實現的方法：
[轉載自： http://www.what21.com/article/b_android_1491375010268.html]
在 tensorflow 中實現 LSTM 結構的迴圈神經網路的前向傳播過程，即使用 BasicLSTMCell：

# 定義一個 LSTM 結構，LSTM 中使用的變數會在該函式中自動被宣告
lstm = tf.contrib.rnn.BasicLSTMCell(lstm_hidden_size)

# 將 LSTM 中的狀態初始化為全 0 陣列，batch_size 給出一個 batch 的大小
state = lstm.zero_state(batch_size, tf.float32)

# 定義損失函式
loss = 0.0

# num_steps 表示最大的序列長度
for i in range(num_steps):
  # 在第一個時刻宣告 LSTM 結構中使用的變數，在之後的時刻都需要服用之前定義好的變數
  if i>0:
    tf.get_variable_scope().reuse_variables()
  # 每一步處理時間序列中的一個時刻。將當前輸入（current_input）和前一時刻狀態（state）傳入定義的 LSTM 結構就可以得到當前 LSTM 結構的輸出 lstm_output 和更新後的狀態 state
  lstm_output, state = lstm(current_input, state)

  # 將當前時刻 LSTM 結構的輸出傳入一個全連線層得到最後的輸出
  final_output = fully_connected(lstm_output)

  # 計算當前時刻輸出的損失
  loss += calc_loss(final_output, expected_output)

在 tensorflow中實現雙向RNN（BiRNN），使用 MultiRNNCell：

lstm = tf.contrib.rnn.BasicLSTMCell(lstm_hidden_size)
# 使用 MultiRNNCell 類實現深層迴圈網路中每一個時刻的前向傳播過程，number_of_layers 表示有多少層
stacked_lstm = tf.contrib.rnn.MultiRNNCell([lstm] * number_of_layers)

state = stacked_lstm.zero_state(batch_size, tf.float32)

for i in range(len(num_steps)):
  if i>0:
    tf.get_variable_scope().reuse_variables()
  stacked_lstm_output, state = stacked_lstm(current_input, state)
  final_output = fully_connected(stacked_lstm_output)
  loss += calc_loss(final_output, expected_output)

迴圈神經網路 RNN 中的 dropout，使用 DropoutWrapper：

# 定義 LSTM 結構
lstm = tf.contrib.rnn.BasicLSTMCell(lstm_hidden_size)

# 使用 DropoutWrapper 類來實現 dropout 功能，input_keep_prob 控制輸出的 dropout 概率
dropout_lstm = tf.contrib.rnn.DropoutWrapper(lstm, input_keep_prob=0.5)

stacked_lstm = tf.contrib.rnn.MultiRNNCell([dropout_lstm] * number_of_layers)

上面是自定義實現的方法，其實還可以使用tf.nn自定義的實現方法：
tf.nn.dynamic(), 具體使用方法：

Tensorflow建立迴圈神經網路

雖然已經接觸deep learning很長一段時間了，也看了很久rnn相關的程式碼，但是突然想用tensorflow實現一些功能的時候，突然發現絲毫沒有頭緒，找了一些資料，學習了一波，記錄一下。一、tensorflow實現RNN cell tensorflow由於不同的版本改動較大

TensorFlow-RNN迴圈神經網路 Example 2：文字情感分析

TensorFlow-RNN文字情感分析 Step 1 資料處理 import numpy as np # 讀取資料 with open('reviews.txt', 'r') as f: reviews = f.read() wi

TensorFlow從入門到理解（四）：你的第一個迴圈神經網路RNN（分類例子）

執行程式碼： import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data # set random seed for comparing the two result calculations

TensorFlow從入門到理解（五）：你的第一個迴圈神經網路RNN（迴歸例子）

執行程式碼： import tensorflow as tf import numpy as np import matplotlib.pyplot as plt BATCH_START = 0 TIME_STEPS = 20 BATCH_SIZE = 50 INPUT_SIZE = 1 OUTP

tensorflow基本教程10：RNN迴圈神經網路對於手寫體識別預測

import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data #this is data mnist=input_data.read_data_sets("MNIST_data",one_

迴圈神經網路系列（三）Tensorflow中MultiRNNCell

迴圈神經網路系列（一) Tensorflow中BasicRNNCell 迴圈神經網路系列（二）Tensorflow中dynamic_rnn 經過前面兩篇博文，我們介紹瞭如何定義一個RNN單元，以及用dynamic_rnn來對其在時間維度（橫軸）上展開。我們今天要介紹的就是如何疊加多層

迴圈神經網路系列（二）Tensorflow中dynamic_rnn

1.回顧上一篇博文(迴圈神經網路系列（一)Tensorflow中BasicRNNCell)中我們介紹了在Tensoflow中，每個RNN單元的實現，以及對應各個引數的含義。自那之後，我們就能通過Tensorflow實現一個單元的計算了。 import tensorflow as

迴圈神經網路系列（一）Tensorflow中BasicRNNCell

按道理看完RNN的原理之後，我們就應該來用某種框架來實現了。可偏偏在RNN的實現上，對於一個初學者來說Tensorflow的表達總是顯得那麼生澀難懂，比起CNN那確實是差了一點。比如裡面的引數就顯示不是那麼的友好。num_units到底指啥？原諒我最開始以為指的是RNN單元的個數。zer

莫煩python|Tensorflow筆記--什麼是迴圈神經網路RNN

我們在想象現在有一組資料序列，Data0，Data1,Data2,Data3，預測Results0的時候基於Data0，同意在預測其他結果的時候也是基於其他的數字。每次使用的神經網路都是同一個NN。如果這些資料是有關聯順序的，那麼就要遵從它們之間的順序，否則就串位了。但是

迴圈神經網路系列（七）Tensorflow中ConvLSTMCell

前面一文我們簡單得介紹了ConvLSTM得原理和應用場景，現在來看看在Tensorflow它具體是如何實現得。值得一說得是Tensorflow在實現這個演算法得時候並沒有使用peepholes，即下面的紅色部分，而是基於原始的LSTM網路結構改變的。不過在最後，我也會給出一個仿照

迴圈神經網路系列（五）Tensorflow中BasicLSTMCell

1.結論照慣例，先上結論，再說過程，不想看過程的可直接略過。從這個圖我們可以知道，一個LSTM cell中有4個引數，並且形狀都是一樣的shape=[output_size+n,output_size],其中n表示輸入張量的維度,output_size

TensorFlow HOWTO 5.1 迴圈神經網路（時間序列）

5.1 迴圈神經網路（時間序列）迴圈神經網路（RNN）用於建模帶有時間關係的資料。它的架構是這樣的。在最基本的 RNN 中，單元（方框）中的操作和全連線層沒什麼區別，都是線性變換和啟用。它完全可以看做多個全連線層的橫向擴充套件。但是運算元量多了之後，就會有梯度消失

TensorFlow練手專案一：使用迴圈神經網路(RNN)實現影評情感分類

使用迴圈神經網路(RNN)實現影評情感分類作為對迴圈神經網路的實踐，我用迴圈神經網路做了個影評情感的分類，即判斷影評的感情色彩是正面的，還是負面的。選擇使用RNN來做情感分類，主要是因為影評是一段文字，是序列的，而RNN對序列的支援比較好，能夠“記憶”前

機器學習與Tensorflow（5）——迴圈神經網路、長短時記憶網路

1.迴圈神經網路的標準模型前饋神經網路能夠用來建立資料之間的對映關係，但是不能用來分析過去訊號的時間依賴關係，而且要求輸入樣本的長度固定迴圈神經網路是一種在前饋神經網路中增加了分虧連結的神經網路，能夠產生對過去資料的記憶狀態，所以可以用於對序列資料的處理，並建立不同時段資料之間

學習筆記TF057:TensorFlow MNIST，卷積神經網路、迴圈神經網路、無監督學習

構建模型。定義輸入資料，預處理資料。讀取資料MNIST，得到訓練集圖片、標記矩陣，測試集圖片標記矩陣。trX、trY、teX、teY 資料矩陣表現。trX、teX形狀變為[-1,28,28,1]，-1 不考慮輸入圖片數量，28x28 圖片長、寬畫素數，1

TensorFlow練手專案二：基於迴圈神經網路(RNN)的古詩生成器

基於迴圈神經網路(RNN)的古詩生成器之前在手機百度上看到有個“為你寫詩”功能，能夠隨機生成古詩，當時感覺很酷炫= = 在學習了深度學習後，瞭解了一下原理，打算自己做個實現練練手，於是，就有了這個專案。文中如有瑕疵紕漏之處，還請路過的諸位大佬不

TensorFlow深度學習筆記迴圈神經網路實踐

載入資料使用text8作為訓練的文字資料集text8中只包含27種字元：小寫的從a到z，以及空格符。如果把它打出來，讀起來就像是去掉了所有標點的wikipedia。直接呼叫lesson1中maybe_download下載text8.zip用zipfile讀取zip內容

tensorflow17《TensorFlow實戰Google深度學習框架》筆記-08-02 使用迴圈神經網路實現語言模型 code

TensorFlow：實戰Google深度學習框架（七）迴圈神經網路

RNN網路確實可以解決和時間序列有關係的問題，但是，在實際的應用過程中，我們可以看到效能並不是很好。RNN記住了以前輸入的所有資訊，但是有時候並不需要記住以前時刻的所有資訊，增加了很多的系統記憶體負擔；有時候我們的確需要記住很長時間以前資訊，但是又容易出現梯度爆炸或者梯度消失的問題。針對於這個問題，人們開

tensorflow之雙向迴圈神經網路

一、定義儘管從多層感知器（MLP）到迴圈神經網路（RNN）的擴充套件看起來微不足道，但是這對於序列的學習具有深遠意義。迴圈神經網路（RNN）的使用是用來處理序列資料的。在傳統的神經網路模型中，層與層之間是全連線的，每層之間的節點是無連線的。但是這種普通的神經

Tensorflow建立迴圈神經網路

一、tensorflow實現RNN cell

二、tensorflow建立RNN

相關推薦