簡單的RNN和BP多層網路之間的區別

阿新 • • 發佈：2018-11-10

先來個簡單的多層網路

RNN的原理和出現的原因，解決什麼場景的什麼問題

關於RNN出現的原因，RNN詳細的原理，已經有很多博文講解的非常棒了。
如下：

http://ai.51cto.com/art/201711/559441.htm

更多的例子可以百度瞭解

為什麼我寫這篇部落格

主要是我從自己學習理解RNN的時候，開始有一些困難，書上講的也是模模糊糊的，原理講解的很多，但是程式碼的關鍵點描述不太清楚，自己反覆揣測以後，終於有了一些理解，記錄下來，一方面記錄自己的成長過程，另外一方面可以讓跟我一樣有疑惑的同學可以少走彎路，當然也有可能是錯路。

多層網路
x = tf.placeholder(tf.float32,[None,256])
y = tf.placeholder(tf.float32,[None,10])

w1 = tf.Variable(tf.random_normal([256,1024]))
b1 = tf.Variable(tf.zeros([1024]))

x1 = tf.nn.relu(tf.multiply(w1,x)+b1)

w2 = tf.Variable(tf.random_normal(1024,10))
b2 = tf.Variable(tf.zeros([10]))
pred = tf.nn.softmax(tf.multiply(w2,x1)+b2)
loss = -tf.reduce_sum(pred*tf.log(y))
op = tf.train.GradientDescentOptimizer(0.001).minimize(loss)

在寫個簡單的RNN網路

import tensorflow as tf

# RNN
batch_size = 5
truncated_series_length = 50000
state_size = 4

x = tf.placeholder(tf.float32,[batch_size,truncated_series_length])
y = tf.placeholder(tf.float32,[batch_size,truncated_series_length])

'''
最關鍵的點，好多書上沒寫的，就是這個引數，是參與迴圈的引數
BP網路中沒有這個引數
'''
init_state = tf.placeholder(tf.float32,[batch_size,state_size])

# 把X，Y拆開，我的理解是為了方便看得到迴圈的時候State是如何參與迴圈的
xs = tf.unstack(x,axis=1)
ys = tf.unstack(y,axis=1)
current_state = init_state

for currentx,currenty in zip(xs,ys):
    
    w1 = tf.Variable(tf.random_normal([truncated_series_length+ state_size,truncated_series_length]))
    b1 = tf.Variable(tf.zeros([truncated_series_length]))
    #這個就是和BP的區別，把迴圈連結起來
    concatedx = tf.concat(xs,current_state)
    y1 = tf.nn.tanh(tf.multiply(w1,x) + b1)

    #區別
    current_state = y1
    #註釋掉這一層，讓看上去更容易理解為什麼叫做迴圈網路
    #w2= tf.Variable(tf.random_normal([truncated_series_length,truncated_series_length]))
    #b2 = tf.Variable(tf.zeros([truncated_series_length]))
    #y2 = tf.multiply(w2,y1)+b2

    loss = -tf.reduce_sum(y1*tf.log(currenty))

個人感覺兩個的主要區別在於BP網路中每個引數每一步都是獨立的，和下一個樣本之間不相互依賴，而RNN有一個引數參與迴圈。另外RNN的一些引數的設定，我還不是太熟悉，還有待於深入。另外很多書上講解Rnn用的是tf.contrib.layers或tf.contrib.cnn的類庫去描繪，不是太利於理解底層的東西。所以我選擇了用這種寫法去表述。不對之處請多多指教。

簡單的RNN和BP多層網路之間的區別

RNN的原理和出現的原因，解決什麼場景的什麼問題

為什麼我寫這篇部落格

簡單的RNN和BP多層網路之間的區別

php程式設計中require和include多層巢狀導致檔案找不到的錯誤

DJANGO入門系列之(模板層的簡單介紹和視圖層的掃尾)

DL4J中文文件/模型/多層網路

華為關於多層網路視覺化的研究

多層網路

MATLAB困在迴圈中的除錯方法和跳出多層迴圈

IOS中如何在多層介面之間顯示與隱藏標籤欄（UITabBar）

C++中編譯期多型機制和執行期多型機制之間的區別

板級支援包BSP和硬體抽象層HAL的區別和關聯

tf.nn.bidirectional_dynamic_rnn和MultiRNNCell構建雙向多層RNN(LSTM)

tf.contrib.rnn.static_bidirectional_rnn和MultiRNNCell構建多層靜態雙向LSTM

TensorFlow實戰4：實現簡單的多層神經網路案例

多層前饋神經網路及BP演算法

神經網路/多層感知器（MLP）架構：選擇隱藏層數量和大小的標準

理解神經網路，從簡單的例子開始（2）使用python建立多層神經網路

spark scala word2vec 和多層分類感知器在情感分析中的實際應用

多線程和多進程之間的區別

華為eNSP多層交換機不同vlan之間的通信

二層三層網路協議-ICMP和ping

簡單的RNN和BP多層網路之間的區別

RNN的原理和出現的原因，解決什麼場景的什麼問題

為什麼我寫這篇部落格

相關推薦