深度學習——RNN初識

阿新 • • 發佈：2019-01-09

資料

1.快速瞭解視訊（bilibili莫凡視訊）

https://www.bilibili.com/video/av15998703?from=search&seid=4200091979965196821

2. 詳細介紹：

http://www.wildml.com/2015/09/recurrent-neural-networks-tutorial-part-1-introduction-to-rnns/

源起

沒有十全十美的神經網路，每一個都有對應的特色。So，產生了各種各樣的 Neural Network，來處理對應的各種各樣的問題。從最基礎的basic neural network（全連結），不考慮空間結構，且假設所有元素點或資料點獨立，只是按照一定層次的結構組合成網路結構，就能實現常人感到不可思議的事情，如人工智慧的Hello World——手寫字識別。再看CNN,當人們開始思考，全連結神經網路雖然好，但卻忽略了空間結構這一重要概念，全連線構造時，僅僅將所有畫素點排成一列，而忽略了其他，這怎麼可以，所以，CNN來了。思考並未停止，等到某一天，人們不在基於圖片，開始圍繞時間二字，開始衝擊資料點獨立二字，RNN的是時代來臨了。

什麼是RRN

正如每種Neural Network都有一種結構，RNN的結構是這個樣子。僅僅這個結構就有很多資訊。此文為記錄文（僅僅記錄自己的所得和重要的東西），所以（http://www.wildml.com/2015/09/recurrent-neural-networks-tutorial-part-1-introduction-to-rnns/）

Note:

1.As briefly mentioned above, it’s a bit more complicated in practice because $s_t$

typically can’t capture information from too many time steps ago。

2.Unlike a traditional deep neural network, which uses different parameters at each layer, a RNN shares the same parameters ( $U, V, W$ above) across all steps. This reflects the fact that we are performing the same task at each step, just with different inputs. This greatly reduces the total number of parameters we need to learn.

沒有嘗試去翻譯兩句話，因為英文描述的很清楚裡。RNN框架的特性，權重相同，不能記憶太多代。

RNN能幹什麼

1.語言建模與生成文字

在語言建模中，我們的輸入通常是一系列單詞（例如編碼為單熱向量），我們的輸出是預測單詞的序列。在訓練我們設定的網路時， $o_t = x_ {t + 1}$ 因為我們想要步驟輸出 $Ť$ 成為實際的下一個詞。

2.機器翻譯

機器翻譯類似於語言建模，因為我們的輸入是源語言中的一系列單詞（例如德語）。我們希望以目標語言輸出一系列單詞（例如英語）。一個關鍵的區別是我們的輸出僅在我們看到完整輸入後才開始，因為我們翻譯的句子的第一個單詞可能需要從完整的輸入序列中捕獲的資訊。

3.語音識別

給定來自聲波的聲學訊號的輸入序列，我們可以預測一系列語音片段及其概率。

4.生成影象描述

與卷積神經網路一起，RNN已被用作模型的一部分，以生成未標記影象的描述。令人驚訝的是，這看起來有多好。組合模型甚至將生成的單詞與影象中找到的特徵對齊。

5.Training RNNs

in order to calculate the gradient at $t=4$ we would need to backpropagate 3 steps and sum up the gradients. This is called Backpropagation Through Time (BPTT)

6.RNN擴充套件

雙向RNN基於以下思想：時間上的輸出 $Ť$ 可能不僅取決於序列中的先前元素，還取決於未來元素。例如，要預測序列中缺少的單詞，您需要檢視左側和右側上下文。雙向RNN非常簡單。它們只是兩個堆疊在一起的RNN。然後基於兩個RNN的隱藏狀態計算輸出

深度（雙向）RNN類似於雙向RNN，只是我們現在每個時間步長有多個層。在實踐中，這為我們提供了更高的學習能力（但我們還需要大量的培訓資料）。

LSTM網路 現在非常流行，我們在上面簡要討論了它們。LSTM與RNN沒有根本不同的架構，但它們使用不同的函式來計算隱藏狀態。LSTM中的記憶體稱為單元格，您可以將它們視為黑框，將以前的狀態 $H_ {T-1}$ 和當前輸入作為輸入 $X_T$ 。在內部，這些單元格決定要保留什麼（以及從中擦除什麼）記憶體。然後，它們組合先前的狀態，當前記憶體和輸入。事實證明，這些型別的單元在捕獲長期依賴性方面非常有效。

深度學習——RNN初識

資料

源起

什麼是RRN

RNN能幹什麼

深度學習——RNN初識

深度學習-*-RNN正向及反向傳播

深度學習-RNN注意力模型

深度學習RNN實現股票預測實戰（附資料、程式碼）

使用Keras進行深度學習:RNN

Tensorflow #2 深度學習-RNN LSTM版 MNIST手寫識別Demo

實現Bidirectional LSTM Classifier----深度學習RNN

機器學習-->深度學習-->RNN,LSTM

用深度學習（CNN RNN Attention）解決大規模文本分類問題 - 綜述和實踐

吳恩達深度學習筆記（deeplearning.ai）之循環神經網絡（RNN）（一）

吳恩達深度學習筆記（deeplearning.ai）之循環神經網絡（RNN）（二）

吳恩達深度學習筆記（deeplearning.ai）之循環神經網絡（RNN）（三）

深度學習之神經網絡（CNN/RNN/GAN）算法原理+實戰

【深度學習篇】---CNN和RNN結合與對比，實例講解

深度學習（十一）RNN入門學習

機器學習與深度學習系列連載：第二部分深度學習（十六）迴圈神經網路 4（BiDirectional RNN， Highway network， Grid-LSTM）

機器學習與深度學習系列連載：第二部分深度學習（十五）迴圈神經網路 3（Gated RNN - GRU）

機器學習與深度學習系列連載：第二部分深度學習（十四）迴圈神經網路 2（Gated RNN - LSTM ）

深度學習之神經網路（CNN/RNN/GAN）演算法原理+實戰目前最新

深度學習---迴圈神經網路RNN詳解（LSTM）

深度學習——RNN初識

資料

源起

什麼是RRN

RNN能幹什麼

相關推薦