迴圈神經網路應用舉例

RNN的應用舉例——基於RNN的語言模型

現在，我們介紹一下基於RNN語言模型。我們首先把詞依次輸入到迴圈神經網路中，每輸入一個詞，迴圈神經網路就輸出截止到目前為止，下一個最可能的詞。例如，當我們依次輸入：

我昨天上學遲到了

神經網路的輸出如下圖所示：

其中，s和e是兩個特殊的詞，分別表示一個序列的開始和結束。

向量化

我們知道，神經網路的輸入和輸出都是向量，為了讓語言模型能夠被神經網路處理，我們必須把詞表達為向量的形式，這樣神經網路才能處理它。

神經網路的輸入是詞，我們可以用下面的步驟對輸入進行向量化：

建立一個包含所有詞的詞典，每個詞在詞典裡面有一個唯一的編號。

任意一個詞都可以用一個N維的one-hot向量來表示。其中，N是詞典中包含的詞的個數。假設一個詞在詞典中的編號是i，v是表示這個詞的向量，vj是向量的第j個元素，則：

vj={1j=i0j≠i(76)

上面這個公式的含義，可以用下面的圖來直觀的表示：

使用這種向量化方法，我們就得到了一個高維、稀疏的向量（稀疏是指絕大部分元素的值都是0）。處理這樣的向量會導致我們的神經網路有很多的引數，帶來龐大的計算量。因此，往往會需要使用一些降維方法，將高維的稀疏向量轉變為低維的稠密向量。不過這個話題我們就不再這篇文章中討論了。

語言模型要求的輸出是下一個最可能的詞，我們可以讓迴圈神經網路計算計算詞典中每個詞是下一個詞的概率，這樣，概率最大的詞就是下一個最可能的詞。因此，神經網路的輸出向量也是一個N維向量，向量中的每個元素對應著詞典中相應的詞是下一個詞的概率。如下圖所示：

Softmax層

前面提到，語言模型是對下一個詞出現的概率進行建模。那麼，怎樣讓神經網路輸出概率呢？方法就是用softmax層作為神經網路的輸出層。

我們先來看一下softmax函式的定義：

g(zi)=ezi∑kezk

這個公式看起來可能很暈，我們舉一個例子。Softmax層如下圖所示：

從上圖我們可以看到，softmax layer的輸入是一個向量，輸出也是一個向量，兩個向量的維度是一樣的（在這個例子裡面是4）。輸入向量x=[1 2 3 4]經過softmax層之後，經過上面的softmax函式計算，轉變為輸出向量y=[0.03 0.09 0.24 0.64]。計算過程為：

y1y2y3y4=ex1∑kexk=e1e1+e2+e3+e4=0.03=e2e1+e2+e3+e4=0.09=e3

迴圈神經網路應用舉例

RNN的應用舉例——基於RNN的語言模型

向量化

Softmax層

迴圈神經網路應用舉例

03-RNN迴圈神經網路及其應用

深度學習（Deep Learning）讀書思考八：迴圈神經網路三（RNN應用）

迴圈神經網路RNN在自然語言處理領域的應用

深度學習在資料中的應用---迴圈神經網路

Keras學習（五）——RNN迴圈神經網路分類

【火爐煉AI】深度學習004-Elman迴圈神經網路

從迴圈神經網路（RNN）到LSTM網路

協同過濾結合迴圈神經網路的推薦系統——期末作業

DeepLearning.ai作業:(5-1)-- 迴圈神經網路（Recurrent Neural Networks）（1）

DeepLearning.ai筆記:(5-1)-- 迴圈神經網路（Recurrent Neural Networks）

DeepLearning.ai作業:(5-1)-- 迴圈神經網路（Recurrent Neural Networks）（2）

DeepLearning.ai作業:(5-1)-- 迴圈神經網路（Recurrent Neural Networks）（3）

深度學習花書學習筆記第十章序列建模：迴圈神經網路

TensorFlow從入門到理解（四）：你的第一個迴圈神經網路RNN（分類例子）

TensorFlow從入門到理解（五）：你的第一個迴圈神經網路RNN（迴歸例子）

tensorflow基本教程10：RNN迴圈神經網路對於手寫體識別預測

機器學習之迴圈神經網路（十）

迴圈神經網路系列（四）基於LSTM的MNIST手寫體識別

迴圈神經網路系列（三）Tensorflow中MultiRNNCell

迴圈神經網路應用舉例

RNN的應用舉例——基於RNN的語言模型

向量化

Softmax層

相關推薦