機器學習十：Recurrent Neural Network (RNN)遞迴神經網路

阿新 • • 發佈：2020-10-11

什麼是遞迴神經網路

他們都只能單獨的取處理一個個的輸入，前一個輸入和後一個輸入是完全沒有關係的。但是，某些任務需要能夠更好的處理序列的資訊，即前面的輸入和後面的輸入是有關係的。

比如，當我們在理解一句話意思時，孤立的理解這句話的每個詞是不夠的，我們需要處理這些詞連線起來的整個序列；當我們處理視訊的時候，我們也不能只單獨的去分析每一幀，而要分析這些幀連線起來的整個序列。
以nlp的一個最簡單詞性標註任務來說，將我吃蘋果三個單詞標註詞性為我/nn 吃/v 蘋果/nn。

那麼這個任務的輸入就是：

我吃蘋果（已經分詞好的句子）

這個任務的輸出是：

我/nn 吃/v 蘋果/nn(詞性標註好的句子)

對於這個任務來說，我們當然可以直接用普通的神經網路來做，給網路的訓練資料格式了就是我-> 我/nn 這樣的多個單獨的單詞->詞性標註好的單詞。

但是很明顯，一個句子中，前一個單詞其實對於當前單詞的詞性預測是有很大影響的，比如預測蘋果的時候，由於前面的吃是一個動詞，那麼很顯然蘋果作為名詞的概率就會遠大於動詞的概率，因為動詞後面接名詞很常見，而動詞後面接動詞很少見。

所以為了解決一些這樣類似的問題，能夠更好的處理序列的資訊，RNN就誕生了。
在這裡插入圖片描述

Long Short-term Memory (LSTM)

之前的模型，下次輸入後，上次的會被抹掉，這個模型的好處是，可以控制存放
在這裡插入圖片描述

舉例：

複雜的LSTM

RNN的缺點

在這裡插入圖片描述

why？？

在這裡插入圖片描述

有用的技術

LSTM，可以解決梯度消失，但是不會解決梯度爆炸

在這裡插入圖片描述

機器學習十：Recurrent Neural Network (RNN)遞迴神經網路

什麼是遞迴神經網路

Long Short-term Memory (LSTM)

RNN的缺點

why？？

有用的技術

LSTM，可以解決梯度消失，但是不會解決梯度爆炸

機器學習十：Recurrent Neural Network (RNN)遞迴神經網路

自動機器學習：利用遺傳演算法優化遞迴神經網路

基礎|認識機器學習中的邏輯迴歸、決策樹、神經網路演算法

4.5 RNN迴圈神經網路（recurrent neural network）

機器學習篇：迴圈神經網路RNN

論文翻譯：2018_CRN_A Convolutional Recurrent Neural Network for Real-Time Speech Enhancement

論文翻譯：2020_Acoustic Echo Cancellation by Combining Adaptive Digital Filter and Recurrent Neural Network

論文翻譯：2020_Nonlinear Residual Echo Suppression using a Recurrent Neural Network

機器學習入門：極度舒適的GBDT原理拆解

機器學習四：Logistic Regression邏輯迴歸演算法

機器學習五：Deep Learning深度學習1

李巨集毅機器學習HW4：句子情感分類

[論文解讀]A Quantitative Analysis Framework for Recurrent Neural Network

Python機器學習演算法：線性迴歸

虛擬機器報錯：Job for network.service failed because the control process exited with error code

Python機器學習課程：線性迴歸演算法

Building your Recurrent Neural Network - Step by Step

Python機器學習筆記：奇異值分解（SVD）演算法

機器學習(二)：理解線性迴歸與梯度下降並做簡單預測

微軟宣佈公開發行 DirectML 機器學習 API：可用 A 卡加速實現光追、DLSS 等效果

機器學習十：Recurrent Neural Network (RNN)遞迴神經網路

什麼是遞迴神經網路

Long Short-term Memory (LSTM)

RNN的缺點

why？？

有用的技術

LSTM，可以解決梯度消失，但是不會解決梯度爆炸

相關推薦