GRU（門控迴圈單元）--學習筆記

阿新 • • 發佈：2018-11-12

0、門控迴圈單元

門控迴圈神經網路可以更好地捕捉時間序列中時間步距離較大的依賴關係，通過引入了門的概念，修改迴圈神經網路中隱藏狀態的計算方式，它包括重置門、更新門、候選隱藏狀態和隱藏狀態。

重置門有助於捕捉時間序列裡短期的依賴關係。更新門有助於捕捉時間序列里長期的依賴關係。

1、重置門和更新門

門控迴圈單元中的重置門（reset gate）和更新門（update gate）的輸入均為當前時間步輸入 Xt 與上一時間步隱藏狀態 Ht−1，輸出由啟用函式為 sigmoid 函式的全連線層計算得到。
在這裡插入圖片描述

舉個例子：
在這裡插入圖片描述
其中：

2、候選隱藏狀態

門控迴圈單元將計算候選隱藏狀態來輔助稍後的隱藏狀態計算。將當前時間步重置門的輸出與上一時間步隱藏狀態做按元素乘法（符號為 ⊙）。

如果重置門中元素值接近 0，那麼意味著重置對應隱藏狀態元素為 0，即丟棄上一時間步的隱藏狀態。如果元素值接近 1，那麼表示保留上一時間步的隱藏狀態。

然後，將按元素乘法的結果與當前時間步的輸入連結，再通過含啟用函式 tanh 的全連線層計算出候選隱藏狀態，其所有元素的值域為 [−1,1]。

在這裡插入圖片描述

按照上面那個例子：
在這裡插入圖片描述

3、隱藏狀態

候選隱藏狀態只是為了更新新的隱藏狀態，而並不是隱藏狀態。所以接下來時間步t的隱藏狀態計算需要用當前的時間步更新Zt來對上一步的隱藏狀態Ht-1和當前時間步的候選隱藏狀態做組合。

還是按照上面這個例子：
在這裡插入圖片描述
計算結構圖如下圖所示：

4、GRU訓練

輸出層的輸入為：
在這裡插入圖片描述
輸出為：

某時刻的損失函式為：

訓練中整個抽樣的樣本的損失為：

以下是梯度下降更新過程：

在往後的章節中會使用MXNet的gluon來實踐GRU。

學習參考1
學習參考2

GRU（門控迴圈單元）--學習筆記

0、門控迴圈單元門控迴圈神經網路可以更好地捕捉時間序列中時間步距離較大的依賴關係，通過引入了門的概念，修改迴圈神經網路中隱藏狀態的計算方式，它包括重置門、更新門、候選隱藏狀態和隱藏狀態。重置門有助於捕捉時間序列裡短期的依賴關係。更新門有助於捕捉時間序列里長期的依賴關係。

序列模型（4）----門控迴圈單元（GRU）

一、GRU 其中， rt表示重置門，zt表示更新門。重置門決定是否將之前的狀態忘記。(作用相當於合併了 LSTM 中的遺忘門和傳入門）當rt趨於0的時候，前一個時刻的狀態資訊ht−1會被忘掉，隱藏狀態h^t會被重置為當前輸入的資訊。更新門決定是否要將隱藏狀態更新為新的狀態h^

超詳細的長短時記憶LSTM和門控迴圈單元GRU的反向傳播公式推導！

門控迴圈單元GRU 長短時記憶LSTM LSTM模型是用來解決simpleRNN對於長時期依賴問題（LongTerm Dependency），即通過之前提到的但是時間上較為久遠的內容進行後續的推理和判斷。LSTM的基本思

三步理解--門控迴圈單元(GRU)，TensorFlow實現

1. 什麼是GRU 在迴圈神經⽹絡中的梯度計算⽅法中，我們發現，當時間步數較⼤或者時間步較小時，迴圈神經⽹絡的梯度較容易出現衰減或爆炸。雖然裁剪梯度可以應對梯度爆炸，但⽆法解決梯度衰減的問題。通常由於這個原因，迴圈神經⽹絡在實際中較難捕捉時間序列中時間步距離較⼤的依賴關係。門控迴圈神經⽹絡（gated re

AJAX（Asynchronous JavaScript and XML）學習筆記

微博 chrome 並且 .get 插件網頁 t對象 end 觸發基本概念： 1.AJAX不是一種新的編程語言，而是一種使用現有標準的新方法。 2.AJAX最大的優點是在不重新加載整個頁面的情況下，與服務器交換數據並更新部分網頁內容，用於創建快速動態網頁（傳統網頁如果需

機器學習實戰（Machine Learning in Action）學習筆記————02.k-鄰近演算法（KNN）

機器學習實戰（Machine Learning in Action）學習筆記————02.k-鄰近演算法（KNN）關鍵字：鄰近演算法（kNN: k Nearest Neighbors）、python、原始碼解析、測試作者：米倉山下時間：2018-10-21機器學習實戰（Machine Learning in

機器學習實戰（Machine Learning in Action）學習筆記————05.Logistic迴歸

機器學習實戰（Machine Learning in Action）學習筆記————05.Logistic迴歸關鍵字：Logistic迴歸、python、原始碼解析、測試作者：米倉山下時間：2018-10-26機器學習實戰（Machine Learning in Action,@author: Peter H

機器學習實戰（Machine Learning in Action）學習筆記————04.樸素貝葉斯分類（bayes）

機器學習實戰（Machine Learning in Action）學習筆記————04.樸素貝葉斯分類（bayes）關鍵字：樸素貝葉斯、python、原始碼解析作者：米倉山下時間：2018-10-25機器學習實戰（Machine Learning in Action,@author: Peter Harri

機器學習實戰（Machine Learning in Action）學習筆記————03.決策樹原理、原始碼解析及測試

機器學習實戰（Machine Learning in Action）學習筆記————03.決策樹原理、原始碼解析及測試關鍵字：決策樹、python、原始碼解析、測試作者：米倉山下時間：2018-10-24機器學習實戰（Machine Learning in Action,@author: Peter Harr

機器學習實戰（Machine Learning in Action）學習筆記————08.使用FPgrowth演算法來高效發現頻繁項集

機器學習實戰（Machine Learning in Action）學習筆記————08.使用FPgrowth演算法來高效發現頻繁項集關鍵字：FPgrowth、頻繁項集、條件FP樹、非監督學習作者：米倉山下時間：2018-11-3機器學習實戰（Machine Learning in Action,@autho

機器學習實戰（Machine Learning in Action）學習筆記————07.使用Apriori演算法進行關聯分析

機器學習實戰（Machine Learning in Action）學習筆記————07.使用Apriori演算法進行關聯分析關鍵字：Apriori、關聯規則挖掘、頻繁項集作者：米倉山下時間：2018-11-2機器學習實戰（Machine Learning in Action,@author: Peter H

機器學習實戰（Machine Learning in Action）學習筆記————06.k-均值聚類演算法（kMeans）學習筆記

機器學習實戰（Machine Learning in Action）學習筆記————06.k-均值聚類演算法（kMeans）學習筆記關鍵字：k-均值、kMeans、聚類、非監督學習作者：米倉山下時間：2018-11-3機器學習實戰（Machine Learning in Action,@author: Pet

ELMo（Embeddings from Language Models） --學習筆記

學習參考自：（1）、ELMo 最好用的詞向量《Deep Contextualized Word Representations》（2）、吾愛NLP(5)—詞向量技術-從word2vec到ELMo （3）文字嵌入的經典模型與最新進展 1、ELMo簡介基於大量文字，ELMo模型

Ajax（阿賈克斯）學習筆記1

Ajax的簡介什麼是 AJAX ？ AJAX = 非同步 JavaScript 和 XML。 AJAX 是一種用於建立快速動態網頁的技術。通過在後臺與伺服器進行少量資料交換，AJAX 可以使網頁實現非同步更新。這意味著可以在不重新載入整個網頁的情況下，對網頁

機器學習實戰（Machine Learning in Action）學習筆記————10.奇異值分解(SVD)原理、基於協同過濾的推薦引擎、資料降維

關鍵字：SVD、奇異值分解、降維、基於協同過濾的推薦引擎作者：米倉山下時間：2018-11-3機器學習實戰（Machine Learning in Action,@author: Peter Harrington）原始碼下載地址：https://www.manning.com/books/machine-le

機器學習實戰（Machine Learning in Action）學習筆記————10.奇異值分解(SVD)原理、基於協同過濾的推薦引擎、數據降維

www 實現由於就是計算學習筆記圖片 blob 標示關鍵字：SVD、奇異值分解、降維、基於協同過濾的推薦引擎作者：米倉山下時間：2018-11-3機器學習實戰（Machine Learning in Action,@author: Peter Harringto

DOM（文件物件模型）學習筆記（一）

DOM可以將任何Html或XML文件描繪成一個由多層節點構成的結構，節點分為多種型別，每個節點都有自己的特點，資料和方法。 ** Node型別： ** 每個節點都有一個nodeType屬性，表明節點的型別，nodeName屬性表示元素的標

二叉查詢樹（二叉排序樹）學習筆記

本文轉載自：http://blog.csdn.net/qq_37887537/article/details/75647670在學習資料結構的時候，除了基本的之外的，還有許多樹像是二叉搜尋樹，2-3樹，紅黑樹等等。也曾經學習過二叉樹，以及前序排列中序排列後序排列等等，但是一直

機器學習（周志華版）學習筆記（三）歸納偏好

定義：機器學習演算法在學習過程中對某種型別假設的偏好。每種演算法必有其歸納偏好，否則它將被假設空間中看似在訓練集上“等效”的假設所迷惑，無法產生確定的學習結果。例子理解：編號色澤根蒂敲聲好瓜 1 青綠蜷縮濁響是

黑馬程式設計師_7k面試題（交通燈管理系統）學習筆記

總共有12條路線，為了統一程式設計模型，可以假設每條路線都有一個紅綠燈對其進行控制，右轉彎的4條路線的控制燈可以假設稱為常綠狀態，另外，其他的8條線路是兩兩成對的，可以歸為4組，所以，程式只需考慮圖中標註了數字號的4條路線的控制燈的切換順序，這4條路線相反方向的路線的控制燈跟隨這4條路線切換，不必額外考慮

GRU（門控迴圈單元）--學習筆記

0、門控迴圈單元

1、重置門和更新門

2、候選隱藏狀態

3、隱藏狀態

4、GRU訓練

相關推薦