動手學深度學習 | 雙向迴圈神經網路 | 59

阿新 • • 發佈：2021-10-07

雙向迴圈神經網路
程式碼
QA

雙向迴圈神經網路

雙向LSTM非常不適合做推理，基礎是不能用在預測下一個詞。

Bi-RNN的作用主要是對一個句子做特徵提取，比如做翻譯，給句子A翻譯句子B，那麼可以對句子A使用Bi-RNN去雙向的看它。

程式碼

這裡程式碼不會講具體實現，但是其實很簡單，前向的隱藏層就正常進行運算。反向的怎麼實現呢？首先把reverse(input)，然後輸入到隱層得到一個輸出，再講這個輸出reverse(), 最後將這個兩個輸出進行連線。

# 可以直接指定RNN的單元和是否是雙向的
lstm_layer = nn.LSTM(num_inputs, num_hiddens, num_layers, bidirectional=True)
model = d2l.RNNModel(lstm_layer, len(vocab))
model = model.to(device)

下面是一個錯誤的案例，就是要說明不能使用雙向迴圈神經網路來做預測。

QA

時間序列預測，也用雙向的嗎？這個能從後向前看嗎？

時間序列是不能使用雙向的，只能做做完形填空、文字分類這種，可以看完一整段文字的。雙向迴圈神經網路不適合做預測的任務。

雙向迴圈神經網路，在正向和反向之間有權重關係嗎？

沒有。因為他們正向和反向的權重是concat在一起的，而不是相加或者其他運算，所以是獨立的。

隱藏層和隱馬爾科夫有什麼關係？

理論上RNN訓練是沒有長度限制的，但是訓練的時候我們把句子裁剪成了不要過長的子序列（比如35），這裡就可以認為暗含使用了隱馬爾科夫的假設。

雙向是否可以深度雙向？

是的，兩層是一組單元，可以進行疊加。

動手學深度學習 | 雙向迴圈神經網路 | 59

目錄雙向迴圈神經網路程式碼QA 雙向迴圈神經網路雙向LSTM非常不適合做推理，基礎是不能用在預測下一個詞。

動手學深度學習 | 網路中的網路NiN | 24

目錄NiN程式碼QA NiN NiN Network in Network，網路中的網路，這個網路現在用的不多，幾乎很少被用到，但是它裡面提出了比較重要的一些概念，在後面很多網路中都會持續的被用到。

動手學深度學習 | 殘差網路 ResNet | 27

目錄ResNet程式碼QA ResNet 如果說CNN只要你連線一個網路的話，那麼只要連線ResNet就可以了。ResNet是一個很簡單的，也是一個很好用的網路。

動手學深度學習基礎

第一次作業：深度學習基礎 1. 影象處理基本練習展示不同通道上的影象 # 展示三通道影象

《動手學深度學習》mxnet版/第三章學習筆記

第三章從單層神經網路延伸到多層神經網路，並通過多層感知機引入深度學習模型

《動手學深度學習》mxnet版/第五章學習筆記

第五章描述卷積神經網路中卷積層和池化層的工作原理，並解釋填充、步幅、輸入通道和輸出通道的含義

《動手學深度學習》mxnet版/第四章學習筆記

第四章概括深度學習計算的各個重要組成部分，如模型構造、引數的訪問和初始化等，自定義層，讀取、儲存和使用GPU

Ng深度學習改善深層神經網路

深度學習的實踐層面 1.1 訓練，驗證，測試集偏差，方差（Bias /Variance）機器學習基礎

深度學習與PyTorch | 神經網路的介紹 | 02

人工神經網路的概念人工神經網路(Artificial Neural Network,ANN),簡稱神經網路(Neural Newwork,NN).

《動手學深度學習Pytorch版》之AlexNet預測結果展示

技術標籤：Pytorch深度學習python深度學習《動手學深度學習Pytorch版》https://github.com/ShusenTang/Dive-into-DL-PyTorch 為了檢視預測結果，在原Demo上加了預測顯示程式碼。注意：

《動手學深度學習》(TF2.0版)第二章

技術標籤：深度不學習第二章 import tensorflow as tf print(tf.__version__) 檢視TF的版本 2.2資料操作

動手學深度學習影象分類例項-多層感知機(三) 多層感知機的簡潔實現

技術標籤：深度學習深度學習神經網路機器學習人工智慧python 動手學深度學習影象分類例項-多層感知機(三) 多層感知機的簡潔實現

深度學習——前饋神經網路

　　 1 前言　　前饋神經網路（feedforward neural network）是一種最簡單的神經網路，各神經元分層排列。每個神經元只與前一層的神經元相連。接收前一層的輸出，並輸出給下一層，各層間沒有反饋。是目前應用最廣泛

動手學深度學習 | 目錄 | 00

動手學深度學習 | 資料操作+資料預處理 | 02

目錄資料操作資料操作實現資料預處理實現QA 資料操作圖片是三維的： w*h*channel

動手學深度學習 | 線性代數 | 03

目錄線性代數線性代數實現按特定軸求和QA 線性代數其實我們不需要太多線性代數的知識，但是還是稍微講一下作為一個數學上的入門。

動手學深度學習 | Softmax迴歸+損失函式+圖片分類資料集 | 07

目錄Softmax迴歸損失函式圖片分類資料集Softmax迴歸從零開始實現Softmax迴歸簡潔實現QA

動手學深度學習 | 多層感知機+程式碼實現 | 08

目錄感知機多層感知機多層感知機從零開始實現多層感知機簡潔實現QA 感知機

動手學深度學習 | 模型選擇+過擬合和欠擬合 | 09

目錄模型選擇過擬合和欠擬合QA 模型選擇我們其實關心的是泛化誤差，並不太關心訓練誤差。

動手學深度學習 | 使用和購買GPU | 15

目錄使用GPU購買GPU整機配置QA 使用GPU 其實如果沒有錢買GPU的話，使用Google Colab也是一個不錯的選擇，大概是10 dollar一個月。

動手學深度學習 | 雙向迴圈神經網路 | 59

雙向迴圈神經網路

程式碼

QA

相關推薦