Pytorch實現LSTM和GRU示例

阿新 • • 發佈：2020-01-15

為了解決傳統RNN無法長時依賴問題，RNN的兩個變體LSTM和GRU被引入。

LSTM

Long Short Term Memory，稱為長短期記憶網路，意思就是長的短時記憶，其解決的仍然是短時記憶問題，這種短時記憶比較長，能一定程度上解決長時依賴。

上圖為LSTM的抽象結構，LSTM由3個門來控制，分別是輸入門、遺忘門和輸出門。輸入門控制網路的輸入，遺忘門控制著記憶單元，輸出門控制著網路的輸出。最為重要的就是遺忘門，可以決定哪些記憶被保留，由於遺忘門的作用，使得LSTM具有長時記憶的功能。對於給定的任務，遺忘門能夠自主學習保留多少之前的記憶，網路能夠自主學習。

具體看LSTM單元的內部結構：

在每篇文章中，作者都會使用和標準LSTM稍微不同的版本，針對特定的任務，特定的網路結構往往表現更好。

GRU

上述的過程的線性變換沒有使用偏置。隱藏狀態引數不再是標準RNN的4倍，而是3倍，也就是GRU的引數要比LSTM的引數量要少，但是效能差不多。

Pytorch

在Pytorch中使用nn.LSTM()可呼叫，引數和RNN的引數相同。具體介紹LSTM的輸入和輸出：

輸入： input,(h_0,c_0)

input：輸入資料with維度(seq_len,batch,input_size)

h_0:維度為(num_layers*num_directions,hidden_size),在batch中的

初始的隱藏狀態.

c_0:初始的單元狀態，維度與h_0相同

輸出：output,(h_n,c_n)

output：維度為(seq_len,num_directions * hidden_size)。

h_n：最後時刻的輸出隱藏狀態，維度為 (num_layers * num_directions,hidden_size)

c_n:最後時刻的輸出單元狀態，維度與h_n相同。

LSTM的變數：

以MNIST分類為例實現LSTM分類

MNIST圖片大小為28×28，可以將每張圖片看做是長為28的序列，序列中每個元素的特徵維度為28。將最後輸出的隱藏狀態作為抽象的隱藏特徵輸入到全連線層進行分類。最後輸出的

匯入標頭檔案：

import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
from torchvision import transforms

class Rnn(nn.Module):
  def __init__(self,in_dim,hidden_dim,n_layer,n_classes):
    super(Rnn,self).__init__()
    self.n_layer = n_layer
    self.hidden_dim = hidden_dim
    self.lstm = nn.LSTM(in_dim,batch_first=True)
    self.classifier = nn.Linear(hidden_dim,n_classes)

  def forward(self,x):
    out,c_n) = self.lstm(x)
    # 此時可以從out中獲得最終輸出的狀態h
    # x = out[:,-1,:]
    x = h_n[-1,:,:]
    x = self.classifier(x)
    return x

訓練和測試程式碼：

transform = transforms.Compose([
  transforms.ToTensor(),transforms.Normalize([0.5],[0.5]),])

trainset = torchvision.datasets.MNIST(root='./data',train=True,download=True,transform=transform)
trainloader = torch.utils.data.DataLoader(trainset,batch_size=128,shuffle=True)

testset = torchvision.datasets.MNIST(root='./data',train=False,transform=transform)
testloader = torch.utils.data.DataLoader(testset,batch_size=100,shuffle=False)

net = Rnn(28,10,2,10)

net = net.to('cpu')
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(),lr=0.1,momentum=0.9)

# Training
def train(epoch):
  print('\nEpoch: %d' % epoch)
  net.train()
  train_loss = 0
  correct = 0
  total = 0
  for batch_idx,(inputs,targets) in enumerate(trainloader):
    inputs,targets = inputs.to('cpu'),targets.to('cpu')
    optimizer.zero_grad()
    outputs = net(torch.squeeze(inputs,1))
    loss = criterion(outputs,targets)
    loss.backward()
    optimizer.step()

    train_loss += loss.item()
    _,predicted = outputs.max(1)
    total += targets.size(0)
    correct += predicted.eq(targets).sum().item()

    print(batch_idx,len(trainloader),'Loss: %.3f | Acc: %.3f%% (%d/%d)'
      % (train_loss/(batch_idx+1),100.*correct/total,correct,total))

def test(epoch):
  global best_acc
  net.eval()
  test_loss = 0
  correct = 0
  total = 0
  with torch.no_grad():
    for batch_idx,targets) in enumerate(testloader):
      inputs,targets.to('cpu')
      outputs = net(torch.squeeze(inputs,1))
      loss = criterion(outputs,targets)

      test_loss += loss.item()
      _,predicted = outputs.max(1)
      total += targets.size(0)
      correct += predicted.eq(targets).sum().item()

      print(batch_idx,len(testloader),'Loss: %.3f | Acc: %.3f%% (%d/%d)'
        % (test_loss/(batch_idx+1),total))




for epoch in range(200):
  train(epoch)
  test(epoch)

以上這篇Pytorch實現LSTM和GRU示例就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

Pytorch實現LSTM和GRU示例

為了解決傳統RNN無法長時依賴問題，RNN的兩個變體LSTM和GRU被引入。 LSTM Long Short Term Memory，稱為長短期記憶網路，意思就是長的短時記憶，其解決的仍然是短時記憶問題，這種短時記憶比較長，能一定程度上解決長

pytorch實現mnist分類的示例講解

torchvision包包含了目前流行的資料集，模型結構和常用的圖片轉換工具。 torchvision.datasets中包含了以下資料集

pytorch:實現簡單的GAN示例(MNIST資料集)

我就廢話不多說了，直接上程式碼吧！ # -*- coding: utf-8 -*- \"\"\" Created on Sat Oct 13 10:22:45 2018

Keras中RNN、LSTM和GRU的引數計算

1. RNN RNN結構圖計算公式：程式碼： 1 model = Sequential() 2 model.add(SimpleRNN(7, batch_input_shape=(None, 4, 2)))

深度學習《LSTM和GRU模型》

前言：前面我們學習了標準的單向單層和單向多層的RNN，這一博文我來介紹RNN的改進版本LSTM和GRU，至於為什麼有這個改進的方案，以及如何理解它們，我會盡量用最通俗的語言倆表達。學習自部落格https://co

pytorch實現用CNN和LSTM對文字進行分類方式

model.py： #!/usr/bin/python # -*- coding: utf-8 -*- import torch from torch import nn import numpy as np

PyTorch實現ResNet50、ResNet101和ResNet152示例

PyTorch: https://github.com/shanglianlm0525/PyTorch-Networks import torch import torch.nn as nn import torchvision

Pytorch 實現focal_loss 多類別和二分類示例

我就廢話不多說了，直接上程式碼吧！ import numpy as np import torch import torch.nn as nn

Pytorch實現各種2d卷積示例

普通卷積使用nn.Conv2d()，一般還會接上BN和ReLu 引數量NNCin*Cout+Cout(如果有bias，相對來說表示對引數量影響很小，所以後面不考慮)

pytorch .detach() .detach_() 和 .data用於切斷反向傳播的實現

當我們再訓練網路的時候可能希望保持一部分的網路引數不變，只對其中一部分的引數進行調整；或者值訓練部分分支網路，並不讓其梯度對主網路的梯度造成影響，這時候我們就需要使用detach()函式來切斷一些分支的反向傳

Pytorch實現的手寫數字mnist識別功能完整示例

本文例項講述了Pytorch實現的手寫數字mnist識別功能。分享給大家供大家參考，具體如下：

Python實現棧和佇列的簡單操作方法示例

本文例項講述了Python實現棧和佇列的簡單操作方法。分享給大家供大家參考，具體如下：

Pytorch實現基於CharRNN的文字分類與生成示例

1 簡介本篇主要介紹使用pytorch實現基於CharRNN來進行文字分類與內容生成所需要的相關知識，並最終給出完整的實現程式碼。

Pytorch使用MNIST資料集實現CGAN和生成指定的數字方式

CGAN的全拼是Conditional Generative Adversarial Networks，條件生成對抗網路，在初始GAN的基礎上增加了圖片的相應資訊。

PyTorch實現AlexNet示例

PyTorch: https://github.com/shanglianlm0525/PyTorch-Networks import torch import torch.nn as nn import torchvision

Pytorch之Tensor和Numpy之間的轉換的實現方法

為什麼要相互轉換： 1. 要對tensor進行操作，需要先啟動一個Session,否則，我們無法對一個tensor比如一個tensor常量重新賦值或是做一些判斷操作，所以如果將它轉化為numpy陣列就好處理了。下面一個小程式講述了將ten

python實現sm2和sm4國密(國家商用密碼)演算法的示例

GMSSL模組介紹 GmSSL是一個開源的加密包的python實現，支援SM2/SM3/SM4等國密(國家商用密碼)演算法、專案採用對商業應用友好的類BSD開源許可證，開源且可以用於閉源的商業應用。

Java實現md5和base64加密解密的示例程式碼

import java.io.IOException; import java.security.MessageDigest; import sun.misc.BASE64Encoder; import sun.misc.BASE64Decoder;

jeefast和Mybatis實現三級聯動的示例程式碼

上篇文章給大家介紹了詳解jeefast和Mybatis實現二級聯動的問題，感興趣的朋友可以點選檢視。

Vue實現boradcast和dispatch的示例

這篇內容主要是學習掘金小冊vue元件精講的一個案例，自己做下筆記，以免日後忘記。

Pytorch實現LSTM和GRU示例

相關推薦