PyTorch之nn.ReLU與F.ReLU的區別介紹

阿新 • • 發佈：2020-06-28

我就廢話不多說了，大家還是直接看程式碼吧~

import torch.nn as nn
import torch.nn.functional as F
import torch.nn as nn
 
class AlexNet_1(nn.Module):
 
  def __init__(self,num_classes=n):
    super(AlexNet,self).__init__()
    self.features = nn.Sequential(
      nn.Conv2d(3,64,kernel_size=3,stride=2,padding=1),nn.BatchNorm2d(64),nn.ReLU(inplace=True),)
 
  def forward(self,x):
    x = self.features(x)
 
class AlexNet_2(nn.Module):
 
  def __init__(self,x):
    x = self.features(x)
    x = F.ReLU(x)

在如上網路中，AlexNet_1與AlexNet_2實現的結果是一致的，但是可以看到將ReLU層新增到網路有兩種不同的實現，即nn.ReLU和F.ReLU兩種實現方法。

其中nn.ReLU作為一個層結構，必須新增到nn.Module容器中才能使用，而F.ReLU則作為一個函式呼叫，看上去作為一個函式呼叫更方便更簡潔。具體使用哪種方式，取決於程式設計風格。

在PyTorch中,nn.X都有對應的函式版本F.X，但是並不是所有的F.X均可以用於forward或其它程式碼段中，因為當網路模型訓練完畢時，在儲存model時，在forward中的F.X函式中的引數是無法儲存的。

也就是說，在forward中，使用的F.X函式一般均沒有狀態引數，比如F.ReLU，F.avg_pool2d等，均沒有引數，它們可以用在任何程式碼片段中。

補充知識：pytorch小知識點——in-place operation

一、什麼是in-place

在pytorch的很多函式中經常看到in-place選項，具體是什麼意思一直一知半解。這次專門來學習一下，in-place operation在pytorch中是指改變一個tensor的值的時候，不經過複製操作，而是直接在原來的記憶體上改變它的值。可以把它稱為原地操作符。

在pytorch中經常加字尾“_”來代表原地in-place operation，比如說.add_() 或者.scatter()。我們可以將in_place操作簡單的理解類似於python中的"+=","-="等操作。

舉個例子，下面是正常的加操作，執行結束後x的值沒有變化

import torch
x = torch.rand(2)
x
Out[3]: tensor([0.3486,0.2924])  #<-----這是x初始值
 
y = torch.rand(2)
y
Out[5]: tensor([0.6301,0.0101])  #<-----這是y初始值
x.add(y)
Out[6]: tensor([0.9788,0.3026])   #<-----這是x+y的結果
x
Out[7]: tensor([0.3486,0.2924])  #<-----這是執行操作之後x的值
y
Out[8]: tensor([0.6301,0.0101])   #<-----這是執行操作之後y的值

我們可以發現，在正常操作之後原運算元的值不會發生變化。

下面我們來看看in_place操作

import torch
x = torch.rand(2)
x
Out[3]: tensor([0.3486,0.2924])  #<-----這是x初始值
y = torch.rand(2)
y
Out[5]: tensor([0.6301,0.0101])  #<-----這是y初始值
x.add_(y)
Out[9]: tensor([0.9788,0.3026])  #<-----這是x+y結果
x
Out[10]: tensor([0.9788,0.3026]) #<-----這是操作後x的值
y
Out[11]: tensor([0.6301,0.0101])  #<-----這是操作後y的值

通過對比可以發現，in_place操作之後，原運算元等於表示式計算結果。也就是說將計算結果賦給了原運算元。

二、不能使用in-place的情況

對於 requires_grad=True 的葉子張量(leaf tensor) 不能使用 inplace operation

對於在求梯度階段需要用到的張量不能使用 inplace operation

以上這篇PyTorch之nn.ReLU與F.ReLU的區別介紹就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

PyTorch之nn.ReLU與F.ReLU的區別介紹

PyTorch之nn.ReLU與F.ReLU的區別介紹

PyTorch之nn.Module類與前向傳播函式forward的理解

c++模板學習03之普通函式與模板函式區別

tensorflow之tf.placeholder 與 tf.Variable區別對比

基於PyTorch的permute和reshape/view的區別介紹

linux 軟連結_Linux命令 ln 軟連線與硬連結區別介紹

js ||與|、&&與&的區別介紹

《艾爾登法環》普通版與豪華版區別介紹普通版與豪華版有什麼區別

遊戲重現藝術之美《地平線：西之絕境》與Rijks博物館合作介紹

細數nn.BCELoss與nn.CrossEntropyLoss的區別

PyTorch中torch.tensor與torch.Tensor的區別詳解

PHP Socket程式設計之深入解析fsockopen與pfsockopen的區別

php連線mysql之mysql_connect()與mysqli_connect()的區別

PyTorch之 torch.nn.Embedding 詞嵌入層的理解

軟體安裝之rpm 及rpm與yum的區別

Pytorch學習筆記15----nn.Conv2d與Conv3d引數理解

vue3 元件傳值之 props 與 attrs 的區別

MySQL之show varilables與show status之間的區別

軟體安裝之rpm 及rpm與yum的區別（轉載）

【501】pytorch教程之nn.Module類詳解

PyTorch之nn.ReLU與F.ReLU的區別介紹

相關推薦