在pytorch中實現只讓指定變數向後傳播梯度

阿新 • • 發佈：2020-02-29

pytorch中如何只讓指定變數向後傳播梯度？

（或者說如何讓指定變數不參與後向傳播？）

有以下公式，假如要讓L對xvar求導：

（1）中，L對xvar的求導將同時計算out1部分和out2部分；

（2）中，L對xvar的求導只計算out2部分，因為out1的requires_grad=False；

（3）中，L對xvar的求導只計算out1部分，因為out2的requires_grad=False；

驗證如下：

#!/usr/bin/env python2
# -*- coding: utf-8 -*-
"""
Created on Wed May 23 10:02:04 2018
@author: hy
"""
 
import torch
from torch.autograd import Variable
print("Pytorch version: {}".format(torch.__version__))
x=torch.Tensor([1])
xvar=Variable(x,requires_grad=True)
y1=torch.Tensor([2])
y2=torch.Tensor([7])
y1var=Variable(y1)
y2var=Variable(y2)
#(1)
print("For (1)")
print("xvar requres_grad: {}".format(xvar.requires_grad))
print("y1var requres_grad: {}".format(y1var.requires_grad))
print("y2var requres_grad: {}".format(y2var.requires_grad))
out1 = xvar*y1var
print("out1 requres_grad: {}".format(out1.requires_grad))
out2 = xvar*y2var
print("out2 requres_grad: {}".format(out2.requires_grad))
L=torch.pow(out1-out2,2)
L.backward()
print("xvar.grad: {}".format(xvar.grad))
xvar.grad.data.zero_()
#(2)
print("For (2)")
print("xvar requres_grad: {}".format(xvar.requires_grad))
print("y1var requres_grad: {}".format(y1var.requires_grad))
print("y2var requres_grad: {}".format(y2var.requires_grad))
out1 = xvar*y1var
print("out1 requres_grad: {}".format(out1.requires_grad))
out2 = xvar*y2var
print("out2 requres_grad: {}".format(out2.requires_grad))
out1 = out1.detach()
print("after out1.detach(),out1 requres_grad: {}".format(out1.requires_grad))
L=torch.pow(out1-out2,2)
L.backward()
print("xvar.grad: {}".format(xvar.grad))
xvar.grad.data.zero_()
#(3)
print("For (3)")
print("xvar requres_grad: {}".format(xvar.requires_grad))
print("y1var requres_grad: {}".format(y1var.requires_grad))
print("y2var requres_grad: {}".format(y2var.requires_grad))
out1 = xvar*y1var
print("out1 requres_grad: {}".format(out1.requires_grad))
out2 = xvar*y2var
print("out2 requres_grad: {}".format(out2.requires_grad))
#out1 = out1.detach()
out2 = out2.detach()
print("after out2.detach(),out2 requres_grad: {}".format(out1.requires_grad))
L=torch.pow(out1-out2,2)
L.backward()
print("xvar.grad: {}".format(xvar.grad))
xvar.grad.data.zero_()

pytorch中，將變數的requires_grad設為False，即可讓變數不參與梯度的後向傳播；

但是不能直接將out1.requires_grad=False;

其實，Variable型別提供了detach()方法，所返回變數的requires_grad為False。

注意：如果out1和out2的requires_grad都為False的話，那麼xvar.grad就出錯了，因為梯度沒有傳到xvar

補充：

volatile=True表示這個變數不計算梯度,參考:Volatile is recommended for purely inference mode,when you're sure you won't be even calling .backward(). It's more efficient than any other autograd setting - it will use the absolute minimal amount of memory to evaluate the model. volatile also determines that requires_grad is False.

以上這篇在pytorch中實現只讓指定變數向後傳播梯度就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

在pytorch中實現只讓指定變數向後傳播梯度

pytorch中如何只讓指定變數向後傳播梯度？（或者說如何讓指定變數不參與後向傳播？）

Pytorch中實現只匯入部分模型引數的方式

我們在做遷移學習，或者在分割，檢測等任務想使用預訓練好的模型，同時又有自己修改之後的結構，使得模型檔案儲存的引數，有一部分是不需要的（don\'t expected）。我們搭建的網路對儲存檔案來說，有一部分引數也是沒

mysql實現從匯出資料的sql檔案中只匯入指定的一個表

場景昨天系統自動備份了某一個數據庫的全部表資料，名dbAll.sql.gz。檔案較大(如40G)

PyTorch中的Variable變數詳解

一、瞭解Variable 顧名思義，Variable就是變數的意思。實質上也就是可以變化的量，區別於int變數，它是一種可以變化的變數，這正好就符合了反向傳播，引數更新的屬性。

Pytorch中index_select() 函式的實現理解

函式形式： index_select( dim,index ) 引數： dim：表示從第幾維挑選資料，型別為int值；

在pytorch中對非葉節點的變數計算梯度例項

在pytorch中一般只對葉節點進行梯度計算，也就是下圖中的d,e節點，而對非葉節點，也即是c,b節點則沒有顯式地去保留其中間計算過程中的梯度（因為一般來說只有葉節點才需要去更新），這樣可以節省很大部分的視訊記憶體

Pytorch中的VGG實現修改最後一層FC

https://discuss.pytorch.org/t/how-to-modify-the-final-fc-layer-based-on-the-torch-model/766/12 That\'s because vgg19 doesn\'t have a fc member variable. Instead,it has a

Python中實現輸入超時及如何通過變數獲取變數名

背景介紹開發中遇到了一個需求：程式執行到某處時需要使用者確認,但不能一直傻等,後面的程式不能被一直阻塞,需要有個超時限制,也就是這個程式如果在一段時間後還沒有得到使用者輸入就執行預設操作.

pytorch中使用cuda擴充套件的實現示例

以下面這個例子作為教程，實現功能是element-wise add；（pytorch中想呼叫cuda模組，還是用另外使用C編寫介面指令碼）

PyTorch中的C++擴充套件實現

今天要聊聊用 PyTorch 進行 C++ 擴充套件。在正式開始前，我們需要了解 PyTorch 如何自定義module。這其中，最常見的就是在 python 中繼承torch.nn.Module，用 PyTorch 中已有的 operator 來組裝成自己的模組。這種

但是上述介面的params變數無法在Python中實現，只能採用RESTFul形式，傳遞的引數一定要用JSON格式

LiveBos的WSDL模式下有通用的介面 1 execBizProcess(xs:string sessionId, xs:string bizProcessName, xs:string id, lbParameter[] params, lbParameter[] variables, )

在PyTorch中使用深度自編碼器實現影象重建

作者|DR. VAIBHAV KUMAR 編譯|VK 來源|Analytics In Diamag 人工神經網路有許多流行的變體，可用於有監督和無監督學習問題。自編碼器也是神經網路的一個變種，主要用於無監督學習問題。

Java Eclipse中實現快速替換變數

方法及步驟：選中要替換掉的變數，這裡我要替換掉“nextVetix”變數. 按下組合鍵“Alt+Shift+R”

mybatis中實現讓返回值與bean中欄位相匹配

1. 編寫目的這個介紹的與那些修改mybatis.xml檔案的方法不一樣，目的也不一樣。

輪播圖js首先獲取要使用的元素，建立index是圖片的索引，num是小圓點的索引，先實現自動滾因為預設向右滾所以向右滾和自動滾一樣，通過建立計時器將封裝好的自動滾函式匯入，向左滾則與之相反讓index

輪播圖js首先獲取要使用的元素，建立index是圖片的索引，num是小圓點的索引，先實現自動滾因為預設向右滾所以向右滾和自動滾一樣，通過建立計時器將封裝好的自動滾函式匯入，向左滾則與之相反讓index--，滑

在vue專案中實現定義全域性變數全域性函式操作

寫在前面：如題，在專案中，經常有些函式和變數是需要複用，比如說網站伺服器地址，從後臺拿到的：使用者的登入token,使用者的地址資訊等，這時候就需要設定一波全域性變數和全域性函式，這兩個設定不太難，而且有一

在Laravel 的 Blade 模版中實現定義變數

有時候我們需要在 Laravel 的 Blade 模版中定義一些變數，而 Blade 卻沒有提供這樣的方法，所以我們這裡為大家分享兩種可以實現在 Blade 模版中定義變數的方法。

PyTorch 中的傅立葉卷積實現示例

卷積卷積在資料分析中無處不在。幾十年來，它們一直被用於訊號和影象處理。最近，它們成為現代神經網路的重要組成部分。如果你處理資料的話，你可能會遇到錯綜複雜的問題。

php在微信中顯示不全_PHP讓指定網頁只能在微信內建瀏覽器開啟附程式碼

技術標籤：php在微信中顯示不全有時候，有些網頁不方便在電腦或者手機QQ開啟，比如：想建立一個微信活動頁面，在電腦或者QQ開啟會導致某些功能失效，頁面錯版等情況，為了避免出現這種情況，其實我們只需讓它

[原始碼解析]PyTorch如何實現前向傳播(1) --- 基礎類(上)

本系列將通過大概十篇左右文章來分析PyTorch 的自動微分功能如何實現。本文是前向傳播的第一篇，介紹自動微分（梯度計算）所涉及的部分 PyTorch 基礎類。因為字數太多（1萬兩千字），所以拆分成上下兩篇。

在pytorch中實現只讓指定變數向後傳播梯度

相關推薦