pytorch學習筆記（二）：gradient

阿新 • • 發佈：2018-12-30

gradient

在BP的時候，pytorch是將Variable的梯度放在Variable物件中的，我們隨時都可以使用Variable.grad得到對應Variable的grad。剛建立Variable的時候，它的grad屬性是初始化為0.0的。

import torch
from torch.autograd import Variable
w1 = Variable(torch.Tensor([1.0,2.0,3.0]),requires_grad=True)#需要求導的話，requires_grad=True屬性是必須的。
w2 = Variable(torch.Tensor([1.0,2.0,3.0 
]),requires_grad=True)
print(w1.grad)
print(w2.grad)

Variable containing:
 0
 0
 0
[torch.FloatTensor of size 3]

Variable containing:
 0
 0
 0
[torch.FloatTensor of size 3]

從下面這兩段程式碼可以看出，Variable的grad是累加的即: Variable.grad=Variable.grad+new_grad

d = torch.mean(w1)
d.backward()
w1.grad

Variable containing:
 0.3333
 0.3333
 0.3333
[torch.FloatTensor of size 3]

d.backward()
w1.grad

Variable containing:
 0.6667
 0.6667
 0.6667
[torch.FloatTensor of size 3]

既然累加的話，那我們如何置零呢？

w1.grad.data.zero_()
w1.grad

Variable containing:
 0
 0
 0
[torch.FloatTensor of size 3]

通過上面的方法，就可以將grad置零。通過打印出來的資訊可以看出，w1.grad其實是Tensor。現在可以更清楚的理解一下Variable與Tensor之間的關係，上篇部落格已經說過，Variable

是Tensor的一個wrapper，那麼到底是什麼樣的wrapper呢？從目前的掌握的知識來看，一個是儲存weights的Tensor，一個是儲存grad的Variable。Variable的一些運算，實際上就是裡面的Tensor的運算。
pytorch中的所有運算都是基於Tensor的，Variable只是一個Wrapper，Variable的計算的實質就是裡面的Tensor在計算。Variable預設代表的是裡面儲存的Tensor（weights）。理解到這，我們就可以對grad進行隨意操作了。

# 獲得梯度後，如何更新
learning_rate = 0.1
#w1.data -= learning_rate * w1.grad.data 與下面式子等價
w1.data.sub_(learning_rate*w1.grad.data)# w1.data是獲取儲存weights的Tensor

這裡更新的時候為什麼要用Tensor更新，為什麼不直接用Variable？
Variable更多是用在feedforward中的，因為feedforward是需要記住各個Tensor之間聯絡的，這樣，才能正確的bp。Tensor不會記錄路徑。而且，如果使用Variable操作的話，就會造成迴圈圖了（猜測）。

pytorch學習筆記（二）：gradient

gradient

pytorch學習筆記（二）：gradient

PyTorch 學習筆記（二）：PyTorch的資料增強與資料標準化

PyTorch 學習筆記（三）：transforms的二十二個方法

javascript學習筆記（二）：定義函數、調用函數、參數、返回值、局部和全局變量

CSS學習筆記（二）：特性

Unity3D之Mecanim動畫系統學習筆記（二）：模型導入

kubernetes學習筆記（二）：bashborad安裝配置

python3學習筆記（二）：Python初識

Linux學習筆記（二）：實戰-根據微服務端口號關閉進程

Guava學習筆記（二）：基礎（Joiner，Objects，Splitter及Strings）

opencv 視覺項目學習筆記（二）：基於 svm 和 knn 車牌識別

安卓開發學習筆記（二）：Android Stuidio無法引用Intent來創建對象，出現cannot resolve xxx

Django學習筆記（二）：使用Template讓HTML、CSS參與網頁建立

Javaweb學習筆記（二）：servlet初體驗、HTTP協議

學習筆記（二）：使用K近鄰演算法檢測Web異常操作

Spring MVC 學習筆記（二）：@RequestMapping用法詳解

d3.js學習筆記（二）：完整的柱狀圖示例

微信小程式——學習筆記（二）：邏輯層（1）

Scala學習筆記（二）：類和物件

學習筆記（二）：檢視、索引

pytorch學習筆記（二）：gradient

gradient

相關推薦