動手學深度學習v2-08-自動求導

阿新 • • 發佈：2021-10-05

自動求導

深度學習框架通過自動計算導數，即自動求導（automatic differentiation），來加快這項工作。
根據我們設計的模型，系統會構建一個計算圖，來跟蹤計算是哪些資料通過哪些操作組合起來產生輸出。
自動求導使系統能夠隨後反向傳播梯度
反向傳播只是意味著跟蹤整個計算圖，填充關於每個引數的偏導數。

1 向量鏈式法則

2 自動求導

2.1 自動求導的兩種模式

2.2 例子

建立變數x併為其分配一個初始值

import torch

x = torch.arange(4.0)
x

x.grad來儲存梯度

標量函式關於向量 x 的梯度是向量，並且與 x 具有相同的形狀。

x.requires_grad_(True)  # 等價於 `x = torch.arange(4.0, requires_grad=True)`
x.grad  # 預設值是None

計算Y值

y = 2 * torch.dot(x, x)
y

呼叫反向傳播函式來自動計算y關於x每個分量的梯度，並列印這些梯度。

x是一個長度為4的向量

y.backward()
x.grad

我們知道關於x的梯度為4x,我們想要驗證梯度是否正確。

x.grad == 4 * x

2.3 非標量變數的反向傳播

計算批量中每個樣本單獨計算的偏導數之和

# 對非標量呼叫`backward`需要傳入一個`gradient`引數，該引數指定微分函式關於`self`的梯度。在我們的例子中，我們只想求偏導數的和，所以傳遞一個1的梯度是合適的
x.grad.zero_()
y = x * x
# 等價於y.backward(torch.ones(len(x)))
y.sum().backward()
x.grad

2.4 分離計算

我們可以分離y來返回一個新變數u，該變數與y具有相同的值，但丟棄計算圖中如何計算y的任何資訊。

下面的反向傳播函式計算z=u*x關於x的偏導數，同時將u作為常數處理，而不是z=x * x * x關於x的偏導數。

x.grad.zero_()
y = x * x
u = y.detach()
z = u * x

z.sum().backward()
x.grad == u

2.5 Python控制流的梯度計算

使用自動求導的一個好處是，即使構建函式的計算圖需要通過Python控制流（例如，條件、迴圈或任意函式呼叫），我們仍然可以計算得到的變數的梯度。

下面的程式碼中，while迴圈的迭代次數和if語句的結果都取決於輸入a的值

def f(a):
    b = a * 2
    while b.norm() < 1000:
        b = b * 2
    if b.sum() > 0:
        c = b
    else:
        c = 100 * b
    return c

計算梯度

a = torch.randn(size=(), requires_grad=True)
d = f(a)
d.backward()

驗證梯度是否正確

a.grad == d / a

3 小結

我們首先將梯度附加到想要對其計算偏導數的變數上。然後我們記錄目標值的計算，執行它的反向傳播函式，並訪問得到的梯度。

動手學深度學習v2-08-自動求導

自動求導深度學習框架通過自動計算導數，即自動求導（automatic differentiation），來加快這項工作。

跟李沐學Ai 03 安裝【動手學深度學習v2】

可以考慮直接使用Google的colab，https://colab.research.google.com/drive/18-HoW6P3L6N0rWBWLc-b6xB83cD3cZZn

動手學深度學習v2-09-03-影象分類資料集

1 影象分類資料集採用的是Fashion-MNIST資料集 %matplotlib inline import torch import torchvision

動手學深度學習v2-09-04-softmax迴歸的從零開始實現¶

1softmax迴歸的從零開始實現 #使用Fashion-MNIST資料集，並設定資料迭代器的批量大小為256

動手學深度學習 | 多層感知機+程式碼實現 | 08

目錄感知機多層感知機多層感知機從零開始實現多層感知機簡潔實現QA 感知機

動手學深度學習基礎

第一次作業：深度學習基礎 1. 影象處理基本練習展示不同通道上的影象 # 展示三通道影象

《動手學深度學習》mxnet版/第三章學習筆記

第三章從單層神經網路延伸到多層神經網路，並通過多層感知機引入深度學習模型

《動手學深度學習》mxnet版/第五章學習筆記

第五章描述卷積神經網路中卷積層和池化層的工作原理，並解釋填充、步幅、輸入通道和輸出通道的含義

《動手學深度學習》mxnet版/第四章學習筆記

第四章概括深度學習計算的各個重要組成部分，如模型構造、引數的訪問和初始化等，自定義層，讀取、儲存和使用GPU

《動手學深度學習Pytorch版》之AlexNet預測結果展示

技術標籤：Pytorch深度學習python深度學習《動手學深度學習Pytorch版》https://github.com/ShusenTang/Dive-into-DL-PyTorch 為了檢視預測結果，在原Demo上加了預測顯示程式碼。注意：

《動手學深度學習》(TF2.0版)第二章

技術標籤：深度不學習第二章 import tensorflow as tf print(tf.__version__) 檢視TF的版本 2.2資料操作

動手學深度學習影象分類例項-多層感知機(三) 多層感知機的簡潔實現

技術標籤：深度學習深度學習神經網路機器學習人工智慧python 動手學深度學習影象分類例項-多層感知機(三) 多層感知機的簡潔實現

動手學深度學習 | 目錄 | 00

動手學深度學習 | 資料操作+資料預處理 | 02

目錄資料操作資料操作實現資料預處理實現QA 資料操作圖片是三維的： w*h*channel

動手學深度學習 | 線性代數 | 03

目錄線性代數線性代數實現按特定軸求和QA 線性代數其實我們不需要太多線性代數的知識，但是還是稍微講一下作為一個數學上的入門。

動手學深度學習 | Softmax迴歸+損失函式+圖片分類資料集 | 07

目錄Softmax迴歸損失函式圖片分類資料集Softmax迴歸從零開始實現Softmax迴歸簡潔實現QA

動手學深度學習 | 模型選擇+過擬合和欠擬合 | 09

目錄模型選擇過擬合和欠擬合QA 模型選擇我們其實關心的是泛化誤差，並不太關心訓練誤差。

動手學深度學習 | 使用和購買GPU | 15

目錄使用GPU購買GPU整機配置QA 使用GPU 其實如果沒有錢買GPU的話，使用Google Colab也是一個不錯的選擇，大概是10 dollar一個月。

動手學深度學習 | 預測房價競賽總結 | 16

目錄競賽總結QA 競賽總結我們講知識，也不可能所有東西都cover到，讓大家競賽不是讓大家去學某個特定的知識，而是說大家遇到一個問題，怎麼去找一個解決方案。這一次的解決方案和下一次的會不一樣，但是問題是你

動手學深度學習 | 語言模型 | 53

目錄語言模型程式碼QA 語言模型一隻猴子打字，就算是打到宇宙毀滅，他也打不出莎士比亞的文章。

動手學深度學習v2-08-自動求導

自動求導

1 向量鏈式法則

2 自動求導

2.1 自動求導的兩種模式

2.2 例子

2.3 非標量變數的反向傳播

2.4 分離計算

2.5 Python控制流的梯度計算

3 小結

相關推薦