【DeepLearning】【PyTorch (1)】PyTorch官方教程個人筆記

PyTorch 官方教程 Getting Started 第一部分 Deep Learning with PyTorch: A 60 Minute Blitz 筆記

文章目錄

1. What is PyTorch?
2. Autograd: Automatic Differentiation
3. Neural Networks
4. Training a Classifier
5. Optional: Data Parallelism

1. What is PyTorch?

PyTorch 是基於 Python 的科學計算包，目的有兩個：

神經網路上的NumPy.
敏捷高效的深度學習框架.

PyTorch是Torch在Python上的移植，Torch是基於Lua語言的的深度學習框架。因此，PyTorch繼承了Torch靈活的動態圖特性，與Python語言簡潔的語法特性。基於這兩個特性，PyTorch可以輕鬆地與NumPy互動。NumPy將array放入CPU加速計算，PyTorch將Tensor放入GPU加速計算

PyTorch 和 TensorFlow 類似，使用 Tensor 組織資料。Tensor(張量) 和 NumPy 的 ndarray(多維陣列) 相似。

torch package 包含基於高維張量的資料結構和計算它們的操作方式，預設使用 CPU 計算。它們也有 CUDA 版本，可以使用 GPU 計算。

from __future__ import print_function
import torch

建立未初始化的 5x3 矩陣:

x = torch.empty(5, 3)
print(x)

Out:

tensor([[4.1371e-07, 4.5822e-41, 6.7807e-06],
        [4.5822e-41, 0.0000e+00, 0.0000e+00],
        [0.0000e+00, 0.0000e+00, 0.0000e+00],
        [0.0000e+00, 0.0000e+00, 0.0000e+00],
        [0.0000e+00, 0.0000e+00, 0.0000e+00]])

建立隨機初始化的矩陣:

x = torch.rand(5, 3)
print(x)

Out:

tensor([[0.3814, 0.6408, 0.5860],
        [0.4887, 0.5330, 0.8477],
        [0.5300, 0.5962, 0.5901],
        [0.3305, 0.5589, 0.7821],
        [0.4265, 0.6637, 0.2600]])

建立0矩陣初始化的矩陣，資料型別為長整型:

x = torch.zeros(5, 3, dtype=torch.long)
print(x)

Out:

tensor([[0, 0, 0],
        [0, 0, 0],
        [0, 0, 0],
        [0, 0, 0],
        [0, 0, 0]])

建立矩陣，從 Python 資料結構獲得資料:

x = torch.tensor([5.5, 3])
print(x)

Out:

tensor([5.5000, 3.0000])

上面所建立x是一個torch.Tensor。它就是高維張量，其每一個元素的資料型別都相同。
Torch 定義了8位CPU張量型別和8位GPU張量型別。點選這裡。

print(type(x))

Out

<class 'torch.Tensor'>

每個torch.Tensor都有它的torch.dtype、torch.device和torch.layout，這些都是它的屬性(Tensor Attributes)

2. Autograd: Automatic Differentiation

Autograd: Automatic Differentiation

與TensorFlow的靜態圖方式不同，PyTorch使用動態圖的方式計算梯度反向傳播。

PyTorch的動態圖特性依賴其自動微分機制(Autograd mechanics)。動微分機制(Autograd mechanics)具體由torch.autograd包實現。

將torch.Tensor的.requires_grad屬性設定為True，將開始跟蹤在這個tensor上的所有operations。當完成對這個tensor的所有operatio後，呼叫.backward()，自動計算它的所有梯度，它的梯度值積累儲存在.grad屬性裡。

呼叫.detach()停止追蹤計算曆史。

將程式碼塊包裹在with torch.no_grad():內，可以強制停止追蹤計算曆史，即使程式碼塊內的tensor的requires_grad=True。

torch.autograd.Function類對自動微分機制(Autograd mechanics)非常重要。

Tensor和Function是相互連線的，共同建立一個無環的計算圖。每個tensor都有一個.grad_fn屬性，關聯到建立這個Tensor的Function上。如果這個Tensor不是由Function建立的，而是由使用者建立的，則它的grad_fn = None。

數學上，如果有一個向量值函式 $\vec{y}=f(\vec{x})$ ， $\vec{y}$ 對每個 $\vec{x}$ 的梯度組成一個雅克比矩陣(Jacobian matrix):
$J =\left(\begin{array}{ccc} \frac{\partial y_{1}}{\partial x_{1}} & \cdots & \frac{\partial y_{m}}{\partial x_{1}}\\ \vdots & \ddots & \vdots\\ \frac{\partial y_{1}}{\partial x_{n}} & \cdots & \frac{\partial y_{m}}{\partial x_{n}} \end{array}\right)$

一般地，torch.autograd是計算雅克比矩陣-向量內積的引擎。也就是說，給定任意向量 $v=\left(\begin{array}{cccc} v_{1} & v_{2} & \cdots & v_{m}\end{array}\right)^{T}$ ，計算內積 $J\cdot v$ 。當 $v$ 是標量函式 $l=g\left(\vec{y}\right)$ 的梯度時，也就是， $v=\left(\begin{array}{ccc}\frac{\partial l}{\partial y_{1}} & \cdots & \frac{\partial l}{\partial y_{m}}\end{array}\right)^{T}$ ，那麼，根據鏈式法則，雅克比矩陣-向量內積就是 $l$ 對 $\vec{x}$ 的梯度：

$J\cdot v=\left(\begin{array}{ccc} \frac{\partial y_{1}}{\partial x_{1}} & \cdots & \frac{\partial y_{m}}{\partial x_{1}}\\ \vdots & \ddots & \vdots\\ \frac{\partial y_{1}}{\partial x_{n}} & \cdots & \frac{\partial y_{m}}{\partial x_{n}} \end{array}\right)\left(\begin{array}{c} \frac{\partial l}{\partial y_{1}}\\ \vdots\\ \frac{\partial l}{\partial y_{m}} \end{array}\right)=\left(\begin{array}{c} \frac{\partial l}{\partial x_{1}}\\ \vdots\\ \frac{\partial l}{\partial x_{n}} \end{array}\right)$

【DeepLearning】【PyTorch (1)】PyTorch官方教程個人筆記

文章目錄

1. What is PyTorch?

2. Autograd: Automatic Differentiation

【DeepLearning】【PyTorch (1)】PyTorch官方教程個人筆記

【原創 Spark動手實踐 1】Hadoop2.7.3安裝部署實際動手

【二分匹配入門專題1】G - Asteroids poj3041【最小頂點覆蓋】

【mNOIP模擬賽Day 1】 T2 數顏色

【luogu P3372 線段樹1】模板

【數據結構總結1】-數據結構的自述

AD9854原理圖、PCB設計原始檔，AD9854的簡要介紹及使用心得和一些建議——【電路模組使用心得1】

【ML模型詳細推導1】- 線性迴歸

【java自定義註解1】java自定義註解-屬性

【Untiy3d-編輯器相關1】Unity中的一些特殊的資料夾

題解 P3372 【【模板】線段樹 1】

【Java學習之路---1】List的ArrayList和LinkedList的KTV點歌系統修改

AD17軟體選中原理圖中的器件從而選中PCB中的封裝點亮顯示【Altium designer 小技巧1】

Ancient Cipher 【字串+排序】【紫書例題4.1】

【飛機設計知識學習1】伺服彈性試驗

【C++ 程式語言學習1】

【機器學習】【層次聚類演算法-1】HCA(Hierarchical Clustering Alg)的原理講解 + 示例展示數學求解過程

【ML經典書籍系列1】解讀PRML

演算法題：求一個整數陣列中，通過元素加減運算得到指定結果的所有運算過程. 例如【5,4,6,7,1】= 9 ?

【第十週專案1】二叉樹演算法驗證（一）

【DeepLearning】【PyTorch (1)】PyTorch官方教程個人筆記

文章目錄

1. What is PyTorch?

2. Autograd: Automatic Differentiation

相關推薦