1 pytorch60分鐘入門教程

阿新 • • 發佈：2019-02-12

1 Tensors

from __future__ import print_function
import torch
x = torch.Tensor(5, 3)  # 構造一個未初始化的5*3的矩陣
x = torch.rand(5, 3)  # 構造一個隨機初始化的矩陣

 0.9643  0.2740  0.9700
 0.2375  0.8547  0.1793
 0.2462  0.8887  0.0271
 0.8668  0.6014  0.9562
 0.8588  0.3883  0.3741
[torch.FloatTensor of size 5x3]

x.size()

torch.Size([5, 3])

y = torch.rand(5,3)

 0.3458  0.1517  0.1397
 0.6764  0.6408  0.0139
 0.6116  0.4172  0.8836
 0.9197  0.6072  0.0751
 0.7214  0.0613  0.4052
[torch.FloatTensor of size 5x3]

x+y

 1.3101  0.4257  1.1097
 0.9139  1.4955  0.1932
 0.8578  1.3060  0.9108
 1.7865  1.2086  1.0312
 1.5802  0.4495  0.7793
[torch.FloatTensor of size 5x3]

torch.add(x,y)

 1.3101  0.4257  1.1097
 0.9139  1.4955  0.1932
 0.8578  1.3060  0.9108
 1.7865  1.2086  1.0312
 1.5802  0.4495  0.7793
[torch.FloatTensor of size 5x3]

z = x+y

 1.3101  0.4257  1.1097
 0.9139  1.4955  0.1932
 0.8578  1.3060  0.9108
 1.7865  1.2086  1.0312
 1.5802  0.4495  0.7793
[torch.FloatTensor of size 5x3]

result = torch.Tensor(5, 3) # 語法一
torch.add(x, y, out=result) # 語法二
result

 1.3101  0.4257  1.1097
 0.9139  1.4955  0.1932
 0.8578  1.3060  0.9108
 1.7865  1.2086  1.0312
 1.5802  0.4495  0.7793
[torch.FloatTensor of size 5x3]

y.add_(x) # 將y與x相加

# 特別註明：任何可以改變tensor內容的操作都會在方法名後加一個下劃線'_'
# 例如：x.copy_(y), x.t_(), 這倆都會改變x的值。
y

 1.3101  0.4257  1.1097
 0.9139  1.4955  0.1932
 0.8578  1.3060  0.9108
 1.7865  1.2086  1.0312
 1.5802  0.4495  0.7793
[torch.FloatTensor of size 5x3]

x[:1]

 0.9643  0.2740  0.9700
[torch.FloatTensor of size 1x3]

2 Tensor與numpy的轉換

注意Torch的Tensor和numpy的array會共享他們的儲存空間，修改一個會導致另外的一個也被修改。

a = torch.ones(5)
b = a.numpy()
a,b

(
  1
  1
  1
  1
  1
 [torch.FloatTensor of size 5],
 array([ 1.,  1.,  1.,  1.,  1.], dtype=float32))

import numpy as np
a = np.ones(5)
b = torch.from_numpy(a)
a,b

(array([ 1.,  1.,  1.,  1.,  1.]), 
  1
  1
  1
  1
  1
 [torch.DoubleTensor of size 5])

# 另外除了CharTensor之外，所有的tensor都可以在CPU運算和GPU預算之間相互轉換
# 使用CUDA函式來將Tensor移動到GPU上
# 當CUDA可用時會進行GPU的運算
if torch.cuda.is_available():
    x = x.cuda()
    y = y.cuda()
    x + y

3 PyTorch中的神經網路

PyTorch中所有的神經網路都來自於autograd包

autograd自動梯度計算，這是一個執行時定義的框架，這意味著你的反向傳播是根據你程式碼執行的方式來定義的，因此每一輪迭代都可以各不相同。

from torch.autograd import Variable
x = Variable(torch.ones(2,2),requires_grad = True)
y = x + 2
y.creator

<torch.autograd._functions.basic_ops.AddConstant at 0x3dad3f0>

z = y*y*3
out = z.mean()
out

Variable containing:
 27
[torch.FloatTensor of size 1]

out.backward()

x.grad

Variable containing:
 4.5000  4.5000
 4.5000  4.5000
[torch.FloatTensor of size 2x2]

x = torch.randn(3)
# print(x)
x = Variable(x, requires_grad = True)
y = x * 2
while y.data.norm() < 1000:
    y = y * 2
#     print (y)
gradients = torch.FloatTensor([0.1, 1.0, 0.0001])
y.backward(gradients)
x.grad

Variable containing:
  204.8000
 2048.0000
    0.2048
[torch.FloatTensor of size 3]

這裡y.backward(gradients)這句話有什麼用呢？？？

y, y.data, y.data.norm()

(Variable containing:
  1546.1327
  -304.6176
   642.7925
 [torch.FloatTensor of size 3], 
  1546.1327
  -304.6176
   642.7925
 [torch.FloatTensor of size 3], 1701.9108254060725)

4 神經網路

使用 torch.nn 包可以進行神經網路的構建。

現在你對autograd有了初步的瞭解，而nn建立在autograd的基礎上來進行模型的定義和微分。

nn.Module中包含著神經網路的層，同時forward(input)方法能夠將output進行返回。

舉個例子，來看一下這個數字影象分類的神經網路。

一個典型的神經網路的訓練過程是這樣的：

定義一個有著可學習的引數（或者權重）的神經網路
對著一個輸入的資料集進行迭代:
用神經網路對輸入進行處理
計算代價值 (對輸出值的修正到底有多少)
將梯度傳播回神經網路的引數中
更新網路中的權重
通常使用簡單的更新規則: weight = weight + learning_rate * gradient

import torch.nn as nn
import torch.nn.functional as F

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(1, 6, 5) # 1 input image channel, 6 output channels, 5x5 square convolution kernel
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1   = nn.Linear(16*5*5, 120) # an affine operation: y = Wx + b
        self.fc2   = nn.Linear(120, 84)
        self.fc3   = nn.Linear(84, 10)

    def forward(self, x):
        x = F.max_pool2d(F.relu(self.conv1(x)), (2, 2)) # Max pooling over a (2, 2) window
        x = F.max_pool2d(F.relu(self.conv2(x)), 2) # If the size is a square you can only specify a single number
        x = x.view(-1, self.num_flat_features(x))
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

    def num_flat_features(self, x):
        size = x.size()[1:] # all dimensions except the batch dimension
        num_features = 1
        for s in size:
            num_features *= s
        return num_features

net = Net()
net

Net (
  (conv1): Conv2d(1, 6, kernel_size=(5, 5), stride=(1, 1))
  (conv2): Conv2d(6, 16, kernel_size=(5, 5), stride=(1, 1))
  (fc1): Linear (400 -> 120)
  (fc2): Linear (120 -> 84)
  (fc3): Linear (84 -> 10)
)

x = x.view(-1, self.num_flat_features(x))應該是把x打平吧

僅僅需要定義一個forward函式就可以了，backward會自動地生成。

你可以在forward函式中使用所有的Tensor中的操作。

模型中可學習的引數會由net.parameters()返回。m

params = list(net.parameters())
print(len(params))
print(params[0].size()) # conv1's .weight

input = Variable(torch.randn(1, 1, 32, 32))
out = net(input)

10
torch.Size([6, 1, 5, 5])

out

Variable containing:
 0.0648  0.0148  0.0333  0.0013  0.0563 -0.0156  0.0543  0.1504 -0.0774 -0.0231
[torch.FloatTensor of size 1x10]

複習一下前面我們學到的：

torch.Tensor - 一個多維陣列

autograd.Variable - 改變Tensor並且記錄下來操作的歷史記錄。和Tensor擁有相同的API，以及backward()的一些API。同時包含著和張量相關的梯度。

nn.Module - 神經網路模組。便捷的資料封裝，能夠將運算移往GPU，還包括一些輸入輸出的東西。

nn.Parameter - 一種變數，當將任何值賦予Module時自動註冊為一個引數。

autograd.Function - 實現了使用自動求導方法的前饋和後饋的定義。每個Variable的操作都會生成至少一個獨立的Function節點，與生成了Variable的函式相連之後記錄下操作歷史。

到現在我們已經明白的部分:

定義了一個神經網路。

處理了輸入以及實現了反饋。

仍然沒整的:

計算代價。

更新網路中的權重。

5 計算每個引數的梯度

output = net(input)
target = Variable(torch.range(1, 10))  # a dummy target, for example
criterion = nn.MSELoss()
loss = criterion(output, target)
loss

Variable containing:
 38.2952
[torch.FloatTensor of size 1]

input -> conv2d -> relu -> maxpool2d -> conv2d -> relu -> maxpool2d
-> view -> linear -> relu -> linear -> relu -> linear
-> MSELoss
-> loss

print(loss.creator) # MSELoss
print(loss.creator.previous_functions[0][0]) # Linear
print(loss.creator.previous_functions[0][0].previous_functions[0][0]) # ReLU

<torch.nn._functions.thnn.auto.MSELoss object at 0x31dd6878>
<torch.nn._functions.linear.Linear object at 0x31dd6790>
<torch.nn._functions.thnn.auto.Threshold object at 0x31dd66a8>

# 現在我們應當呼叫loss.backward(), 之後來看看 conv1's在進行反饋之後的偏置梯度如何
net.zero_grad() # 歸零操作
print('conv1.bias.grad before backward')
print(net.conv1.bias.grad)
loss.backward()
print('conv1.bias.grad after backward')
print(net.conv1.bias.grad)

conv1.bias.grad before backward
None
conv1.bias.grad after backward
Variable containing:
 0.2046
 0.0389
-0.0529
-0.0108
-0.0941
-0.0869
[torch.FloatTensor of size 6]

第一層的bias的個數剛好是6個，這裡已經給出了每個引數的梯度，這樣就可以以固定的學習率來更新了。感覺深度學習框架的牛逼之處就在於寫好了自動求梯度的東西了麼？

loss.backward就可以計算每一層的梯度了，更新還沒解決。

6 更新引數

最簡單的更新的規則是隨機梯度下降法(SGD):

weight = weight - learning_rate * gradient

我們可以用簡單的python來表示:

learning_rate = 0.01

for f in net.parameters():

f.data.sub_(f.grad.data * learning_rate)

可以用torch.optim來實現

import torch.optim as optim
# create your optimizer
optimizer = optim.SGD(net.parameters(),lr = 0.01)

# in your training loop:
optimizer.zero_grad() # zero the gradient buffers
output = net(input)
loss = criterion(output,target)
loss.backward()
optimizer.step()# Does the update

總結一下

輸入：

input = Variable(torch.randn(1, 1, 32, 32))

輸出：

out = net(input)

網路結構

class Net(nn.Module):

    def __init__(self):

    def forward(self, x):

    barkward自己會完成

更新

optimizer = optim.SGD(net.parameters(),lr = 0.01)

optimizer.zero_grad()

loss.backward()

optimizer.step()# Does the update

1 pytorch60分鐘入門教程

1 Tensors from __future__ import print_function import torch x = torch.Tensor(5, 3) # 構造一個未初始化的5*3的矩陣 x = torch.rand(5, 3) # 構

pytorch60分鐘入門1

""" 在開頭加上from __future__ import print_function這句之後，即使在py

正則表達式30分鐘入門教程

位數 explicit 模式 his tca 再次 miss 影響註釋 deerchao的blog Be and aware of who you are. 正則表達式30分鐘入門教程來園子之前寫的一篇正則表達式教程，部分翻譯自codeproje

ECMAScript6 ES6 30分鐘入門教程

剛開始用vue或者react，很多時候我們都會把ES6這位大兄dei加入我們的技術棧中。但是ES6那麼多那麼多特性，我們真的需要全部都掌握嗎？秉著二八原則，掌握好常用的、有用的這個可以讓我們的開發快速起飛。接下來我們就聊聊ES6那些可愛的新特性吧。 1.變數宣告cons

PyTorch 60 分鐘入門教程：資料並行處理

可選擇：資料並行處理（文末有完整程式碼下載）作者：Sung Kim 和 Jenny Kang 在這個教程中，我們將學習如何用 DataParallel 來使用多 GPU。通過 PyTorch 使用多個 GPU 非常簡單。你可以將模型放在一個 GPU： device = torch.

PyTorch 60 分鐘入門教程：PyTorch 深度學習官方入門中文教程

什麼是 PyTorch? PyTorch 是一個基於 Python 的科學計算包，主要定位兩類人群： NumPy 的替代品，可以利用 GPU 的效能進行計算。深度學習研究平臺擁有足夠的靈活性和速度開始學習 Tensors (張量)

PyTorch 60 分鐘入門教程

PyTorch 60 分鐘入門教程：PyTorch 深度學習官方入門中文教程 http://pytorchchina.com/2018/06/25/what-is-pytorch/ PyTorch 60 分鐘入門教程：自動微分 http://pytorchchina.com/2018/12/25/autogr

Tomcat學習總結（1）——Tomcat入門教程

一、Tomcat伺服器埠的配置　　Tomcat的所有配置都放在conf資料夾之中，裡面的server.xml檔案是配置的核心檔案。　　如果想修改Tomcat伺服器的啟動埠，則可以在server.xml配

正則表示式30分鐘入門教程

目錄跳過目錄本文目標 30分鐘內讓你明白正則表示式是什麼，並對它有一些基本的瞭解，讓你可以在自己的程式或網頁裡使用它。如何使用本教程最重要的是——請給我30分鐘，如果你沒有使用正則表示式的經驗，請不要試圖在30秒內入門——除非你是超人 :) 別被下面那些複雜的表示式嚇倒，只要跟著我一步一步來，你

AWS十分鐘入門教程_AWS雲端計算資源

Amazon Web Services 誠聘精英。 Amazon Web Services (AWS) 是 Amazon.com 的一個充滿活力、不斷壯大的業務部門。我們現誠聘軟體開發工程師、產品經理、客戶經理、解決方案架構師、支援工程師、系統工程師以及設計師等人才。請訪問我

Gradle 15分鐘入門教程

1-Gradle入門介紹本教程的目標：這是專案完成後的程式碼結構圖： 2-建立Gradle專案開啟 Eclipse，單擊並選擇選單 File->New->Other 並選擇 Gradle Project 如下圖所示 - 點選下一步

R正則表示式30分鐘入門教程

一、正則表示式到底是什麼東西？在編寫處理字串的程式或網頁時，經常會有查詢符合某些複雜規則的字串的需要。正則表示式就是用於描述這些規則的工具。換句話說，正則表示式就是記錄文字規則的程式碼。很可能你使用過Windows/Dos下用於檔案查詢的萬用字元(wildcard)

ThinkPHP3.1快速入門教程

pan html manual thinkphp 教程 font 入門教程入門 href ThinkPHP3.1快速入門教程 http://www.thinkphp.cn/info/155.html -----------------------

【PHP面向對象(OOP)編程入門教程】1.什麽是面向對象？

php 面向對象面向對象編程（Object Oriented Programming, OOP, 面向對象程序設計）是一種計算機編程架構，OOP的一條基本原則是計算機程序是由單個能夠起到子程序作用的單元或對象組合而成，OOP達到了軟件工程的三個目標：重用性、靈活性和擴展性。為了實現整體運算，

《Typecript 入門教程》 1、類

col ons con types 構造函數 ima src 方法 cnblogs 類使用class + 類名即可定義一個類，一個類中通常有3個成員：屬性、構造函數、方法；在類內部引用屬性或方法事使用this調用，它表示我們訪問的是類的成員。我們使用new構造了Gr

iOS開發-OpenGL ES入門教程1

貼圖 iba 細節 con osi tutorial name rip tex http://www.jianshu.com/p/750fde1d8b6a 這裏是一篇新手教程，環境是Xcode7+OpenGL ES 2.0，目標寫一個OpenGL ES的hello wor

python入門教程學習筆記#1

ext game 2.7 功能 sublime wxpython 程序免費圖形界面下載地址：https://www.python.org/，版本可選擇3.6或2.7 1.2 編譯環境pycharm 下載地址：https://www.jetbrains.com/p

Node入門教程(1)目錄

path 概述 (下) tab 建議 nod shu 詳解 IT aicoder.com 全棧實習之簡明 Node 入門文檔 aicoder.com 線下實習：不 8000 就業，不還實習費。如果需要轉載本文檔，請聯系老馬，Q： 515154084 JS基礎教程

Spring Boot 2.0.1 入門教程

代碼生成 -i Coding fig IT code location sta -a 簡介 Spring Boot是Spring提供的一套基礎配置環境，可以用來快速開發生產環境級別的產品。尤其適合開發微服務架構，省去了不少配置麻煩。比如用到Spring MVC時，只需把sp

《TypeScript 中文入門教程》 1、基礎數據類型

數據技術分享 scrip bstr 聯合卻又 true 單引號介紹轉載：https://github.com/MyErpSoft/TypeScript-Handbook/blob/master/pages/zh-CHS/Basic%20Types.md 概述為了

1 pytorch60分鐘入門教程

1 Tensors

2 Tensor與numpy的轉換

3 PyTorch中的神經網路

4 神經網路

5 計算每個引數的梯度

6 更新引數

可以用torch.optim來實現

總結一下

相關推薦