Pytorch 多塊GPU的使用詳解

阿新 • • 發佈：2020-01-09

注：本文針對單個伺服器上多塊GPU的使用，不是多伺服器多GPU的使用。

在一些實驗中，由於Batch_size的限制或者希望提高訓練速度等原因，我們需要使用多塊GPU。本文針對Pytorch中多塊GPU的使用進行說明。

1. 設定需要使用的GPU編號

import os
 
os.environ["CUDA_VISIBLE_DEVICES"] = "0,4"
ids = [0,1]

比如我們需要使用第0和第4塊GPU，只用上述三行程式碼即可。

其中第二行指程式只能看到第1塊和第4塊GPU；

第三行的0即為第二行中編號為0的GPU；1即為編號為4的GPU。

2.更改網路，可以理解為將網路放入GPU

class CNN(nn.Module):
  def __init__(self):
    super(CNN,self).__init__()
    self.conv1 = nn.Sequential(
    ......
    )
    
    ......
    
    self.out = nn.Linear(Liner_input,2)
 
  ......
    
  def forward(self,x):
    x = self.conv1(x)
    ......
    output = self.out(x)
    return output,x
  
cnn = CNN()
 
# 更改，.cuda()表示將本儲存到CPU的網路及其引數儲存到GPU！
cnn.cuda()

3. 更改輸出資料(如向量/矩陣/張量):

for epoch in range(EPOCH):
  epoch_loss = 0.
  for i,data in enumerate(train_loader2):
    image = data['image'] # data是字典，我們需要改的是其中的image
 
    #############更改！！！##################
    image = Variable(image).float().cuda()
    ############################################
 
    label = inputs['label']
    #############更改！！！##################
    label = Variable(label).type(torch.LongTensor).cuda()
    ############################################
    label = label.resize(BATCH_SIZE)
    output = cnn(image)[0]
    loss = loss_func(output,label)  # cross entropy loss
    optimizer.zero_grad()      # clear gradients for this training step
    loss.backward()         # backpropagation,compute gradients
    optimizer.step() 
    ... ...

4. 更改其他CPU與GPU衝突的地方

有些函式必要在GPU上完成，例如將Tensor轉換為Numpy，就要使用data.cpu().numpy()，其中data是GPU上的Tensor。

若直接使用data.numpy()則會報錯。除此之外，plot等也需要在CPU中完成。如果不是很清楚哪裡要改的話可以先不改，等到程式報錯了，再哪裡錯了改哪裡，效率會更高。例如：

  ... ...
    #################################################
    pred_y = torch.max(test_train_output,1)[1].data.cpu().numpy()
    
    accuracy = float((pred_y == label.cpu().numpy()).astype(int).sum()) / float(len(label.cpu().numpy()))

假如不加.cpu()便會報錯，此時再改即可。

5. 更改前向傳播函式，從而使用多塊GPU

以VGG為例：

class VGG(nn.Module):
 
  def __init__(self,features,num_classes=2,init_weights=True):
    super(VGG,self).__init__()
... ...
 
  def forward(self,x):
    #x = self.features(x)
    #################Multi GPUS#############################
    x = nn.parallel.data_parallel(self.features,x,ids)
    x = x.view(x.size(0),-1)
    # x = self.classifier(x)
    x = nn.parallel.data_parallel(self.classifier,ids)
    return x
... ...

然後就可以看執行結果啦，nvidia-smi檢視GPU使用情況：

可以看到0和4都被使用啦

以上這篇Pytorch 多塊GPU的使用詳解就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

Pytorch 多塊GPU的使用詳解

注：本文針對單個伺服器上多塊GPU的使用，不是多伺服器多GPU的使用。在一些實驗中，由於Batch_size的限制或者希望提高訓練速度等原因，我們需要使用多塊GPU。本文針對Pytorch中多塊GPU的使用進行說明。

Java多執行緒詳解-入門篇

程式與執行緒在講多執行緒之前，我覺得有必要先說一下程式與執行緒之間的關係與差異。

當Mysql行鎖遇到複合主鍵與多列索引詳解

背景今天在配合其他專案組做系統壓測，過程中出現了偶發的死鎖問題。分析程式碼後發現有複合主鍵的update情況，更新複合主鍵表時只使用了一個欄位更新，同時在事務內又有對該表的insert操作，結果出現了偶發的死鎖

redission-tomcat快速實現從單機部署到多機部署詳解

前言一些專案初期出於簡單快速，都是做單機開發與部署，但是隨著業務的擴充套件或對可用性要求的提高，單機環境已不滿足需求。單機部署往多機部署切換，其中可能存在的一個重要環節就是session的共享（如果一開始就

oracle如何合併多個sys_refcursor詳解

一、背景在資料開發中，有時你需要合併兩個動態遊標sys_refcursor。開發一個儲存過程PROC_A,這個過程業務邏輯相當複雜，程式碼篇幅較長。一段時間後要開發一個PROC_B,要用PROC_A同樣的邏輯,而且在這個過程中，還要

pytorch之ImageFolder使用詳解

pytorch之ImageFolder torchvision已經預先實現了常用的Dataset，包括前面使用過的CIFAR-10，以及ImageNet、COCO、MNIST、LSUN等資料集，可通過諸如torchvision.datasets.CIFAR10來呼叫。在這裡介紹一個會經常使用到

pytorch AvgPool2d函式使用詳解

我就廢話不多說了，直接上程式碼吧！ import torch import torch.nn as nn import torch.nn.functional as F

Java農夫過河問題的繼承與多型實現詳解

題目描述：一個農夫帶著一匹狼、一隻羊、一顆白菜要過河，只有一條船而且農夫每次最多隻能帶一個動物或物品過河，並且當農夫不在的時候狼會吃羊，羊會吃白菜。，請設計程式，由使用者選擇角色過河，系統自動判斷遊

pytorch 常用線性函式詳解

Pytorch的線性函式主要封裝了Blas和Lapack，其用法和介面都與之類似。常用的線性函式如下：

Pytorch之finetune使用詳解

finetune分為全域性finetune和區域性finetune。首先介紹一下區域性finetune步驟： 1.固定引數

Vue-cli3多頁面配置詳解

Vue-cli3釋出已經好長時間了，筆者也在一直使用，由於公司業務需要要使用多頁面配置，於是花時間研究了一下Vue-cli3如何配置多頁面。由於Vue-cli3相比之前的版本做了很大的改動，在研究過程中也遇到一些問題。

SpringBoot2整合Redis多資料來源步驟詳解

redis是一個基於記憶體的高效能key-value資料庫，具有極高的讀寫速度。本文介紹 SpringBoot 和 Redis 的整合，以及如何在專案中具體應用

易語言“是否支援多使用者”命令詳解

檢查本支援庫所提供的資料庫功能是否支援多使用者同時對資料庫操作。如果支援，返回真，否則返回假。

Anaconda＋vscode＋pytorch環境搭建過程詳解

1、安裝Anaconda Anaconda指的是一個開源的Python發行版本，其包含了conda、Python等180多個科學包及其依賴項。在官網上下載https://www.anaconda.com/distribution/，因為伺服器在國外會很慢，建議從清華映象https:

Java多執行緒詳解總結

一、基本概念程式(program): 是為完成特定任務、用某種語言編寫的一組指令的集合。即指一段靜態的程式碼，靜態物件。

PyTorch的nn.Linear()詳解

1. nn.Linear() nn.Linear()：用於設定網路中的全連線層，需要注意的是全連線層的輸入與輸出都是二維張量

MySQL多表查詢詳解上

時光在不經意間，總是過得出奇的快。小暑已過，進入中暑，太陽更加熱烈的綻放著ta的光芒，...在外面被太陽照顧的人們啊，你們都是勤勞與可愛的人啊。在房子裡已各種姿勢看我這篇這章的你，既然點了進來，那就由我繼續

MySQL多表查詢詳解下

　　好好吃飯，好好休息，聽著很簡單，實際落實缺失不那麼容易。繼續回顧MySql的多表查詢之1999語法

多執行緒詳解

多執行緒詳解一、執行緒的簡介任務、程序、執行緒、多執行緒多工比如一邊吃飯，一邊玩手機；一邊上廁所一邊玩手機；現實生活中太多這樣同時做多件事情的例子了，看起來是多個任務都在做，其實本質上我們的大腦在

【轉】多圖+程式碼 | 詳解Python操作Excel神器openpyxl的各種操作！

轉自：https://blog.csdn.net/weixin_41846769/article/details/108273349 前言大家好，在之前的十幾篇辦公自動化系列文章中，我們大多是以真實的案例需求來講解Python如何進行自動化辦公操作，並且多次使用到openp

Pytorch 多塊GPU的使用詳解

相關推薦