pytorch 限制GPU使用效率詳解(計算效率)

阿新 • • 發佈：2020-06-28

問題

用過 tensorflow 的人都知道， tf 可以限制程式在 GPU 中的使用效率，但 pytorch 中沒有這個操作。

思路

於是我想到了一個代替方法，玩過微控制器點燈的同學都知道，燈的亮度是靠佔空比實現的，這實際上也是計算機的執行原理。那我們是不是也可以通過增加 GPU 不工作的時間，進而降低 GPU 的使用效率？

主要程式碼

import time
...
rest_time = 0.15
...
for _ in range( XXX ):
  ...
  outputs = all_GPU_operations( data_set ) # 假設所有的GPU運算都在這裡
  time.sleep( rest_time )         # 讓顯示卡休息一會再進行下個迴圈的使用
  ...
...

這樣子 GPU 的使用效率就可以減小了。

rest_time 的越大 GPU 使用率越低，rest_time 的越小 GPU 使用率越高。

缺點是很難直接控制 GPU 的具體使用率，rest_time 得自己除錯後確定。

補充知識：深度學習PyTorch，TensorFlow中GPU利用率較低,使用率週期性變化的問題

在用tensorflow訓練神經網路時,發現訓練迭代的速度時而快時而慢,監督的GPU使用率也是週期性變化,通過了解,發現原因是:

GPU在等待CPU讀取,預處理,並傳輸資料過來,因此要提高GPU的使用率,降低GPU的等待時間,需要加快CPU的處理速度.

在PYTORCH中的解決方案是用torch.utils.data.DataLoader,用num_workers設定執行緒數:

torch.utils.data.DataLoader(image_datasets[x],batch_size=batch_size,shuffle=True,num_workers=8,pin_memory=True)

在tensorflow中的解決方案是用tf.data.Dataset.map(num_parallel_calls=8)中的num_parallel_calls設定讀取資料的執行緒數:

用 tf.data讀取資料,tf.data.Dataset中有一個map函式,它有個num_parallel_calls引數,可以控制CPU的執行緒,加快資料的讀取速度,一般將執行緒設定為8效果最好.

以上這篇pytorch 限制GPU使用效率詳解(計算效率)就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

pytorch 限制GPU使用效率詳解(計算效率)

問題用過 tensorflow 的人都知道， tf 可以限制程式在 GPU 中的使用效率，但 pytorch 中沒有這個操作。

Python列表倒序輸出及其效率詳解

Python列表倒序輸出及其效率方法一使用Python內建函式reversed（） for i in reversed(arr): pass

redis 實現登陸次數限制的思路詳解

title: redis-login-limitation 利用 redis 實現登陸次數限制,註解 + aop,核心程式碼很簡單.

pytorch之ImageFolder使用詳解

pytorch之ImageFolder torchvision已經預先實現了常用的Dataset，包括前面使用過的CIFAR-10，以及ImageNet、COCO、MNIST、LSUN等資料集，可通過諸如torchvision.datasets.CIFAR10來呼叫。在這裡介紹一個會經常使用到

pytorch AvgPool2d函式使用詳解

我就廢話不多說了，直接上程式碼吧！ import torch import torch.nn as nn import torch.nn.functional as F

pytorch 常用線性函式詳解

Pytorch的線性函式主要封裝了Blas和Lapack，其用法和介面都與之類似。常用的線性函式如下：

Pytorch之finetune使用詳解

finetune分為全域性finetune和區域性finetune。首先介紹一下區域性finetune步驟： 1.固定引數

Anaconda＋vscode＋pytorch環境搭建過程詳解

1、安裝Anaconda Anaconda指的是一個開源的Python發行版本，其包含了conda、Python等180多個科學包及其依賴項。在官網上下載https://www.anaconda.com/distribution/，因為伺服器在國外會很慢，建議從清華映象https:

PyTorch的nn.Linear()詳解

1. nn.Linear() nn.Linear()：用於設定網路中的全連線層，需要注意的是全連線層的輸入與輸出都是二維張量

【小白學PyTorch】12 SENet詳解及PyTorch實現

文章來自微信公眾號【機器學習煉丹術】。我是煉丹兄，有什麼問題都可以來找我交流，近期建立了微信交流群，也在朋友圈抽獎贈書十多本了。我的微信是cyx645016617，歡迎各位朋友。

JavaScript 上傳檔案限制引數案例詳解

專案場景： 1，上傳檔案限制功能作用： 1，防止前端操作上傳異常檔案 2，限制符合的規則，優化展示模型

Pytorch——torch.nn.Sequential()詳解

參考：官方文件原始碼官方文件 nn.Sequential 　　A sequential container. Modules will be added to it in the order they are passed in the constructor. Alternatively, an ordered dict of modules can als

詳解計算miou的程式碼以及混淆矩陣的意義

詳解計算miou的程式碼以及混淆矩陣的意義 miou的定義 \'\'\' Mean Intersection over Union(MIoU，均交併比)：為語義分割的標準度量。其計算兩個集合的交集和並集之比.

pytorch中的卷積和池化計算方式詳解

TensorFlow裡面的padding只有兩個選項也就是valid和same pytorch裡面的padding麼有這兩個選項，它是數字0,1,2,3等等，預設是0

在Pytorch中計算卷積方法的區別詳解(conv2d的區別)

在二維矩陣間的運算： class torch.nn.Conv2d(in_channels,out_channels,kernel_size,stride=1,padding=0,dilation=1,groups=1,bias=True)

pytorch中交叉熵損失(nn.CrossEntropyLoss())的計算過程詳解

公式首先需要了解CrossEntropyLoss的計算過程，交叉熵的函式是這樣的：其中，其中yi表示真實的分類結果。這裡只給出公式，關於CrossEntropyLoss的其他詳細細節請參照其他博文。

Pytorch 多塊GPU的使用詳解

注：本文針對單個伺服器上多塊GPU的使用，不是多伺服器多GPU的使用。在一些實驗中，由於Batch_size的限制或者希望提高訓練速度等原因，我們需要使用多塊GPU。本文針對Pytorch中多塊GPU的使用進行說明。

Python 中list ,set,dict的大規模查詢效率對比詳解

很多時候我們可能要頻繁的進行元素的find 或in操作，本人一直天真的以為python的list做了hash，通過紅黑樹來高效查詢···直到今天我真正來測試它和set,dict的查詢效率時，才發現自已想太多了！！！！

pytorch的梯度計算以及backward方法詳解

基礎知識 tensors： tensor在pytorch裡面是一個n維陣列。我們可以通過指定引數reuqires_grad=True來建立一個反向傳播圖，從而能夠計算梯度。在pytorch中一般叫做dynamic computation graph(DCG)——即動態計算圖。

Pytorch | 詳解Pytorch科學計算包——Tensor

本文始發於個人公眾號：TechFlow，原創不易，求個關注今天是Pytorch專題的第二篇，我們繼續來瞭解一下Pytorch中Tensor的用法。

pytorch 限制GPU使用效率詳解(計算效率)

相關推薦