pytorch high memory usage but low volatile gpu-util

阿新 • • 發佈：2019-02-09

問題：pytorch程式GPU的使用率很低。

如圖，我使用5、6號顯示卡執行pytorch的程式，GPU使用率很低；而其他顯示卡跑的tensorflow網路，GPU使用率都正常。

一般情況下，深度學習遇到這種問題，上來都會認為是dataloader讀資料的效率問題：由於讀取資料耗時教久，往往程式不能執行GPU上深度網路的計算程式碼。

探索：

使用7號顯示卡debug該pytorch程式，輸出每次迭代讀取資料與網路計算消耗的時間。結果顯示

1.讀取資料的時間比網路計算少兩個數量級

2.期間7號顯示卡顯示卡使用率也很正常

3.期間5，6號顯示卡的使用率也回升了

關閉7號顯示卡上的程式後，發現

1. 5，6號顯示卡的使用率隨即下降

2. 7號顯示卡偶爾有3%的volatile gpu-util

我感覺應該是有程式在使用7號顯示卡，同時也會導致5、6號顯示卡使用率下降。

解決方案：

這個nvidia forum中提到，應該是GPU預設打開了ECC(error correcting code, 錯誤檢查和糾正),會佔用視訊記憶體和降低顯示卡效能，開啟Persistence Mode Enabled（用root執行nvidia-smi -pm 1）後5、6號顯示卡的顯示卡使用率恢復正常水平，問題解決。

疑問：

1.為什麼tensorflow的程式不會被ECC影響？

2.為什麼在7號顯示卡上執行pytorch程式後，其他顯示卡的使用率都會恢復正常？

後面有空的話可以查下這兩個問題。

pytorch high memory usage but low volatile gpu-util

問題：pytorch程式GPU的使用率很低。如圖，我使用5、6號顯示卡執行pytorch的程式，GPU使用率很低；而其他顯示卡跑的tensorflow網路，GPU使用率都正常。一般情況下，深度學習遇到這種問題，上來都會認為是dataloader讀資料的效率問題：

SEVERE:Memory usage is low, parachute is non existent, your system may start failing.

問題描述：之前在進行工程改造的時候，加入了FeignClient後，訪問swagger頁面的時候，一直報這個錯誤。網上查了下說是記憶體溢位，於是把-Xms和-Xmx的值調到了1024m都不行，最後發現是-XX:MaxPerSize這個引數的問題，於是設定了

How to Limit NodeRunner.exe High Memory, CPU Usage

roc limited ecif take ref star level program setting roblem: NodeRunner.exe is consuming a lot of memory and CPU resulted in performance

linux high memory/ low memory

linux核心的high memory概念詳解 - 鐵匠Smith先生的專欄 - 部落格頻道 - CSDN.NEThttp://blog.csdn.net/acs713/article/details/8575235

Why does the memory usage increase when I redeploy a web application?

man weakref solution read cannot erro try cto tag That is because your web application has a memory leak. A common issue are "PermGen"

pytorch筆記：06)requires_grad和volatile

requires_grad Variable變數的requires_grad的屬性預設為False,若一個節點requires_grad被設定為True，那麼所有依賴它的節點的requires_grad都為True。 x=Variable(torch.ones(1)) w=Vari

linux核心的high memory概念詳解

32位的CPU，最大定址範圍為2^32 - 1也就是4G的線性地址空間。Linux簡化了分段機制，使得虛擬地址與線性地址總是一致的。linux一般把這個4G的地址空間劃分為兩個部分：其中0～3G為使用者程式地址空間，虛地址0x00000000到0xBFFFFF

Ask HN: How to assure a high software quality in low power embedded platforms?

What are the best practices for ensuring a high quality of embedded software in environments like ARM Cortex-M, PIC32 etc.? Manual testing? Unit testing in

Amazon EC2 High Memory Instances with 6, 9, and 12 TB of Memory, Perfect for SAP HANA | AWS News Blog

The Alt

Amazon EC2 High Memory Instances

EC2 High Memory instances offer 6 TB, 9 TB, and 12 TB of memory in an instance. These instances are purpose-built to run large in-memory databases

Kafka High Level API vs. Low Level API

目錄: 1.ConsumerApi 2.High Level Consumer (遮蔽細節管理) 3.Low Level API (細節需要自己處理) 1.Kafka提供了兩種Consumer API High Level Consumer API

Pytorch入門學習（四）---- 多GPU的使用

DataParrallel import torch.nn as nn class DataParallelModel(nn.Module): def __init__(self):

ERROR BrokerService : Memory Usage for the Broker (1024 mb) is more th

出現這個錯誤，網上搜到的都是外國的一些解決方案，但是都不靠譜！！！我的server.xml 埠怕跟專案中的配置錯誤 <Connector port="8080" protocol="HTTP/1.1" connectionT

為什麽在 Java 中用 (low+high)>>>1 代替 (low+high)/2 或 (low+high)>>1 來計算平均值呢？好在哪裏？

println nbsp 溢出單獨執行出現效率 void 們的 >>>與>>是位運算符，只對整型有效（不能用於浮點型）。當是整型的時候(low+high)>>1可以代替(low+high)/2。>>>是無符

a low memory warning should only destroy the layer’s bitmap

set ble receive per bitmap cut ins esp port https://stablekernel.com/view-controller-in-ios-6/ Some of you may have noticed that your vi

Codeforces Round #437 (Div. 2, based on MemSQL Start[c]UP 3.0 - Round 2) E. Buy Low Sell High

amp base multiset ret pac multi 刪掉股票 ems 題意：一些股票的價格，我們可以選擇買進賣出，但一天只有一個操作，問最大盈利思路：對於當天，如果賣出的話&&之前有比他小的，我們肯定是找個最小那天的買進，但又不知道現在賣是不

Codeforces Round #437 (Div. 2, based on MemSQL Start[c]UP 3.0 - Round 2) E. Buy Low Sell High [貪心 II][數據結構 I]

fin 想想 ima 直接圖片 test 只需要數據結構 lan 題目：http://codeforces.com/contest/867/problem/E 題意：模擬股票操作，每天只能買一只股票或者賣一只股票或者什麽也不做，求最大利潤。題解：仔細想想是非常簡單的

openSUSE 多個GPU設置深度學習 Caffe PyTorch 等

div 深度學習學習正常 gpo 原來 caf 顯示 nvi 原來只有一張卡Titian x，最近又添加一個1080TI，插好以後 nvidia-smi 顯示只有一張卡。看了下\dev 下nvidia1普通用戶沒有權限，切換到root下正常。但是在root下還是不太好

【DVWA】【SQL Injection(Blind)】SQL盲註 Low Medium High Impossible

submit strong size users bsp amp select dmi mit 1.初級篇 Low.php 加單引號提交 http://localhost/DVWA-master/vulnerabilities/sqli_blind/?id=1‘&am

【刷題】BZOJ 4391 [Usaco2015 dec]High Card Low Card

set lin 最大化 gis next 從後往前 predict 奶牛怎麽 Description Bessie the cow is a huge fan of card games, which is quite surprising, given her lack

pytorch high memory usage but low volatile gpu-util

問題：pytorch程式GPU的使用率很低。

探索：

解決方案：

疑問：

相關推薦