1. 程式人生 > >nvidia-smi指令解析

nvidia-smi指令解析

對於一些遊戲玩家來說買到好配置的主機,首先一件事就是拿一些跑分軟體來跑個分,如3DMark,國際象棋等。 
像我們搞CUDA的喜歡用NVIDIA自帶視覺化工具Visual Profiler 來看程式對GPU的應用效率,對於一些已經搭好的框架如tensorflow和caffe等,想到監控的方法就是在訓練或者測試時直接用命令:

nvidia-smi(watch -n 0 -d nvidia-smi)
在終端中打印出GPU的各種屬性。 
如下圖是列印的結果: 
 
第一行Driver Version:384.90表示我用的驅動是384.90 
第二行中: 
第一行表示GPU序號,名字,Persisitence-M(持續模式狀態),如我中有一個GPU序號為0;名字為GeForce系列的GTX1060;持續模式的狀態,持續模式雖然耗能大,但是在新的GPU應用啟動時,花費的時間更少,這裡顯示的是off的狀態。 
第一欄Fan:N/A是風扇的轉速,從0到100%之間變動。有的nvidia裝置如筆記本,tesla系列不是主動散熱的可能顯示不了轉速 
第二欄Temp:溫度,35攝氏度 
第三欄Perf:是效能狀態,從P0到P12,P0表示最大效能,P12表示最小效能地 
第四欄中Pwr表示能耗,22瓦 
第五欄中Bus-Id是表示GPU匯流排的東西 
第六欄中Disp.A是DisPlay Active ,表示GPU是否有初始化 
下方的Memory-Usage表示視訊記憶體的使用率:共6GB 我已經使用了220MB(當初買電腦時電腦城的人一直把我往3GB視訊記憶體的閹割版的1060上拉,說視訊記憶體是浮動的,可能視訊記憶體浮動只有像英偉達jetson系列的移動嵌入式平臺上視訊記憶體與記憶體共享的形式才能做到吧) 
第七欄Volatile GPU-Util表示GPU的利用率 
第八欄Uncorr.ECC是表示ECC的相關東西,ECC即 Error Correcting Code 錯誤檢查和糾正,在伺服器和工作站上的記憶體中才有的技術 
再下面是關於程序的相關GPU使用率,如這邊有三個程序對GPU進行了利用,Xorg,compiz和FireFox和各自呼叫時視訊記憶體的使用量

原文:https://blog.csdn.net/qq_25819827/article/details/78977325