【GPU】nvidia-smi輸出內容釋義及使用
阿新 • • 發佈:2018-11-11
nvidia-smi(NVIDIA System Management Interface) 是基於nvml的gpu的系統管理介面,主要用於顯示卡的管理和狀態監控。
1.基礎命令nvidia-smi
安裝完成後在命令列或終端輸入命令nvidia-smi
,即可看到下面的資訊(點選放大):
包含了顯示卡的訊號、溫度、風扇、功率、視訊記憶體、使用率、計算模式等資訊。
2.實用命令
#幫助
nvidia-smi -h
#持續監控gpu狀態 (-lms 可實現毫秒級監控)
nvidia-smi -l 3 #每三秒重新整理一次狀態,持續監控
#列出所有GPU,大寫L
nvidia-smi -L
#查詢所有資訊
nvidia-smi -q
#查詢特定卡的資訊,0.1.2.為GPU編號
nvidia-smi -i 0
#顯示特定的資訊 MEMORY, UTILIZATION, ECC, TEMPERA-TURE, POWER, CLOCK, COMPUTE, PIDS, PERFORMANCE, SUPPORTED_CLOCKS, #PAGE_RETIREMENT, ACCOUNTING 配合-q使用
nvidia-smi -q -d MEMORY
#監控執行緒
nvidia-smi pmon
#監控裝置
nvidia-smi dmon
#此外還有一系列可以配置模式的屬性,可以直接利用nvidia-smi配置
#詳情:http://developer.download.nvidia.com/compute/DCGM/docs/nvidia-smi-367.38.pdf
#查詢命令外的配置命令,請慎重使用!!!
#對於配置類命令,務必事先確認命令的含義!!!
ref:
命令參考:http://developer.download.nvidia.com/compute/DCGM/docs/nvidia-smi-367.38.pdf
https://blog.csdn.net/u011394059/article/details/74530243?locationNum=10&fps=1
https://blog.csdn.net/huangfei711/article/details/79230446