1. 程式人生 > >【GPU】nvidia-smi輸出內容釋義及使用

【GPU】nvidia-smi輸出內容釋義及使用

nvidia-smi(NVIDIA System Management Interface) 是基於nvml的gpu的系統管理介面,主要用於顯示卡的管理和狀態監控。

1.基礎命令nvidia-smi

安裝完成後在命令列或終端輸入命令nvidia-smi,即可看到下面的資訊(點選放大):
在這裡插入圖片描述

包含了顯示卡的訊號、溫度、風扇、功率、視訊記憶體、使用率、計算模式等資訊。

2.實用命令

#幫助
nvidia-smi -h

#持續監控gpu狀態 (-lms 可實現毫秒級監控)
nvidia-smi -l 3   #每三秒重新整理一次狀態,持續監控

#列出所有GPU,大寫L
nvidia-smi -L #查詢所有資訊 nvidia-smi -q #查詢特定卡的資訊,0.1.2.為GPU編號 nvidia-smi -i 0 #顯示特定的資訊 MEMORY, UTILIZATION, ECC, TEMPERA-TURE, POWER, CLOCK, COMPUTE, PIDS, PERFORMANCE, SUPPORTED_CLOCKS, #PAGE_RETIREMENT, ACCOUNTING 配合-q使用 nvidia-smi -q -d MEMORY #監控執行緒 nvidia-smi pmon #監控裝置 nvidia-smi dmon #此外還有一系列可以配置模式的屬性,可以直接利用nvidia-smi配置
#詳情:http://developer.download.nvidia.com/compute/DCGM/docs/nvidia-smi-367.38.pdf #查詢命令外的配置命令,請慎重使用!!! #對於配置類命令,務必事先確認命令的含義!!!

在這裡插入圖片描述
pic from pexels


ref:
命令參考:http://developer.download.nvidia.com/compute/DCGM/docs/nvidia-smi-367.38.pdf
https://blog.csdn.net/u011394059/article/details/74530243?locationNum=10&fps=1

https://blog.csdn.net/huangfei711/article/details/79230446