windows檢視GPU佔用率以及GPU未執行原因
1、CPU利用率
進行深度學習時,發現電腦CPU佔用率太高,接近100%,磁碟有時也達到100%。懷疑沒有用GPU進行訓練。
工作管理員中只有CPU、記憶體、磁碟的佔用率情況
2、檢視GPU佔用率
(1)開啟cmd視窗(win+R,再輸入cmd)
(2)在資料夾C:\Program Files\NVIDIA Corporation\NVSMI裡找到檔案nvidia-smi.exe
(3)將檔案拖入cmd視窗,就可以顯示GPU資訊。發現:GPU利用率很低,不到5%。
第一行是版本資訊,第二行是標題欄,第三行就是具體顯示卡資訊了。
GPU:編號,0
Name:顯示卡名,NVS 4200M
TCC/WDDM:WDDM
Fan:風扇轉速,這裡N/A,應該是沒轉
Temp:顯示卡溫度,這裡是66攝氏度
Perf:效能狀態,congP0-P12,P0效能最大,P12最小,這裡是P0
Pwr:能耗,Usage是使用量,Cap是總量
BusId:涉及GPU匯流排
Disp.A:表示GPU的顯示是否已經初始化
Memory-Usage:視訊記憶體使用率,這裡才用很少,5%不到
CPU-Util:GPU利用率
Compute M:計算模式
(4)用GPU-Z工具檢視GPU使用情況:發現負載為0
----------------------------------------------------------------------------------------------------------------------------------
綜合nvidia-smi.exe和GPU-Z發現GPU沒有執行。
3、檢視GPU沒有執行的原因
>>> import tensorflow as tf
>>> sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
2018-05-17 15:25:30.744860: I T:\src\github\tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:1356] Found device 0 with properties:
name: NVS 4200M major: 2 minor: 1 memoryClockRate(GHz): 1.62
pciBusID: 0000:01:00.0
totalMemory: 1.00GiB freeMemory: 826.13MiB
2018-05-17 15:25:30.745094: I T:\src\github\tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:1406] Ignoring visible gpu device (device: 0, name: NVS 4200M, pci bus id: 0000:01:00.0, compute capability: 2.1) with Cuda compute capability 2.1. The minimum required Cuda capability is 3.0.
2018-05-17 15:25:30.746883: I T:\src\github\tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:923] Device interconnect StreamExecutor with strength 1 edge matrix:
2018-05-17 15:25:30.747687: I T:\src\github\tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:929] 0
2018-05-17 15:25:30.748385: I T:\src\github\tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:942] 0: N
Device mapping: no known devices.
2018-05-17 15:25:30.750654: I T:\src\github\tensorflow\tensorflow\core\common_runtime\direct_session.cc:284] Device mapping:
Ignoring visible gpu device (device: 0, name: NVS 4200M, pci bus id: 0000:01:00.0, compute capability: 2.1) with Cuda compute capability 2.1. The minimum required Cuda capability is 3.0.
2018-05-17 15:25:30.746883: I T:\src\github\tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:923] Device interconnect StreamExecutor with strength 1 edge matrix:
2018-05-17 15:25:30.747687: I T:\src\github\tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:929] 0
2018-05-17 15:25:30.748385: I T:\src\github\tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:942] 0: N
Device mapping: no known devices.
2018-05-17 15:25:30.750654: I T:\src\github\tensorflow\tensorflow\core\common_runtime\direct_session.cc:284] Device mapping:
資訊提示:電腦gpu裝置cuda計算能力為2.1,但gpu加速需要的最小cuda計算能力為3.0。