1. 程式人生 > >Pytorch RuntimeError: CUDNN_STATUS_INTERNAL_ERROR的解決辦法

Pytorch RuntimeError: CUDNN_STATUS_INTERNAL_ERROR的解決辦法

先說一下我碰到這個問題的平臺環境:作業系統是CentOS,多個GPU節點,cuda 9.0。執行pytorch和tensorflow都會提示CUDNN_STATUS_INTERNAL_ERROR錯誤。

對於此問題,解決辦法有:

1、刪除掉nvidia快取,或者還需要重啟。

rm -rf ~/.nv

但這個方法不適合我的執行環境,還是會繼續提示同樣的問題

2、執行pytorch或tensorflow的時候,指定CUDA_CACHE_PATH路徑。關於這個路徑,有的說是用絕對路徑,有的說只需用相對路徑。

CUDA_VISIBLE_DEVICES=0 CUDA_CACHE_PATH='~/.cudacache' python main.py

為了這個問題,耗費了我好幾天的時間,終於用相對路徑解決了此問題。

大家用第2種方法時,如果採用絕對路徑會報錯,就用相對路徑試試。希望能幫到大家!