Tensorflow使用GPU
阿新 • • 發佈:2018-12-13
本文針對使用GPU訓練模型遇到的問題進行總結、分析及解決。
- 問題1
ImportError: libcusolver.so.8.0: cannot open shared object file: No such file or directory
【原因】
未配置cuda路徑。 【解決方案】
sudo vim ~/.bashrc
export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64"
export CUDA_HOME="/usr/local/cuda"
source ~/.bashrc
- 問題2
ImportError: libcudnn.so.5: cannot open shared object file: No such file or directory
【原因】 安裝的cudnn與tensorflow版本不匹配。tensorflow1.2.0版本使用cudnn5.0編譯,tensorflow1.3.0使用cudnn6.0編譯,作者安裝cudnn6.0及tensorflow1.2.0,所以出現問題。 【解決方案】 (1)安裝tensorflow-gpu1.2.0及cudnn5.0 (2)安裝tensorflow-gpu1.3.0及cudnn6.0 (3)將/usr/local/cuda/lib64中的libcudnn.so、libcudnn.so.6和libcudnn.so.6.0.21複製到/usr/local/lib中。
sudo cp /usr/local/cuda/lib64/libcudnn.so /usr/local/lib sudo cp /usr/local/cuda/lib64/libcudnn.so.6 /usr/local/lib sudo cp /usr/local/cuda/lib64/libcudnn.so.6.0.21 /usr/local/lib
- 問題3
PermissionDeniedError (see above for traceback): ./model/modelcnn.ckpt-1.data-00000-of-00001.tempstate18109713180698296883
【原因】 model資料夾許可權不夠。 【解決方案】
#檢視許可權
ll(double L(lower))
#更改model資料夾許可權
sudo chmod 777 model