tensorflow-GPU的配置詳解(細數配置過程中遇見的坑與解決方式)
阿新 • • 發佈:2019-02-01
細數自己搭建TensorFlow-gpu環境中遇到的坑及解決方式:
1、安裝anaconda,一路下來點選next,然後預設配置(這裡不再細講)2、安裝裝TensorFlow-gpu -->pip install tensorflow-gpu(也可以選擇自己想要的版本安裝),注意:現目前TensorFlow-gpu適應python最佳版本為python3.5
3、官網下載cuda,本人下載的是cuda9.0 測試過V9.1與V8.5,9.0版本是穩定的版本
4、下載對應cuda版本的cudnn,官網會有相關提示(本人下載為v7.0.5)
5、雙擊cuda.exe檔案安裝,過程中會出現閃屏等狀況,都是正常情況,按照預設選擇,點next。劃重點!下面的步驟很重要!!!
5.1、解壓cudnn壓縮包,將壓縮後的lib/x64,include, bin 下面的檔案複製到cuda/v9.0對應的資料夾下
5.2、將lib,lib/x64, include,bin,配置到系統路徑中(怎麼配環境變數這裡也不再累贅)
5.3、 在命令提示符視窗中輸入:nvcc -V 或者命令列中執行在C:\ProgramData\NVIDIA Corporation\CUDA Samples\v5.0\bin\win32\Release中deviceQuery程式,若能檢測到cuda device則證明程式已經正確安裝
6、測試TensorFlow-gpu是否能正常執行
測試程式碼
import tensorflow as tf
hello = tf.constant('hello world')
sess = tf.Session()
sess.run(hello)
6.1、這裡有可能出現第一個坑(如果你執行記憶體足夠的大或許可以繞過),一個記憶體溢位的錯誤‘ failed to allocate 10.91G (11715084288 bytes) from device: CUDA_ERROR_OUT_OF_MEMORY’
解決方式:作如下更改:
config = tf.ConfigProto()
#config.gpu_options.per_process_gpu_memory_fraction = 0.90
config.gpu_options.allow_growth = True # 允許自增長
config.log_device_placement=True # 允許列印gpu使用日誌
session = tf.Session(config=config)
6.2、這裡講的第二個錯誤,源自於cudnn版本不對,對應cuda_V9.0有cudnn_V7.1.4(7.1.n)也有V7.0.n 安裝報錯提示下載對應的版本,我的cuda為V9.0對應的cudnn為V7.0.5