tensorflow GPU安裝及測試
# 一、TensorFLow-Gpu環境的搭建
## 檢視nvidia的型號以便安裝相應的驅動
lspci | grep -i nvidia
#這一步非常的重要,一定要看清楚自己的驅動型號,以便能夠找到正確的cuda和cudnn的型號
## 禁用nouveau
#在安裝cuda的時候,由於涉及到NVIDIA驅動的安裝,使得nouveau驅動與NVIDIA驅動衝突,為了能夠繼續安裝,必須禁用此驅動。
#檢視是否有nouveau在執行,如果已經在運行了則按照如下的辦法進行金融
lsmod | grep nouveau
#通過配置對應配置檔案來禁用nouveau
vi /etc/modprobe.d/blacklist-nouveau.conf
#在配置檔案中新增或者將對應項修改成如下的配置
blacklist nouveau
options nouveau modeset=0
#然後重啟系統
## 關於gcc降級問題
#如果使用的是CUDA8.0的因為gcc要5.0以下版本問題需要降級,但是因為我們推薦使用的是CUDA9.0,所以不存在這個問題,如果有需要的同學可以參照如下的內容:
sudo apt-get install gcc-4.9
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.9 20
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 10
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-4.9 20
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 10
sudo update-alternatives --install /usr/bin/cc cc /usr/bin/gcc 30
sudo update-alternatives --set cc /usr/bin/gcc
sudo update-alternatives --install /usr/bin/c++ c++ /usr/bin/g++ 30
sudo update-alternatives --set c++ /usr/bin/g++
## 關於Anaconda的使用
#Anaconda是一個開源的Python發行版本,其包含了conda、Python等180多個科學包及其依賴項,這個的使用按照大家的使用習慣,可以用也可以不用。
wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.1.0-Linux-x86.sh
chmod +x Anaconda3-5.1.0-Linux-x86.sh
./Anaconda3-5.1.0-Linux-x86.sh
## CUDA9.0下載和安裝配置
#CUDA可以在Nvidia的官網下載
https://developer.nvidia.com/cuda-90-download-archive?target_os=Linux
#在選擇好自己對應的系統版本後,我們選擇runfile進行安裝。
#在下載後對cuda的檔案許可權進行更改,並啟動安裝
chmod +x cuda_9.0.176_384.81_linux.run
sudo bash cuda_9.0.176_384.81_linux.run
#在安裝的過程中會出現一些配置,建議的配置選項如下:
-------------------------------------------------------------
Do you accept the previously read EULA?
accept/decline/quit: accept
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 384.81?
(y)es/(n)o/(q)uit:y
Do you want to install the OpenGL libraries?
(y)es/(n)o/(q)uit default is yes :yes
Do you want to run nvidia-xconfig?
This will update the system X configuration file so that the NVIDIA X driver
is used. The pre-existing X configuration file will be backed up.
This option should not be used on systems that require a custom
X configuration, such as systems with multiple GPU vendors.
(y)es/(n)o/(q)uit default is no : no
Install the CUDA 9.0 Toolkit?
(y)es/(n)o/(q)uit:yes
Enter Toolkit Location
default is /usr/local/cuda-9.0 :#回車預設即可
Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit:no
Install the CUDA 9.0 Samples?
(y)es/(n)o/(q)uit:no
#在系統環境裡設定CUDA的路徑
vim ~/.bashrc #編輯配置檔案
#配置內容
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:/usr/local/cuda-9.0/extras/CUPTI/lib64:$LD_LIBRARY_PATH
export CUDA_HOME=/usr/local/cuda-9.0
export PATH=/usr/local/cuda-9.0/bin:$PATH
#使配置立即生效
source ~/.bashrc
## CUDNN的下載和安裝配置
#cudnn其實只是NVIDIA深度神經網路軟體開發包中的其中一種加速庫,我們要用TensorFlow也是支援這個加速工具的,但是這個下載比較麻煩需要有Nvidia的賬號才能下載。
#cudnn的下載地址
https://developer.nvidia.com/rdp/cudnn-archive
#將下載檔案解壓並cp到相應的位置
tar xvzf cudnn-9.0-linux-x64-v7.0.5.1.tgz
sudo ldconfig /usr/local/cuda/lib64
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
## 安裝TensorFlow-gpu
pip3 install tensorflow-gpu==1.10.1
## 測試安裝是否成功
#nvidia-smi可以檢視當前系統中的GPU執行情況
#使用一段程式碼來測試一下Tensoflow-gpu在系統中安裝情況,以及能夠呼叫GPU
import tensorflow as tf
with tf.device('/cpu:0'):
a = tf.constant([1.0,2.0,3.0],shape=[3],name='a')
b = tf.constant([1.0,2.0,3.0],shape=[3],name='b')
with tf.device('/gpu:1'):
c = a+b
print(c)
sess = tf.Session(config=tf.ConfigProto(allow_soft_placement=True,log_device_placement=True))
sess.run(tf.global_variables_initializer())
print(sess.run(c))