1. 程式人生 > >tensorflow GPU安裝及測試

tensorflow GPU安裝及測試

# 一、TensorFLow-Gpu環境的搭建
## 檢視nvidia的型號以便安裝相應的驅動
lspci | grep -i nvidia
#這一步非常的重要,一定要看清楚自己的驅動型號,以便能夠找到正確的cuda和cudnn的型號

 ## 禁用nouveau
#在安裝cuda的時候,由於涉及到NVIDIA驅動的安裝,使得nouveau驅動與NVIDIA驅動衝突,為了能夠繼續安裝,必須禁用此驅動。
#檢視是否有nouveau在執行,如果已經在運行了則按照如下的辦法進行金融
lsmod | grep nouveau
#通過配置對應配置檔案來禁用nouveau
vi /etc/modprobe.d/blacklist-nouveau.conf
#在配置檔案中新增或者將對應項修改成如下的配置
blacklist nouveau

options nouveau modeset=0
#然後重啟系統


## 關於gcc降級問題
#如果使用的是CUDA8.0的因為gcc要5.0以下版本問題需要降級,但是因為我們推薦使用的是CUDA9.0,所以不存在這個問題,如果有需要的同學可以參照如下的內容:
sudo apt-get install gcc-4.9

sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.9 20

sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 10

sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-4.9 20

sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 10

sudo update-alternatives --install /usr/bin/cc cc /usr/bin/gcc 30

sudo update-alternatives --set cc /usr/bin/gcc

sudo update-alternatives --install /usr/bin/c++ c++ /usr/bin/g++ 30

sudo update-alternatives --set c++ /usr/bin/g++

## 關於Anaconda的使用


#Anaconda是一個開源的Python發行版本,其包含了conda、Python等180多個科學包及其依賴項,這個的使用按照大家的使用習慣,可以用也可以不用。


wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.1.0-Linux-x86.sh


chmod +x Anaconda3-5.1.0-Linux-x86.sh


./Anaconda3-5.1.0-Linux-x86.sh

## CUDA9.0下載和安裝配置

#CUDA可以在Nvidia的官網下載
https://developer.nvidia.com/cuda-90-download-archive?target_os=Linux
#在選擇好自己對應的系統版本後,我們選擇runfile進行安裝。
#在下載後對cuda的檔案許可權進行更改,並啟動安裝

chmod +x cuda_9.0.176_384.81_linux.run

sudo bash cuda_9.0.176_384.81_linux.run

#在安裝的過程中會出現一些配置,建議的配置選項如下:

-------------------------------------------------------------
Do you accept the previously read EULA?
accept/decline/quit: accept
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 384.81?

(y)es/(n)o/(q)uit:y
Do you want to install the OpenGL libraries?

(y)es/(n)o/(q)uit default is yes :yes
Do you want to run nvidia-xconfig?

This will update the system X configuration file so that the NVIDIA X driver

is used. The pre-existing X configuration file will be backed up.

This option should not be used on systems that require a custom

X configuration, such as systems with multiple GPU vendors.

(y)es/(n)o/(q)uit  default is no : no
Install the CUDA 9.0 Toolkit?

(y)es/(n)o/(q)uit:yes
Enter Toolkit Location

default is /usr/local/cuda-9.0 :#回車預設即可

Do you want to install a symbolic link at /usr/local/cuda?

(y)es/(n)o/(q)uit:no


Install the CUDA 9.0 Samples?

(y)es/(n)o/(q)uit:no

#在系統環境裡設定CUDA的路徑
vim ~/.bashrc #編輯配置檔案

#配置內容

export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:/usr/local/cuda-9.0/extras/CUPTI/lib64:$LD_LIBRARY_PATH

export CUDA_HOME=/usr/local/cuda-9.0

export PATH=/usr/local/cuda-9.0/bin:$PATH

#使配置立即生效

source ~/.bashrc 


## CUDNN的下載和安裝配置

#cudnn其實只是NVIDIA深度神經網路軟體開發包中的其中一種加速庫,我們要用TensorFlow也是支援這個加速工具的,但是這個下載比較麻煩需要有Nvidia的賬號才能下載。
#cudnn的下載地址
https://developer.nvidia.com/rdp/cudnn-archive
#將下載檔案解壓並cp到相應的位置

tar xvzf cudnn-9.0-linux-x64-v7.0.5.1.tgz

sudo ldconfig /usr/local/cuda/lib64  

sudo cp cuda/include/cudnn.h /usr/local/cuda/include

sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64

sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*


## 安裝TensorFlow-gpu
pip3 install tensorflow-gpu==1.10.1
## 測試安裝是否成功
#nvidia-smi可以檢視當前系統中的GPU執行情況
#使用一段程式碼來測試一下Tensoflow-gpu在系統中安裝情況,以及能夠呼叫GPU
import tensorflow as tf

with tf.device('/cpu:0'):

    a = tf.constant([1.0,2.0,3.0],shape=[3],name='a')

    b = tf.constant([1.0,2.0,3.0],shape=[3],name='b')

with tf.device('/gpu:1'):

    c = a+b

print(c)

sess = tf.Session(config=tf.ConfigProto(allow_soft_placement=True,log_device_placement=True))

sess.run(tf.global_variables_initializer())

print(sess.run(c))