1. 程式人生 > >實驗室配置深度學習環境ubuntu17.10 + cuda9.2 + cudnn 7 + tensorflow

實驗室配置深度學習環境ubuntu17.10 + cuda9.2 + cudnn 7 + tensorflow

##安裝ubuntu
建議安裝美版,也就是所有的語言選擇English.
我這個比較麻煩的一點是,每次重灌系統都會出現fatal error , 但並不知道哪裡出錯了,每次只能先格式化(不能快速格式化,FAT模式)U盤,然後安裝才能安裝成功。
還有一個原因就是English環境就不成功
一鍵製作ubuntu啟動盤
教程在這
建議先去cuda下載網站看一下,cuda支援的系統版本(我這時候:18.04是不支援cuda的,下面再說cuda安裝細節)
開始裝了3遍,全部失敗,

1.msi 桌上型電腦進入bois (開機時點選del)
2.將啟動優先設定為u盤啟動
3.F10儲存,重啟
4.進入ubuntu安裝介面
5.然後就是按照自己的選擇進行next(我當時是抹掉了所有資料,不過都是備份好的)
6.大功告成

注意:安裝的時候一定新增sudo,因為我配的是實驗室電腦,如果是多個使用者,都需要用到這個環境那麼必須root安裝
##gcc安裝,下一步顯示卡必備
注意:cuda9.0 只支援7以下版本,所以需要降級,在此我們採用5.5穩定版本。

sudo apt-get install gcc-5 gcc-5-multilib g++-5 g++-5-multilib
# 檢視版本會發現是7.2
gcc --version
# 修改優先順序,數字越大,優先級別越高,將預設改為5.5
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 100 
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-7 50
sudo update-alternatives --config gcc
# 按Enter退出
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 50
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-7 40
sudo update-alternatives --config g++
# 按Enter退出
# 再次檢視版本資訊,會發現已經是5.5版本了
gcc --version 

安裝依賴庫

sudo apt-get install g++ freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libglu1-mesa 

##安裝顯示卡
不需要下載驅動。
找到“軟體與更新”,找到‘附加驅動’nvidia顯示卡(箭頭所指),然後自動相當於網上說的將另一個拉為黑名單。
這裡寫圖片描述
apply之後,重啟之後就能進終端,輸入

nvidia-smi

可以看到顯示gpu的各種資訊,也說明顯示卡驅動沒有問題了。

##安裝CUDA
cuda下載網站
安裝穩定的9.0版本
然後寫入環境變數,就像windows下的環境、
下面的位置是安裝的時候預設的位置

echo 'export PATH=/usr/local/cuda-9.0/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

##安裝CUDNN
cudnn下載網站,需要註冊nvidia賬號,然後才能下載。
注意版本的選擇
因為cuda下載的9.0的,所以這裡也直接下載9.0對應的版本7.0。
這裡寫圖片描述
點選之後,會發現還有系統版本的區別
這裡寫圖片描述
我是ubuntu 17.10 選擇第一個

tar -xzvf cudnn-9.0-linux-x64-v7.1.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

##安裝Annaconda

sudo bash Anaconda2-4.2.0-Linux-x86_64.sh 
source ~/.bashrc

檢測安裝是否成功
python
出現:
Python 3.6.4 |Anaconda, Inc.| (default, Jan 16 2018, 18:10:19) [GCC 7.2.0] on linux
Type “help”, “copyright”, “credits” or “license” for more information.
安裝成功!
##安裝tensorflow
anacanda安裝的是預設的1.0.1版本,但是明顯過時了,所以手動升級
選擇適合cuda的版本,下載之後

sudo pip install tensorflow......whl

然後檢測是否安裝成功
python
import tensorflow as tf
tf.version
輸出你安裝的版本即成功