ubuntu16.04+Geforce GTX1080ti+cuda 8.0+tensorflow 1.4環境配置
工欲善其事,必先利其器
前言
搭建一個可用的深度學習開發平臺是入門深度學習的第一步,所以本公眾號也將從這裡開始。從剛剛學習深度學習的那時候開始,作者就在搭建平臺的苦海里遨遊,中間換了很多次電腦,所以不停地在搭環境。雖然後面已經輕車熟路,但是過程當中總是有好多細節會忘記,又會重新去找資料。這不,前兩天又搭了一次,想著這次一定要把過程寫下來。說了這麼多,這就開始啦。
寫在最前面:作者的環境配置是:ubuntu16.04+Nvidia GTX1080+cuda8.0.作者試過ubuntu18,但是發現還是16.04更為穩定,比較好用,所以推薦不要貪新,選擇16.04,幸福一生。
anconda安裝
bash ./Anaconda3-5.0.0-Linux-x86_64.sh
配置環境:
vim ~/.bashrc
在檔案末尾新增:
export PATH="/home/使用者名稱/anaconda3/bin:$PATH"
儲存,退出,在鍵入:
source ~./bashrc
檢驗一下,在終端中鍵入:python,看看
顯示卡篇
軟體下載
樓主的顯示卡是微星 NVIDIA GTX1080ti,視訊記憶體是11G。選擇它的原因是在作者做深度學習專案時,常常由於視訊記憶體不足而導致batch_size設定比較小,從而導致結果不是太穩定(後續文章中,作者也會推出關於如何在視訊記憶體有限的情況下訓練深度學習模型的文章,敬請關注)。所以本次特地選了一個視訊記憶體相對較大的顯示卡。選定顯示卡之後,我們就要為顯示卡安裝顯示卡驅動。很多文章建議從系統設定->軟體更新->附加驅動->切換到最新的nuvida驅動即可。此法不可
- 顯示卡驅動,點選下載,根據系統來選擇對應的版本,選擇runfile檔案即可。
備註:下載cuda時,下載的名字為cuda_8.0.61_375.26_linux.run,其中375.26是指你的驅動版本必須必這個第,但是也不能太低。安裝其他的cuda版本也是一樣的道理;ok,到此為止,我們顯示卡部分的軟體下載就完事兒了
安裝前準備
下面我們還需要做這些準備工作:
ubuntu自帶的nouveau驅動會影響cuda的安裝,可能會導致黑屏和迴圈登入,並且比還不知道為什麼會這樣。首先,我們在終端執行:
lsmod | grep nouveau
若有輸出,則在終端鍵入:
cd /etc/modprobe.d
sudo touch blacklist-nouveau.conf
sudo gedit blacklist-nouveau.conf
在開啟的檔案中輸入:
blacklist nouveau
options nouveau modeset=0
儲存後退出,在終端中鍵入:
sudo update-initramfs -u
重啟電腦,在終端中鍵入:
lsmod | grep nouveau
如果沒有輸出,就證明成功關閉了nonveau
安裝顯示卡驅動
如果原先裝過顯示卡驅動的話,我們需要先解除安裝所有顯,在終端中鍵入:
sudo apt-get remove --purge nvidia-*
利用CTRL+ALT+F1進入字元介面,關閉圖形介面,然後登入個人賬戶後鍵入:
sudo service lightdm stop
安裝nvidia驅動,進入驅動檔案所在位置,然後鍵入:
sudo chmod a+x NVIDIA-Linux-x86_64-378.09.run //獲取許可權
sudo ./NVIDIA-Linux-x86_64-378.09.run –no-x-check –no-nouveau-check –no-opengl-files //安裝驅動
在安裝的過程中,一直按enter鍵即可。然後重啟並登入,鍵入:
nvidia-smi
顯示卡資訊如下:
至此,顯示卡驅動就裝完了。
cuda8.0的安裝
進入檔案所在路徑,輸入命令:
sudo sh cuda_8.0.61_375.26_linux.run
然後出現的就是一些說明,如果不想看的話,可以按crtl+C跳過,接受之後會問你是否安裝驅動,因為我們之前已經安裝驅動了,所以這裡選擇No即可,其餘選擇yes直至安裝結束。
配置環境變數,鍵入以下命令:
sudo vim ~/.bashrc
在開啟的檔案末尾新增路徑,也就是安裝目錄,命令如下:
export CUDA_HOME=/usr/local/cuda
export PATH=$PATH:$CUDA_HOME/bin
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
接著儲存,鍵入:
source ~./bashrc
重啟電腦,我們檢驗以下,cuda是否安裝成功。鍵入:
cd /usr/local/cuda/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
如果顯示了顯示卡的相關資訊,並result=pass,則安裝成功,如果失敗了,可能是環境未配置好,或者是cuda與驅動版本不相容。如果需要重新安裝cuda,則可通過以下命令:
cd /usr/local/cuda/bin
$ sudo ./uninstall_cuda_8.0.pl
現在,cuda就安裝完畢。
cudnn的安裝
如果要利用gpu來對tensorflow進行加速,除了安裝cuda以外,cudnn也是必須要安裝的,與cuda一樣,去nvidia的官網下載cuDnn的安裝包。我們需要先註冊再下載,並且非常依靠網速人品,我下了好多次才下下來啊啊啊啊。但是,辦法總是有的,我們可以通過迅雷來下,把下載地址貼上到迅雷,很快就下下來了,別問我為什麼知道,你懂得。。。。。。你會發現,有很多cudnn的版本,如果選擇版本不當,在後期安裝tensorflow的時候會提醒你缺少某些lib,奉獻一張圖
所以啊,我們選擇了tensorflow1.4+cuda8.0+cudnn6.0,下載完之後,我們解壓檔案:
tar -xvf cudnn-8.0-linux-x64-v6.1.tgz
安裝cuDNN比較簡單,解壓後把相應的檔案拷貝到對應的CUDA目錄下即可,鍵入:
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
tensorflow的安裝
如果之前有裝過tensorflow的話,先要將其解除安裝,鍵入:
pip uninstall tensorflow
由於國外的源太不穩定了,所以我們選擇清華的源,鍵入:
pip install \
-i https://pypi.tuna.tsinghua.edu.cn/simple/ \
https://mirrors.tuna.tsinghua.edu.cn/tensorflow/linux/gpu/tensorflow_gpu-1.4.0-cp36-cp36m-linux_x86_64.whl
等待安裝成功即可,最後測試一下,進入python的編譯環境,鍵入:
import tensorflow as tf
如果沒有報錯,則安裝完畢
注意:如果在呼叫tensorflow的過程當中出現類似於***libcudart.so.8.0:cannot open shared object file:NO such file or directory***的錯誤有可能是你的cudnn版本和tensorflow版本不一樣,不過,如果你按照本文的方法配置,應該不會出現這中錯誤,如果真的出現了,還有一種原因就是環境環境沒有配置好。
以上,就把基本的開發環境配置完畢了,希望大家玩兒的愉快,玩兒的開心。