ubuntu16.04配置深度學習環境
阿新 • • 發佈:2020-10-20
安裝CUDA-9.0
1、CUDA的安裝比較容易,官網下載9.0版本,選擇對應系統,請下載runfile
2、在下載資料夾終端輸入:
sudo sh cuda_9.0.176_384.81_linux.run
剛開始一直顯示的是0%,按q退出檔案說明,然後關鍵的地方來了,先輸入accept,接著問你要不要安裝CUDA自帶的顯示卡;這一個選擇NO,後面3個都是YES。(忘記截圖了)
3、安裝完成之後需要配置環境變數
在終端輸入:
sudo gedit ~/.bashrc
會開啟一個檔案,在這個檔案的最後加入以下兩行內容:
-
export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}
- export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
可以直接複製貼上過去,然後點選儲存或者輸入:
source ~/.bashrc
在profile中也輸入上面兩行宣告
sudo gedit /etc/profile
儲存退出,reboot一下。
4、驗證CUDA版本:9.0
在終端輸入:nvcc -V
步驟三:安裝cuDNN
1、在官網下載,需要註冊賬號,目前提供的不同版本為:
看圖選版本,千萬千萬別選錯!!!
這裡選擇cuDNN v7.05[Dec 5,2017],for CUDA9.0;
我自己安裝的是cuDNN v7.0.5 Library for Linux,這裡看自己喜歡什麼版本吧;
但是,CUDA-9.0版本的必須和cuDNN的7.0的版本對應起來。cuDNN版本不能超過7.4(頭腦發熱裝了cnDNN版本7.6.4的,後面就出問題了,要改!!!),否則後面安裝tensorflow-gpu會報錯,親測要報錯!!!
下面的cuDNN安裝教程就將就看吧,因為安裝錯了版本,有幾張圖用的是cnDNN7.6.4.38的截圖。
(然後下面是解除安裝我安裝錯的cuDNN版本,淚奔!乖乖的安裝回原來的版本。)
- sudo rm -rf /usr/local/cuda/include/cudnn.h
- sudo rm -rf /usr/local/cuda/lib64/libcudnn*
2、在下載路徑解壓檔案,複製到本地路徑,這裡解壓出來的檔名比較重要
在下載路徑開啟終端,依次執行以下命令:
tar -zxvf cudnn-9.0-linux-x64-v7.6.4.38.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
3、到我們本地的cuda路徑,進入lib64資料夾會有剛剛解壓的檔案,然後在終端開啟依次執行以下命令:
- cd /usr/local/cuda/lib64
- sudo chmod +r libcudnn.so.7.0.5
- sudo ln -sf libcudnn.so.7.0.5 libcudnn.so.7
- sudo ln -sf libcudnn.so.7 libcudnn.so
- sudo ldconfig
在本地cuda路徑檢測一下,在終端輸入:ll
安裝成功會出現以下資訊:
步驟四:安裝Anaconda3
1、Anaconda 安裝包可以到 清華源下載;也可以去官網下載 官網
找到自己需要安裝的Anaconda3的版本。
2、本次使用的是Anaconda3-5.2.0-Linux-x86_64.sh
到下載路徑在終端開啟,執行以下命令:
bash Anaconda3-5.2.0-Linux-x86_64.sh
按q跳過介紹,輸入yes
回車:
直到顯示安裝完成。
安裝完成以後在終端輸入:conda list 檢測是否安裝成功。
步驟五:安裝TensorFlow-gpu
1、因為Python3.6版本的也可以用,對於有強迫症的我選擇了安裝
新增源並更新命令列:
- sudo add-apt-repository ppa:fkrull/deadsnakes
- sudo apt-get update
安裝指定版本的python:
sudo apt-get install python3.6 python3.6-dev
2、我只用了pip安裝,原始碼安裝太麻煩沒有采用
安裝pip:
sudo apt-get install python3-pip
更新pip:
pip install --upgrade pip
3、利用pip來安裝tensorflow-gpu
- pip install tensorflow-gpu #(預設下載最新的版本)
- pip install tensorflow-gpu==1.6.0 #(下載1.6版本的,想下載哪個版本自己定)
4、測試是否安裝成功
我的第一次匯入報錯了,接著再匯入就成功了;
查閱資料才知道原因是:
h5py新版本對numpy1.14版本的相容錯誤
解決辦法:
pip install h5py==2.8.0rc1
果然消失了。
總結
現在軟硬體更新太快了,以後系統出問題了估計這個方式也不能用了!所以有安裝不上的小夥伴可以留下腳印,大家一起研究交流,共同學習,一起進步。