Ubuntua16.04 通過anaconda安裝tensorflow-gpu
關於如何安裝
Ubuntu16.04
以及顯示卡驅動、網絡卡驅動問題,你可以閱讀這三篇篇請對照選項,解決相應的問題。這裡我要強調一點顯示卡驅動
現在可以安裝387
(推薦安裝)。這裡要說的一點是:請查清楚對應顯示卡驅動的穩定版本
我這篇文章的目的是希望給你提供一個正確的安裝思路,不是對於一些問題的特解,而是一個更加廣泛的解決思路。
首先,我要先說幾個重點
- 不要安裝非長期支援的
Ubuntu
版本(17.04,17.10) tensorflow
版本請和cuda
、cudnn
配套
關於第一點,如果你安裝了非長期支援的版本(非LTS
),那麼你會面臨的問題就會非常多。一般非長期支援版本的支援時間為1年,而長期版本的支援時間為5年。如果過了這個時間的話,不會得到軟體更新支援。所以對於那些安裝了這些版本的人,我建議你們還是重灌系統,免得以後麻煩。這裡要說的是,關於Ubuntu 18.04LTS
tensorflow
和cuda
都還沒有支援。關於第二點問題,這是本次安裝的重點。你可以看到我在文章的標題寫的也很詳細。這是因為,你一定要對應版本匹配,否則會出現一些問題。
我們這裡使用cuda9.0
,注意不是cuda9.1。因為如果你通過搜尋訪問cuda
的話,nvidia
官方預設會提供給你的是最新的釋出版本,但是tensorflow
一般都還沒有支援最新版本。這也是我要強調的:請查清楚你的tensorflow版本對應的cuda版本
你可以通過在nvidia
開發者官網內搜尋,找到你想要的版本
這裡關於cudnn
的安裝同樣,我們這裡選擇cudnn7.04
tensorflow1.6
可以支援的最高版本。如果你安裝錯了,可以通過如下命令消除
sudo rm /usr/local/cuda/include/cudnn.h
sudo rm /usr/local/cuda/lib64/libcudnn*
- 1
- 2
對於上面的方法,根據你安裝資料夾的不同做相應調整。
安裝cuda
時一個有用的操作:我們在安裝好cuda
後,會編輯相應的.bashrc
檔案,我推薦你這樣去寫
#cuda
export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH :+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda
- 1
- 2
- 3
- 4
你注意到,我在寫的時候export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
,我沒有將cuda
寫成相應的cuda
版本。如export PATH=/usr/local/cuda9.0/bin${PATH:+:${PATH}}
。這樣寫的好處是,我們只要將usr/local
目錄下的不同版本的cuda
通過軟連線,去連結就可以了,不用再每次安裝不同的cuda
後,去修改相應的.bashrc
檔案。我之前在這個步驟掉進坑裡,環境變數配置錯誤導致tensorflow裝好了卻載入不上,我以為是cuda版本不對,來來回回試了好幾個版本,最後發現只不過是環境變數沒配置好.....
通過如下命令建立一個cuda->cuda-9.0
的連線。
sudo ln -s cuda-9.0 cuda
- 1
還要提醒你要注意的一點是,安裝tensorflow
時,不要忘記後面的-gpu
選項。
sudo pip install tensorflow-gpu
- 1
最後我要說的是,不要認為現在裝好了就萬事大吉了,因為如果cuda
和tensorflow
都支援了Ubuntu 18.04LTS
的話,你最好重灌系統,安裝Ubuntu 18.04LTS
。因為很多後來發表的文章對應的程式碼,都會使用最新的軟體編寫(●’◡’●)。另外,我也不推薦你使用python 2.7
,因為python2.7
到2020年,就不再支援相應的維護了。
所以以上軟體,你最好安裝對應的python 3.x
版本。
都2018年了,你不用python 3.x
,你不用c++11/14/17
,還在用那些過時的東西,你是真的out了。當然了,學習的過程肯定是從古典到現代的^_^ !!!