nvidia驅動和CUDA的安裝
開篇需要強調的一點是,如果你是將要進行深度學習方面的學習。在環境配置和安裝方面一定要記得 自己顯示卡的型號——Nvidia驅動版本——CUDA版本——python版本——pytorch/tensorflow版本 以上五者齊對應。即此五者不同版本之間有相互的支援,比如你安裝CUDA版本的時候就需要查詢以下相對應支援的驅動版本的要求。
這裡放幾個連線,大家可以參考
Cuda與驅動
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
驅動與自己的顯示卡
https://www.nvidia.com/Download/index.aspx?lang=en-us
(以下講述預設為Linux系統下的安裝,偶爾會提一下Windows下的情況。)
接下來我們進入Nvidia驅動的安裝
第一步先nvidia-smi
出現上圖的話,就是本就安好了Nvidia驅動。我們可以在上面看到驅動版本450.66
如果你是Windows系統,可以在cmd裡面進入C:\Program Files\NVIDIA Corporation\NVSMI 目錄,然後nvidia-smi 。Windows系統上還可以直接在桌面上面右鍵點nvidia控制面板的
然後點選系統資訊
如果你覺得這個版本不合適的話,可以解除安裝。
如果是Windows系統下的話,就在控制面板裡面的“程式”中解除安裝,和解除安裝普通軟體一樣。至於解除安裝哪一個東西,你就看名字,
名字中帶有NVIDIA名字並且帶有你的驅動版本那個數字的都卸掉。
在Linux系統中,敲
sudo /usr/bin/nvidia-uninstall
(總之在類似的目錄中去找nvidia-uninstall)
解除安裝之後,如果敲之前的命令nvidia-smi出錯的話,那就是解除安裝成功了。
接下來就是驅動的安裝了
去官網上面按照自己的顯示卡的情況下載相應版本的驅動。
然後會下載相應的.run檔案。
我們再修改其許可權。
chmod +x NVIDIA-Linux-x86_64-340.65.run
接下來就是正式安裝
但如果你直接
sudo ./NVIDIA-Linux-x86_64-340.65.run
會報以下這些錯誤:
那麼這個時候我們就只能
先按ctrl+alt+f1進入到下面這個控制介面
輸入使用者名稱密碼之後就登入進去了
然後
sudo service lightdm stop
sudo ./NVIDIA-Linux-x86_64-340.65.run
(插播一下,這裡我曾經出現過一個尷尬問題,就是我.run的檔案在“下載”目錄裡面。然後我執行它就需要進入“下載”目錄,或者在路徑中用Downloads。結果應該是中文亂碼的原因當我ctrl+alt+f1之後,下載目錄在ls下直接找不到了。。。最後就只能reboot,然後把下載目錄中的.run檔案移動到其它目錄,然後再ctrl+alt+f1進入操作)
接下來的各種選擇(只有一個選項的圖片我就不放了)
最後測試
nvidia-smi
沒有問題的話就結束了
接下來安裝CUDA
首先看是不是已經有CUDA了
nvcc -V
可以看到自己的CUDA版本。
如果找不到命令則是沒有安裝(當然也可能是環境變數沒有配置好,所以最好是去/usr/local下的cuda資料夾下面搜尋以下看有沒有名字nvcc這個檔案。如果有說明安裝好了。)
沒有則現在來安裝。
首先下載,注意選擇相應版本。
(注意anaconda和Pycharm裡面也能夠搜尋到一個叫cudatoolkit的包,這個和我們現在要安裝的CUDA是兩回事!!!)
然後執行
chmod +x ???????.run
sudo ./???????.run
問號裡面是你的.run檔名字,相應替換即可。
Driver這個選項去掉即可,然後Install
接下來設定環境變數
sudo vim ~/.bashrc
在檔案中追加
export PATH=/usr/local/cuda-9.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64$LD_LIBRARY_PATH
如果nvcc -V沒錯,那就是已經成功了。如果出錯的話,就先去usr/local/裡面的cuda資料夾裡面找找看是否有nvcc檔案,如果有說明只是環境變數設定錯誤,如果沒有說明cuda沒有正常安裝。