1. 程式人生 > 實用技巧 >nvidia驅動和CUDA的安裝

nvidia驅動和CUDA的安裝

開篇需要強調的一點是,如果你是將要進行深度學習方面的學習。在環境配置和安裝方面一定要記得 自己顯示卡的型號——Nvidia驅動版本——CUDA版本——python版本——pytorch/tensorflow版本 以上五者齊對應。即此五者不同版本之間有相互的支援,比如你安裝CUDA版本的時候就需要查詢以下相對應支援的驅動版本的要求。

這裡放幾個連線,大家可以參考

Cuda與驅動

https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

驅動與自己的顯示卡

https://www.nvidia.com/Download/index.aspx?lang=en-us

(以下講述預設為Linux系統下的安裝,偶爾會提一下Windows下的情況。)

接下來我們進入Nvidia驅動的安裝

第一步先nvidia-smi

出現上圖的話,就是本就安好了Nvidia驅動。我們可以在上面看到驅動版本450.66

如果你是Windows系統,可以在cmd裡面進入C:\Program Files\NVIDIA Corporation\NVSMI 目錄,然後nvidia-smi 。Windows系統上還可以直接在桌面上面右鍵點nvidia控制面板的

然後點選系統資訊

如果你覺得這個版本不合適的話,可以解除安裝。

如果是Windows系統下的話,就在控制面板裡面的“程式”中解除安裝,和解除安裝普通軟體一樣。至於解除安裝哪一個東西,你就看名字,

名字中帶有NVIDIA名字並且帶有你的驅動版本那個數字的都卸掉。

在Linux系統中,敲

sudo /usr/bin/nvidia-uninstall

(總之在類似的目錄中去找nvidia-uninstall)

解除安裝之後,如果敲之前的命令nvidia-smi出錯的話,那就是解除安裝成功了。

接下來就是驅動的安裝了

去官網上面按照自己的顯示卡的情況下載相應版本的驅動。

然後會下載相應的.run檔案。

我們再修改其許可權。

chmod +x NVIDIA-Linux-x86_64-340.65.run

接下來就是正式安裝

但如果你直接

sudo ./NVIDIA-Linux-x86_64-340.65.run

會報以下這些錯誤:

那麼這個時候我們就只能

先按ctrl+alt+f1進入到下面這個控制介面

輸入使用者名稱密碼之後就登入進去了

然後

sudo service lightdm stop

sudo ./NVIDIA-Linux-x86_64-340.65.run

(插播一下,這裡我曾經出現過一個尷尬問題,就是我.run的檔案在“下載”目錄裡面。然後我執行它就需要進入“下載”目錄,或者在路徑中用Downloads。結果應該是中文亂碼的原因當我ctrl+alt+f1之後,下載目錄在ls下直接找不到了。。。最後就只能reboot,然後把下載目錄中的.run檔案移動到其它目錄,然後再ctrl+alt+f1進入操作)

接下來的各種選擇(只有一個選項的圖片我就不放了)

最後測試

nvidia-smi

沒有問題的話就結束了

接下來安裝CUDA

首先看是不是已經有CUDA了

nvcc -V

可以看到自己的CUDA版本。

如果找不到命令則是沒有安裝(當然也可能是環境變數沒有配置好,所以最好是去/usr/local下的cuda資料夾下面搜尋以下看有沒有名字nvcc這個檔案。如果有說明安裝好了。)

沒有則現在來安裝。

首先下載,注意選擇相應版本。

(注意anaconda和Pycharm裡面也能夠搜尋到一個叫cudatoolkit的包,這個和我們現在要安裝的CUDA是兩回事!!!)

然後執行

chmod +x ???????.run

sudo ./???????.run

問號裡面是你的.run檔名字,相應替換即可。

Driver這個選項去掉即可,然後Install

接下來設定環境變數

sudo vim ~/.bashrc

在檔案中追加

export PATH=/usr/local/cuda-9.0/bin:$PATH

export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64$LD_LIBRARY_PATH

如果nvcc -V沒錯,那就是已經成功了。如果出錯的話,就先去usr/local/裡面的cuda資料夾裡面找找看是否有nvcc檔案,如果有說明只是環境變數設定錯誤,如果沒有說明cuda沒有正常安裝。