1. 程式人生 > 實用技巧 >win10+cuda+cudnn+anaconda環境安裝

win10+cuda+cudnn+anaconda環境安裝

  實驗室新來了一臺伺服器,唉,花了我3天的時間去安裝他那個環境,記一下安裝流程,希望可以幫助一下苦苦安裝環境的小夥伴吧!
先說一下新伺服器的配置:見下圖:

  這是在英偉達官網下載驅動程式設定引數的時候截的圖,我下載的驅動是‘457.09’版本的,沒啥注意的,我就隨便安裝了一下!

1、CUDA的安裝

  接下來是CUDA的安裝,我開始一直使用的是CUDA11.1,但是因為各種各樣的錯誤,導致我的環境安裝不成功,我覺得可能是因為CUDA11.1太新了,導致tensorflow沒法匹配,而我在網上能看到的最新的CUDA和tensorflow對應的版本就是CUDA10.1。所以我果斷解除安裝了CUDA11.1,安裝了CUDA10.1,這個是網址 ‘

https://developer.nvidia.com/cuda-toolkit-archive’
下圖是我下載的版本:

  安裝的過程一直預設就行了!安裝之後需要配置環境變數,因為搜了很多部落格,導致後來都不知道到底需要配置哪些環境變數,所以索性把所有的環境變數都寫上了,這裡附上我配置環境的的那個網址吧 , "https://blog.csdn.net/vastz/article/details/108813557",也可以參照這個部落格進行安裝。我配置的環境是下面這樣的,第一張是系統裡面配置,第二張在使用者的path裡面配置的,應該有很多事沒必要的。

  完事之後可以進入win+R進入命令列,檢視安裝成功如否,一個是"nvcc -V",這個是檢視你安裝的資訊的;另一個是"nvidia-smi",這是檢視你GPU資訊的,見下圖,如果出現了和我類似的資訊的話,那麼CUDA就安裝完成了。

2、cudnn安裝

  之後是下載cudnn,又是不敢使用太新的版本,所以我下載的是cudnn7.6.5,下載cudnn需要登入郵箱,隨便用一個郵箱登入就行了,也支援QQ和微信登入!附一下網址 "https://developer.nvidia.com/rdp/cudnn-archive"

cudnn下載完事之後,將資料夾解壓,然後將裡面的bin、include和lib複製"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1"裡面,不用擔心會覆蓋,因為根本沒有重複的檔案,大膽複製!

3、Python及TensorFlow-gpu的安裝

先安裝Python,我用的是Python3.6,因為這個版本相容性好一點,可以直接安裝Python,去python官網下載就行,也可以安裝anaconda,這裡我就用anaconda舉例,因為我用的是這個。anaconda也別太新,裡面的Python版本是3.6的就行了,anaconda安好了之後開啟anaconda prompt,接下來安裝環境就是在這裡進行(如果是沒用anaconda的話,直接使用win+R的命令列)。
  可以先用"pip list"來看一下自己有哪些包,然後安裝TensorFlow-gpu 2.1.0,用清華映象會快點,指令為"pip install tensorflow-gpu==2.1 -i

https://pypi.tuna.tsinghua.edu.cn/simple",裡面的版本號隨便改都能用,這就完事了,其他的包對應著版本安裝就OK了!
然後就是測試環境是不是都相容了,最好去安裝的Python裡面開啟python.exe,因為如果有錯誤他會提示的很詳細,這樣也方便百度去解決,輸入指令:

import tensorflow as tf
print(tf.test.is_gpu_available())

  基本上這個指令正確的輸出資訊那就可以了,說明安裝完成了!可以參照一下下面的截圖,由於資訊太多,所以只有後面部分,參照一下:

4、說一下我出現的幾個錯誤。

(1)'ImportError: No module named 'tensorflow.python.pywrap_tensorflow_internal''
一般出現這句話的錯誤那就是tensorflow-gpu版本不對了,解除安裝重新安裝tensorflow-gpu就行了!
(2)出現下面這種錯誤:
  這個就是你GPU的視訊記憶體不夠,要麼就是網路訓練的時候batch_size太大,要麼就是通過用一個GPU訓練多個網路,改一下就好了!
因為我這是後來寫的部落格,所以很多錯誤都忘了,不能列舉很多了,不好意思,但是我覺得如果版本都對應上,基本就不會有錯誤了!