Ubuntu Server 18.04 搭建深度學習平臺
1、設定python版本
sudo update-alternatives --install /usr/bin/python python /usr/bin/python3 150
2、安裝Anaconda虛擬環境管理
wget https://repo.anaconda.com/archive/Anaconda3-5.3.0-Linux-x86_64.sh
# bash Anaconda3-5.2.0-Linux-x86_64.sh
記得把環境變數新增在系統中,最後是否安裝VScode建議不安裝
3、安裝CUDA和cuDNN,在版本選擇上因為GPU原因選擇CUDA10.0和相應的cuDNN
https://developer.nvidia.com/cuda-10.0-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1804&target_type=debnetwork
https://developer.nvidia.com/rdp/cudnn-download
4、下載並安裝GPU驅動
https://www.nvidia.cn/Download/index.aspx?lang=cn
lsmod | grep nvidia,如果有NVIDIA驅動,請先解除安裝
lsmod | grep nouveau,如果有其他驅動,將其他顯示卡驅動加入黑名單,操作如下:
cd /etc/modprobe.d/
建立blacklist-nouveau.conf並新增內容
sudo touch blacklist-nouveau.conf
sudo echo "blacklist nouveau">>blacklist-nouveau.conf
sudo echo "options nouveau modeset=0">>blacklist-nouveau.conf
檢視blacklist-nouveau.conf內容是否新增成功
sudo cat blacklist-nouveau.conf
update initramfs -u 現在請重啟機器,使用init 3進入命令列介面
sudo chmod +x NVIDIAXXXXXXXXX.run
sudo ./NVIDIAXXXXXXXX.run -no-opengl-files 完成安裝
nvidia-smi檢查顯示卡是否在工作
5、建立conda虛擬環境,安裝Tensorflow或者Pytorch
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
conda config --set show_channel_urls yes
conda create --name XXXX python=3.X
conda install pytorch torchvision cudatoolkit=10.0 -c pytorch
到這裡,你的深度學習平臺已經搭建完成,你可以把它分享給其他人使用了。
不足之處,還望指正,謝謝!!