ubuntu安裝指定版本nvidia驅動、CUDA、nvidia-docker
阿新 • • 發佈:2022-03-29
https://www.jianshu.com/p/8140cbc6ae68
這個版本比較好
1、安裝指定版本nvidia 驅動和CUDA
1.下載nvidia驅動和CUDA
nvidia驅動網址https://www.nvidia.cn/Download/index.aspx?lang=cn
CUDA網址https://developer.nvidia.com/cuda-toolkit-archive
CUDA
2.建立nvidia資料夾並拷貝
sudo mkdir /work sudo chown -R casia:casia /work/ cd /work/ sudo apt-get update sudo apt-get install -y gcc make python3-pip mkdir nvidia cd nvidia/
將下載好的nvidia驅動和CUDA拷貝到改資料夾
3.安裝nvidia驅動和CUDA
sudo sh NVIDIA-Linux-x86_64-450.102.04.run 三次回車
sudo sh cuda_11.0.2_450.51.05_linux.run
鍵入accept回車->選擇Install回車
4.檢驗
nvidia-smi
2、安裝 nvidia-docker
在使用帶有 cuda 環境的 docker 容器之前,首先需要安裝 nvidia-docker 元件
2.1 安裝docker
方法一:
curl -fsSL https://get.docker.com | bash -s docker --mirror Aliyun
方法二:
# 更新 apt 包索引
sudo apt-get update
# 安裝 apt 依賴包,用於通過HTTPS來獲取倉庫
sudo apt-get install -y \
apt-transport-https \
ca-certificates \
curl \
gnupg-agent \
software-properties-common
# 新增 Docker 的官方 GPG 金鑰
curl -fsSL https://mirrors.ustc.edu.cn/docker-ce/linux/ubuntu/gpg | sudo apt-key add –
# 使用以下指令設定穩定版倉庫
sudo add-apt-repository \
"deb [arch=amd64] https://mirrors.ustc.edu.cn/docker-ce/linux/ubuntu/ \
$(lsb_release -cs) \
stable"
# 更新 apt 包索引
sudo apt-get update
# 安裝最新版本的 Docker Engine-Community 和 containerd
sudo apt-get install -y docker-ce docker-ce-cli containerd.io
# 把當前使用者加入到docker組中
sudo gpasswd -a ${USER} docker
# 重啟docker服務
sudo service docker restart
2.2 新增 nvidia-docker 源
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/ubuntu18.04/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update
2.3 安裝 nvidia-docker2
安裝 nvidia-docker2
後重啟 docker
使得 nvidia-docker2
生效。
$ sudo apt-get install -y nvidia-docker2
$ sudo systemctl restart docker
2.4 配置nvidia-docker
修改/etc/docker/daemon.json檔案配置如下
sudo vim /etc/docker/daemon.json
{
"default-runtime": "nvidia",
"runtimes": {
"nvidia": {
"path": "nvidia-container-runtime",
"runtimeArgs": []
}
}
}
sudo systemctl daemon-reload
sudo systemctl restart docker
3、測試
- 測試。
python3 -m pip install torch==1.7.1+cu110 torchvision==0.8.2+cu110 -f https://download.pytorch.org/whl/torch_stable.html
python3
import torch
torch.cuda.is_available()
torch.version.cuda
torch.zeros(1).cuda(0)
torch.zeros(1).cuda(1)
torch.zeros(1).cuda(2)
torch.zeros(1).cuda(3)
torch.zeros(1).cuda(4)
torch.zeros(1).cuda(5)
torch.zeros(1).cuda(6)
torch.zeros(1).cuda(7)
torch.cuda.device_count()
- 如果報錯是GeForce RTX 3080 with CUDA capability sm_86 is not compatible with the current PyTorch installation. The current PyTorch install supports CUDA capabilities sm_37 sm_50 sm_60 sm_61 sm_70 sm_75 compute_37.那麼一定是cuda版本的問題了。安裝cuda版本不對,解決方案:根據算力下載對應版本cuda
作者:blair_liu
連結:https://www.jianshu.com/p/8140cbc6ae68
來源:簡書
著作權歸作者所有。商業轉載請聯絡作者獲得授權,非商業轉載請註明出處。