深度學習docker配置

阿新 • • 發佈：2020-11-21

docker安裝

以下來自阿里雲映象站: Ubuntu 14.04/16.04（使用 apt-get 進行安裝）

# step 1: 安裝必要的一些系統工具
sudo apt-get update
sudo apt-get -y install apt-transport-https ca-certificates curl software-properties-common
# step 2: 安裝GPG證書
curl -fsSL https://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg | sudo apt-key add -
# Step 3: 寫入軟體源資訊
sudo add-apt-repository "deb [arch=amd64] https://mirrors.aliyun.com/docker-ce/linux/ubuntu $(lsb_release -cs) stable"
# Step 4: 更新並安裝Docker-CE
sudo apt-get -y update
sudo apt-get -y install docker-ce

# 安裝指定版本的Docker-CE:
# Step 1: 查詢Docker-CE的版本:
# apt-cache madison docker-ce
#   docker-ce | 17.03.1~ce-0~ubuntu-xenial | https://mirrors.aliyun.com/docker-ce/linux/ubuntu xenial/stable amd64 Packages
#   docker-ce | 17.03.0~ce-0~ubuntu-xenial | https://mirrors.aliyun.com/docker-ce/linux/ubuntu xenial/stable amd64 Packages
# Step 2: 安裝指定版本的Docker-CE: (VERSION例如上面的17.03.1~ce-0~ubuntu-xenial)
# sudo apt-get -y install docker-ce=[VERSION]

新增使用者組，不需要再輸入`sudo`

參考資料：docer docs: linux-postinstall

sudo groupadd docker
# 新建docker使用者組
sudo usermod -aG docker $USER
# 把上面的 $user 替換為你的使用者名稱
newgrp docker
# 更新使用者組
docker run hello-world
# 測試一下

Note:

If testing on a virtual machine, it may be necessary to restart the virtual machine for changes to take effect.(如果是在虛擬機器中，有必要重啟虛擬機器)
On a desktop Linux environment such as X Windows, log out of your session completely and then log back in.(在桌面Linux系統中，完全登出會話並重新登入)
如果不想重啟系統還可以試試這個: sudo systemctl restart docker，來自stackoverflow: How to fix docker: Got permission denied issue
終極解決方案：sudo reboot

搭建tensorflow-gpu docker環境

配置nvidia-docker

# $distribution是作業系統版本，如 ubuntu16.04
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - \
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update
sudo docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi
# 測試安裝

docker pull tensorflow/tensorflow:1.15.4-gpu-py3
#拉取tensorflow1.15.4 gpu版

啟動docker
```
docker run -it -p 8022:22 --ipc host --name docker_example --gpus all tensorflow/tensorflow:1.15.4-gpu-py3 /bin/bash
```
-i 表示 Allocate a pseudo-tty
-t 表示 Keep STDIN open even if not attached
-p 表示對埠號進行對映，即將 docker 容器的 22 號埠對映到宿主機的 8022 埠，這樣設定的目的是方便後續使用 VSCode 連線容器，可以根據需要進行設定（如果要連線多個container，可以把8022改成別的埠）
-ipc host 的目的是為了增加主機與容器共享記憶體用的，如果這個引數報錯，還可以採用--shm-size引數
--name docker_example 是將容器命名為 docker_example，docker 有長id、短id、name三個標識，如果不指定名稱則會隨機名稱
--gpus all 是使用全部宿主機 GPU，這裡的設定可以參考 nvidia-docker 的 Usage 具體設定使用哪個卡（深度學習要注意這裡）
1. -v /path:/path/in/container 這是將宿主機的/path目錄與容器的/path/in/container目錄掛載
2. -v path:/path/in/container 這段語句的意思是在容器裡掛載名為path的卷，它的存放位置是/path/in/container
tensorflow/tensorflow:1.15.4-gpu-py3 是指定使用的映象版本，這裡的版本可以在 docker-hub 查到

Note：這裡要指定--gpus all否則無法呼叫GPU
參考資料：知乎: Docker+VSCode配置屬於自己的煉丹爐

在docker中安裝ssh並在外部使用ssh登入

mkdir /var/run/sshd
echo 'root:passwd' | chpasswd
# 這裡使用你自己想設定的使用者名稱和密碼`（這裡是passwd）`，但是一定要記住！
sed -i 's/PermitRootLogin prohibit-password/PermitRootLogin yes/' /etc/ssh/sshd_config
sed 's@session\s*required\s*pam_loginuid.so@session optional pam_loginuid.so@g' -i /etc/pam.d/sshd
echo "export VISIBLE=now" >> /etc/profile
service ssh restart

在宿主機上測試

sudo docker port [your_container_name] 22
# 如果前面的配置生效了，你會看到如下輸出
# 0.0.0.0:8022

在本地上測試
ssh root@[your_host_ip] -p 8022
如果成功登入的話說明docker已經設定好了

由container匯出image
```
docker commit -m="has update" -a="runoob" e218edb10161 runoob/ubuntu:v2
```
-m: 提交的描述資訊

-a: 指定映象作者

e218edb10161：容器 ID(就是進入bash之後的root@a692e18a2e56中的a692e18a2e56)

runoob/ubuntu:v2: 指定要建立的目標映象名

Ubuntu，pip，anaconda換源

Ubuntu
Aliyun開源映象站: Ubuntu映象
編輯/etc/apt/sources.list

deb http://mirrors.aliyun.com/ubuntu/ xenial main
deb-src http://mirrors.aliyun.com/ubuntu/ xenial main

deb http://mirrors.aliyun.com/ubuntu/ xenial-updates main
deb-src http://mirrors.aliyun.com/ubuntu/ xenial-updates main

deb http://mirrors.aliyun.com/ubuntu/ xenial universe
deb-src http://mirrors.aliyun.com/ubuntu/ xenial universe
deb http://mirrors.aliyun.com/ubuntu/ xenial-updates universe
deb-src http://mirrors.aliyun.com/ubuntu/ xenial-updates universe

deb http://mirrors.aliyun.com/ubuntu/ xenial-security main
deb-src http://mirrors.aliyun.com/ubuntu/ xenial-security main
deb http://mirrors.aliyun.com/ubuntu/ xenial-security universe
deb-src http://mirrors.aliyun.com/ubuntu/ xenial-security universe

pip

#建立目錄
mkdir -p ~/.pip
#修改配置檔案
vim  ~/.pip/pip.conf #windows下是pip.ini
#寫入以下內容並儲存
[global]
index-url = https://mirrors.aliyun.com/pypi/simple/

anaconda

channels:
- defaults
show_channel_urls: true
channel_alias: https://mirrors.bfsu.edu.cn/anaconda
default_channels:
- https://mirrors.bfsu.edu.cn/anaconda/pkgs/main
- https://mirrors.bfsu.edu.cn/anaconda/pkgs/free
- https://mirrors.bfsu.edu.cn/anaconda/pkgs/r
- https://mirrors.bfsu.edu.cn/anaconda/pkgs/pro
- https://mirrors.bfsu.edu.cn/anaconda/pkgs/msys2
custom_channels:
conda-forge: https://mirrors.bfsu.edu.cn/anaconda/cloud
msys2: https://mirrors.bfsu.edu.cn/anaconda/cloud
bioconda: https://mirrors.bfsu.edu.cn/anaconda/cloud
menpo: https://mirrors.bfsu.edu.cn/anaconda/cloud
pytorch: https://mirrors.bfsu.edu.cn/anaconda/cloud
simpleitk: https://mirrors.bfsu.edu.cn/anaconda/cloud

conda 匯入匯出環境

conda env export > py36.yaml #匯出當前環境至py36.yaml
conda env create -f py36.yaml #從py36.yaml匯入

深度學習docker配置

docker安裝以下來自阿里雲映象站: Ubuntu 14.04/16.04（使用 apt-get 進行安裝） # step 1: 安裝必要的一些系統工具

pytorch深度學習環境配置

深度學習環境配置本文配置的環境是以Ubuntu20作業系統為例，使用的是nvidia的顯示卡.

Ubuntu18 系統下深度學習環境配置

技術標籤：ubuntu深度學習目錄 1、顯示卡驅動+cuda11.1+cudnn8.0.4 【刪除cuda】【安裝cuda】

2021年，深度學習主機配置推薦。10850K,10900K,5900X,5950X搭配3090顯示卡

最近很多朋友諮詢深度學習主機的配置（渲染主機也基本適用）。3萬元內的預算目前可以選擇10850K,10900K,5900X,5950X這4款CPU。

吳恩達深度學習環境配置

1.安裝anaconda,安裝過程勾選上環境變數的配置 2.開啟cmd，輸入activate回車進入base環境，輸入conda create -n dl python=3.6,建立了一個名為dl的基於python3.6的虛擬環境。

深度學習環境配置 ubuntu安裝CUDA10.2失敗！

深度學習環境配置 ubuntu安裝CUDA10.2失敗！按照網上教程安裝CUDA10.1 或 CUDA10.2時候，即執行官方的命令的時候

深度學習伺服器完整配置手冊（三、GPU顯示卡cuda和驅動一起安裝，docker安裝）

引用： https://developer.nvidia.com/cuda-downloads https://blog.csdn.net/FYZ530357172/article/details/79217460

使用亞馬遜AWS雲伺服器進行深度學習——免環境配置/GPU支援/Keras/TensorFlow/OpenCV

前言吐槽：由於科研任務，需要在雲端執行一個基於神經網路的目標識別庫，需要用到GPU加速。亞馬遜有很多自帶GPU的機器，但是環境的配置可折騰壞了，尤其是opencv，每次總會出各種各樣的問題！

Linux-非Root使用者-配置深度學習環境

1 簡介 Anaconda:是一個開源的Python發行版本，其包含了conda、Python等軟體包，numpy，pandas，scipy等科學計算包.

ubuntu16.04配置深度學習環境

安裝CUDA-9.0 1、CUDA的安裝比較容易，官網下載9.0版本，選擇對應系統，請下載runfile

Ubuntu和Windons系統安裝配置深度學習環境

Ubuntu系統 1、備份在伺服器上整個裝系統之前，需要做好一個工作，也就是相關重要資料的備份，這裡主要是將固態中的資料備份到機械硬碟或移動硬盤裡，可能在備份的過程中會遇到無法寫入的問題，是因為資料夾的屬性可

2020-12-17配置Ubuntu18.04深度學習開發環境

技術標籤：安裝教程一、硬體簡介顯示卡型別：GeForce GTX 1060 mobile 顯示卡驅動：NVIDIA-SMI 450.66

深度強化學習環境配置----spinningup配置

1、官網連線英文：https://spinningup.openai.com/en/latest/ 中文：https://spinningup.qiwihui.com/zh_CN/latest/index.html

深度學習框架 MindSpore —— 華為出品的AI計算框架， docker 安裝

深度學習框架 MindSpore —— 華為出品的AI計算框架官網地址： https://www.mindspore.cn/

一文帶你玩轉深度學習：神經網路基礎知識、環境配置、theano、TensorFlow

今天來聊聊深度學習，深度學習到底有多熱門，這樣說吧，總之你能想象到的領域，在未來都可能應用到深度學習，非常值錢。更重要的是，“深度學習”演算法包含精妙的思想，可以體現這個時代的精神。

基於docker的深度學習開發環境

docker 安裝docker (release>=19.02)安裝NVIDIA Container Toolkit https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/install-guide.html#docker

深度學習環境安裝配置

一、概述 1、作業系統：win10 2、顯示卡：3080單卡 3、Anaconda：Python3.8版 4、visual studio：community 2019：安裝cuda必須要安裝visual studio；

配置個人深度學習工作站

這裡主要配置ssh,如果配置遠端桌面比較卡頓區域網內安裝ssh sudo apt install ssh 安裝xrdp

在伺服器的docker裡裝anacond3深度學習環境的全流程超基礎

背景：實驗室給我分配了一個伺服器已經裝好了docker 和nvidi docker 。現在我的目標是建立我自己的docker 然後在我自己的docker裡裝上anaconda環境。我以前從沒用過linux。所以對這一切都是迷迷茫茫不知其所

深度學習第一步 Windows+NVIDA配置 CUDA pytorch 環境

深度學習第一步 Windows+NVIDA配置 CUDA pytorch 環境感謝 Windows 下安裝 CUDA 和 Pytorch 跑深度學習 - 動手學深度學習v2_嗶哩嗶哩_bilibili

深度學習docker配置

docker安裝

新增使用者組，不需要再輸入sudo

搭建tensorflow-gpu docker環境

Ubuntu，pip，anaconda換源

相關推薦

新增使用者組，不需要再輸入`sudo`