本文已参与「新人创作礼」活动,一起开启掘金创作之路。

官网地址如下: docs.nvidia.com/ai-enterpri…

(如果没有sudo权限就坑了,要确保有超级管理员权限)

首先要确保本机是否安装了docker,先更新apt包索引:

sudo apt-get update

安装结束如下:

安装软件包以允许 apt 通过 HTTPS 使用存储库:

$ sudo apt-get install -y \
    apt-transport-https \
    ca-certificates \
    curl \
    gnupg-agent \
    software-properties-common

安装结束如下:

接下来,使用以下命令添加 Docker 的官方 GPG 密钥:

$ curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -

输出结果如下:

通过搜索指纹的最后 8 个字符,验证现在是否拥有指纹为 9DC8 5822 9FC7 DD38 854A E2D8 8D81 803C 0EBF CD88 的密钥:

$ sudo apt-key fingerprint 0EBFCD88
pub   rsa4096 2017-02-22 [SCEA]
    9DC8 5822 9FC7 DD38 854A  E2D8 8D81 803C 0EBF CD88
uid           [ unknown] Docker Release (CE deb) <docker@docker.com>
sub   rsa4096 2017-02-22 [S]

结果如下:

使用以下命令设置稳定存储库:

$ sudo add-apt-repository \
"deb [arch=amd64] https://download.docker.com/linux/ubuntu \
$(lsb_release -cs) \
stable"

结果如下:

安装 Docker 引擎:

sudo apt-get update

结果如下:

$ sudo apt-get install -y docker-ce docker-ce-cli containerd.io

我自己跑的时候报了个错,重新执行一下,结果如下:

通过运行 hello-world 映像来验证 Docker Engine - Community 是否已正确安装:

$ sudo docker run hello-world

结果如下:

到此docker就安装成功了:

输入docker info也不会出现命令找不到的错误了:

对于 Docker 20.10 和 GPU 的首次用户,请继续按照下面的入门说明进行操作。

  • 添加软件包存储库:
  • $ distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
    $ curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
    $ curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
    
  • 从所有已配置的源下载有关软件包最新版本的信息并安装nvidia-container-toolkit软件包:
  • $ sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
    3. 重启 Docker 服务:

    sudo systemctl restart docker
    

    测试 DOCKER 和 NVIDIA 容器运行时

    $ sudo docker run --gpus all nvidia/cuda:11.0-base nvidia-smi
    
    $ sudo docker run --gpus 2 nvidia/cuda:11.0-base nvidia-smi
    复制代码