docker安装
docker安装以及docker pull失败可以参考一下链接 docker安装教程以及解决docker pull失败
我遇到的问题是docker pull失败的问题解决如下:
1.创建docker代理目录
sudo mkdir -p /etc/systemd/system/docker.service.d
2.配置docker代理
sudo gedit /etc/systemd/system/docker.service.d/proxy.conf
//文件内容
[Service]
Environment="HTTP_PROXY=http://127.0.0.1:7897"
Environment="HTTPS_PROXY=http://127.0.0.1:7897"
Environment="NO_PROXY=localhost,127.0.0.1"
上面7897指的是你开代理的时候你自己的端口,可以通过clash去查看
3.重启docker
sudo systemctl daemon-reload
sudo systemctl restart docker
配置docker容器使用宿主环境的GPU显卡
1. 在宿主环境安装NVIDIA Container Toolkit:
# 设置软件源存储库和GPG密钥
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
# 更新软件包列表
sudo apt-get update
# 安装nvidia-container-toolkit
sudo apt-get install -y nvidia-container-toolkit
2.验证安装: 安装完成后,尝试运行一个测试容器
sudo docker run --gpus all nvidia/cuda:11.0.3-base-ubuntu20.04 nvidia-smi
如果一切正常,在宿主机上运行nvidia-smi的输出,但是这一步我没有成功,但是不影响后续步骤也能正常使用宿主环境的GPU显卡
3. 然后尝试再次创建您的容器
docker run --gpus all -it --name zk_tvm ubuntu:22.04 /bin/bash
运行到这一步你就会进入到自己的容器里面,然后运行nvidia-smi就能显示在你在容器里面也能正常访问宿主环境的GPU显卡
docker容器环境配置问题
创建普通用户
useradd -m username
# 设置密码
passwd username
# 使用更友好的bash shell
chsh -s /bin/bash username
# 切换到该用户
su - username
安装sudo并授权
# 以root用户执行
apt update
apt install -y sudo
usermod -aG sudo zk
安装docker镜像并使用宿主机的GPU、网络 docker run –network=host –gpus all -it –name felix ubuntu:22.04 /bin/bash
创建普通用户
安装curl、wget、anconda、vim、cmake、g++、git sudo apt update sudo apt install curl -y sudo apt install wget -y sudo apt install vim -y sudo apt-get install cmake sudo apt-get install g++ sudo apt-get install git wget https://repo.anaconda.com/archive/Anaconda3-2024.10-1-Linux-x86_64.sh chmod +x Anaconda3-2024.10-1-Linux-x86_64.sh ./Anaconda3-2024.10-1-Linux-x86_64.sh
在~/.bashrc文件最后添加下面信息 export PATH=”/home/zk/anaconda3/bin:$PATH” source ~/.bashrc
在docker容器里面能够使用nvidia-smi但是不能使用nvcc –version用下面方法解决 sudo apt-get update && sudo apt-get install -y nvidia-cuda-toolkit
tvm-build-venv 镜像 宿主机运行 sudo socat TCP-LISTEN:7898,fork,bind=0.0.0.0 TCP:127.0.0.1:7897 docker容器 export http_proxy=”http://172.17.0.1:7898” export https_proxy=”http://172.0.0.1:7898”