ubuntu卸载旧的NVIDIA驱动,安装新驱动,并安装Nvidia-docker2
生活随笔
收集整理的這篇文章主要介紹了
ubuntu卸载旧的NVIDIA驱动,安装新驱动,并安装Nvidia-docker2
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
文章目錄
- 一、Linux卸載并更新顯卡驅動
- 1. 下載對應版本的驅動
- 2. 卸載已有驅動
- 3. 重啟服務器
- 4. 安裝新驅動
- 二、安裝cuda
- 三、安裝docker
- 四、安裝nvidia-docker2
- 五、出錯的解決辦法
- 六、制作容器
- 1. 下載鏡像
- 2. 制作容器
- 3. 啟動并進入容器
- 4. 進入容器安裝其他工具
- 5. 將安裝新工具后的容器保存
- 6. 加載別人做好的鏡像
- 7. 一些docker命令
一、Linux卸載并更新顯卡驅動
1. 下載對應版本的驅動
https://www.nvidia.com/Download/index.aspx?lang=en-us2. 卸載已有驅動
sudo sh NVIDIA-Linux-x86_64-450.80.02.run --uninstall 或 sudo /usr/bin/nvidia-uninstall3. 重啟服務器
sudo reboot4. 安裝新驅動
sudo sh NVIDIA-Linux-x86_64-450.80.02.run注:安裝后提示 To uninstall the CUDA Toolkit, run cuda-uninstaller in /usr/local/cuda-11.1/bin To uninstall the NVIDIA Driver, run nvidia-uninstall二、安裝cuda
提示安裝驅動時,選擇no,其他yes、默認即可。三、安裝docker
# step 1: 安裝必要的一些系統工具 sudo apt-get update sudo apt-get -y install apt-transport-https ca-certificates curl software-properties-common # step 2: 安裝GPG證書 curl -fsSL http://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg | sudo apt-key add - # Step 3: 寫入軟件源信息 sudo add-apt-repository "deb [arch=amd64] http://mirrors.aliyun.com/docker-ce/linux/ubuntu $(lsb_release -cs) stable" # Step 4: 更新并安裝 Docker-CE sudo apt-get -y update sudo apt-get -y install docker-ce四、安裝nvidia-docker2
# 清理以前的。If you have nvidia-docker 1.0 installed: we need to remove it and all existing GPU containers sudo docker volume ls -q -f driver=nvidia-docker | xargs -r -I{} -n1 docker ps -q -a -f volume={} | xargs -r docker rm -f sudo apt-get purge -y nvidia-docker sudo apt autoremove# 執行命令。Add the package repositories # command 1 curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \sudo apt-key add -# command 2 distribution=$(. /etc/os-release;echo $ID$VERSION_ID)# command 3 curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \sudo tee /etc/apt/sources.list.d/nvidia-docker.list sudo apt-get update# 正式安裝。Install nvidia-docker2 and reload the Docker daemon configuration sudo apt-get install -y nvidia-docker2 sudo pkill -SIGHUP dockerd# 測試一下。 Test nvidia-smi with the latest official CUDA image sudo docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi#如果已經安裝過,并且知道版本,例如服務器上已經安裝了cuda10.0,則如下進行測試是否可用。 sudo docker run --runtime=nvidia --rm nvidia/cuda:10.0-base nvidia-smi 此處cuda:10.0-base 可以根據自己實際換成cuda:10.0-runtime、cuda:10.0-devel,分別代表基本版,運行時、開發五、出錯的解決辦法
一般出錯是由于驅動版本與docker版本不一致導致,按照提示修改即可。六、制作容器
1. 下載鏡像
從網站下載已有鏡像:hub.docker.com例如:在linux中輸入: docker pull pytorch/pytorch 則會下載名字為pytorch/pytorch的鏡像。注意: 1、鏡像cuda版本需要和宿主機上cuda一致。 下載鏡像時要根據cuda驅動與cuda工具包的版本選擇相應的pytorch版本。例如你通過nvidia-smi獲得的信息如下: NVIDIA-SMI 410.93 Driver Version: 410.93 CUDA Version: 10.0 那么你需要選擇: docker pull pytorch/pytorch:1.2-cuda10.0-cudnn7-devel 或者 docker pull pytorch/pytorch:1.2-cuda10.0-cudnn7-runtime 2、runtime與devel版本選擇 如果你需要編譯cuda源代碼,那么最好選擇devel版本,這樣cuda對應的工具、頭文件、庫等會在鏡像中安裝好了。如果選擇了runtime版本,但你需要編譯自己寫的cuda源碼,那么需要將宿主機上cuda目錄映射到容器中,否則會提示找不到cuda頭文件等。2. 制作容器
例如:利用名字為pytorch/pytorch:latest的鏡像創建名字為dv的容器 nvidia-docker run -itd --name dv pytorch/pytorch:latest /bin/bash 如果創建容器時要將docker的宿主機上目錄映射到docker中,則: //將目錄 /home/test映射到docker中/home/test nvidia-docker run -itd -v /home/test:/home/test --ipc=host --name dv pytorch/pytorch:latest /bin/bash如果創建容器時要將docker的宿主機上的多個目錄映射到docker中,則: //將目錄 /home/test映射到docker中/home/test,將/usr/local/cuda映射到docker中的/usr/local/cuda nvidia-docker run -itd -v /home/test:/home/test -v /usr/local/cuda:/usr/local/cuda --ipc=host --name dv pytorch/pytorch:latest /bin/bash注:有時當用命令:nvidia-docker run -itd --name dv pytorch/pytorch:latest /bin/bash 制作容器時,會出現如下錯誤: /bin/bash: /bin/bash: cannot execute binary file 此時將命令中/bin/bash去除即可。3. 啟動并進入容器
例如:nvidia-docker start dv && nvidia-docker exec -it dv /bin/bash4. 進入容器安裝其他工具
自行安裝即可。5. 將安裝新工具后的容器保存
5.1 將容器dv存為名字為pytorch/pytorch:v2的鏡像 docker commit dv pytorch/pytorch:v2 5.2 將名字為pytorch/pytorch:v2的鏡像存為名字為ver2.tar的文件,以備其他人復制使用 docker save -o ver2.tar pytorch/pytorch:v26. 加載別人做好的鏡像
docker load -i ver2.tar #加載已存在的鏡像文件ver2.tar7. 一些docker命令
gpasswd -a xx docker #將賬戶xx加入docker組 newgrp docker #將賬戶xx加入docker組后更新組docker ps -a #查看容器 docker images #查看鏡像 docker rmi pytorch/pytorch:v2 #刪除名字為pytorch/pytorch:v2的鏡像 docker stop 9103045e5074 #停止id為9103045e5074的容器 docker rm 9103045e5074 #刪除id為9103045e5074的容器總結
以上是生活随笔為你收集整理的ubuntu卸载旧的NVIDIA驱动,安装新驱动,并安装Nvidia-docker2的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 常用车载总线CAN、CAN FD、LIN
- 下一篇: 拯救者Y7000安装ubuntu时出现的