日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > Ubuntu >内容正文

Ubuntu

ubuntu卸载旧的NVIDIA驱动,安装新驱动,并安装Nvidia-docker2

發布時間:2023/12/8 Ubuntu 47 豆豆
生活随笔 收集整理的這篇文章主要介紹了 ubuntu卸载旧的NVIDIA驱动,安装新驱动,并安装Nvidia-docker2 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文章目錄

  • 一、Linux卸載并更新顯卡驅動
    • 1. 下載對應版本的驅動
    • 2. 卸載已有驅動
    • 3. 重啟服務器
    • 4. 安裝新驅動
  • 二、安裝cuda
  • 三、安裝docker
  • 四、安裝nvidia-docker2
  • 五、出錯的解決辦法
  • 六、制作容器
    • 1. 下載鏡像
    • 2. 制作容器
    • 3. 啟動并進入容器
    • 4. 進入容器安裝其他工具
    • 5. 將安裝新工具后的容器保存
    • 6. 加載別人做好的鏡像
    • 7. 一些docker命令


一、Linux卸載并更新顯卡驅動


1. 下載對應版本的驅動

https://www.nvidia.com/Download/index.aspx?lang=en-us

2. 卸載已有驅動

sudo sh NVIDIA-Linux-x86_64-450.80.02.run --uninstall 或 sudo /usr/bin/nvidia-uninstall

3. 重啟服務器

sudo reboot

4. 安裝新驅動

sudo sh NVIDIA-Linux-x86_64-450.80.02.run注:安裝后提示 To uninstall the CUDA Toolkit, run cuda-uninstaller in /usr/local/cuda-11.1/bin To uninstall the NVIDIA Driver, run nvidia-uninstall

二、安裝cuda

提示安裝驅動時,選擇no,其他yes、默認即可。

三、安裝docker

# step 1: 安裝必要的一些系統工具 sudo apt-get update sudo apt-get -y install apt-transport-https ca-certificates curl software-properties-common # step 2: 安裝GPG證書 curl -fsSL http://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg | sudo apt-key add - # Step 3: 寫入軟件源信息 sudo add-apt-repository "deb [arch=amd64] http://mirrors.aliyun.com/docker-ce/linux/ubuntu $(lsb_release -cs) stable" # Step 4: 更新并安裝 Docker-CE sudo apt-get -y update sudo apt-get -y install docker-ce

四、安裝nvidia-docker2

# 清理以前的。If you have nvidia-docker 1.0 installed: we need to remove it and all existing GPU containers sudo docker volume ls -q -f driver=nvidia-docker | xargs -r -I{} -n1 docker ps -q -a -f volume={} | xargs -r docker rm -f sudo apt-get purge -y nvidia-docker sudo apt autoremove# 執行命令。Add the package repositories # command 1 curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \sudo apt-key add -# command 2 distribution=$(. /etc/os-release;echo $ID$VERSION_ID)# command 3 curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \sudo tee /etc/apt/sources.list.d/nvidia-docker.list sudo apt-get update# 正式安裝。Install nvidia-docker2 and reload the Docker daemon configuration sudo apt-get install -y nvidia-docker2 sudo pkill -SIGHUP dockerd# 測試一下。 Test nvidia-smi with the latest official CUDA image sudo docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi#如果已經安裝過,并且知道版本,例如服務器上已經安裝了cuda10.0,則如下進行測試是否可用。 sudo docker run --runtime=nvidia --rm nvidia/cuda:10.0-base nvidia-smi 此處cuda:10.0-base 可以根據自己實際換成cuda:10.0-runtime、cuda:10.0-devel,分別代表基本版,運行時、開發

五、出錯的解決辦法

一般出錯是由于驅動版本與docker版本不一致導致,按照提示修改即可。

六、制作容器

1. 下載鏡像

從網站下載已有鏡像:hub.docker.com例如:在linux中輸入: docker pull pytorch/pytorch 則會下載名字為pytorch/pytorch的鏡像。注意: 1、鏡像cuda版本需要和宿主機上cuda一致。 下載鏡像時要根據cuda驅動與cuda工具包的版本選擇相應的pytorch版本。例如你通過nvidia-smi獲得的信息如下: NVIDIA-SMI 410.93 Driver Version: 410.93 CUDA Version: 10.0 那么你需要選擇: docker pull pytorch/pytorch:1.2-cuda10.0-cudnn7-devel 或者 docker pull pytorch/pytorch:1.2-cuda10.0-cudnn7-runtime 2、runtime與devel版本選擇 如果你需要編譯cuda源代碼,那么最好選擇devel版本,這樣cuda對應的工具、頭文件、庫等會在鏡像中安裝好了。如果選擇了runtime版本,但你需要編譯自己寫的cuda源碼,那么需要將宿主機上cuda目錄映射到容器中,否則會提示找不到cuda頭文件等。

2. 制作容器

例如:利用名字為pytorch/pytorch:latest的鏡像創建名字為dv的容器 nvidia-docker run -itd --name dv pytorch/pytorch:latest /bin/bash 如果創建容器時要將docker的宿主機上目錄映射到docker中,則: //將目錄 /home/test映射到docker中/home/test nvidia-docker run -itd -v /home/test:/home/test --ipc=host --name dv pytorch/pytorch:latest /bin/bash如果創建容器時要將docker的宿主機上的多個目錄映射到docker中,則: //將目錄 /home/test映射到docker中/home/test,將/usr/local/cuda映射到docker中的/usr/local/cuda nvidia-docker run -itd -v /home/test:/home/test -v /usr/local/cuda:/usr/local/cuda --ipc=host --name dv pytorch/pytorch:latest /bin/bash注:有時當用命令:nvidia-docker run -itd --name dv pytorch/pytorch:latest /bin/bash 制作容器時,會出現如下錯誤: /bin/bash: /bin/bash: cannot execute binary file 此時將命令中/bin/bash去除即可。

3. 啟動并進入容器

例如:nvidia-docker start dv && nvidia-docker exec -it dv /bin/bash

4. 進入容器安裝其他工具

自行安裝即可。

5. 將安裝新工具后的容器保存

5.1 將容器dv存為名字為pytorch/pytorch:v2的鏡像 docker commit dv pytorch/pytorch:v2 5.2 將名字為pytorch/pytorch:v2的鏡像存為名字為ver2.tar的文件,以備其他人復制使用 docker save -o ver2.tar pytorch/pytorch:v2

6. 加載別人做好的鏡像

docker load -i ver2.tar #加載已存在的鏡像文件ver2.tar

7. 一些docker命令

gpasswd -a xx docker #將賬戶xx加入docker組 newgrp docker #將賬戶xx加入docker組后更新組docker ps -a #查看容器 docker images #查看鏡像 docker rmi pytorch/pytorch:v2 #刪除名字為pytorch/pytorch:v2的鏡像 docker stop 9103045e5074 #停止id為9103045e5074的容器 docker rm 9103045e5074 #刪除id為9103045e5074的容器

總結

以上是生活随笔為你收集整理的ubuntu卸载旧的NVIDIA驱动,安装新驱动,并安装Nvidia-docker2的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。