當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

pytorch 指定卡1_在pytorch中指定显卡

發布時間：2024/7/23 编程问答 50 豆豆

生活随笔收集整理的這篇文章主要介紹了 pytorch 指定卡1_在pytorch中指定显卡小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1. 利用CUDA_VISIBLE_DEVICES設置可用顯卡

在CUDA中設定可用顯卡，一般有2種方式：

(1) 在代碼中直接指定

import os

os.environ['CUDA_VISIBLE_DEVICES'] = gpu_ids

(2) 在命令行中執行代碼時指定

CUDA_VISIBLE_DEVICES=gpu_ids python3 train.py

如果使用sh腳本文件運行代碼，則有3種方式可以設置

(3) 在命令行中執行腳本文件時指定：

CUDA_VISIBLE_DEVICES=gpu_ids sh run.sh

(4) 在sh腳本中指定：

source bashrc

export CUDA_VISIBLE_DEVICES=gpu_ids && python3 train.py

(5) 在sh腳本中指定

source bashrc

CUDA_VISIBLE_DEVICES=gpu_ids python3 train.py

如果同時使用多個設定可用顯卡的指令，比如

source bashrc

export CUDA_VISIBLE_DEVICES=gpu_id1 && CUDA_VISIBLE_DEVICES=gpu_id2 python3 train.py

那么高優先級的指令會覆蓋第優先級的指令使其失效。優先級順序為：不使用sh腳本 (1)>(2)；使用sh腳本(1)>(5)>(4)>(3)

個人感覺在煉丹時建議大家從(2)(3)(4)(5)中選擇一個指定可用顯卡，不要重復指定以防造成代碼的混亂。方法(1)雖然優先級最高，但是需要修改源代碼，所以不建議使用。

2 .cuda()方法和torch.cuda.set_device()

我們還可以使用.cuda()[包括model.cuda()/loss.cuda()/tensor.cuda()]方法和torch.cuda.set_device()來把模型和數據加載到對應的gpu上。

(1) .cuda()

以model.cuda()為例，加載方法為：

model.cuda(gpu_id) # gpu_id為int類型變量，只能指定一張顯卡

model.cuda('cuda:'+str(gpu_ids)) #輸入參數為str類型，可指定多張顯卡

model.cuda('cuda:1,2') #指定多張顯卡的一個示例

(2) torch.cuda.set_device()

使用torch.cuda.set_device()可以更方便地將模型和數據加載到對應GPU上, 直接定義模型之前加入一行代碼即可

torch.cuda.set_device(gpu_id) #單卡

torch.cuda.set_device('cuda:'+str(gpu_ids)) #可指定多卡

但是這種寫法的優先級低，如果model.cuda()中指定了參數，那么torch.cuda.set_device()會失效，而且pytorch的官方文檔中明確說明，不建議用戶使用該方法。

第1節和第2節所說的方法同時使用是并不會沖突，而是會疊加。比如在運行代碼時使用

CUDA_VISIBLE_DEVICES=2,3,4,5 python3 train.py

而在代碼內部又指定

model.cuda(1)

loss.cuda(1)

tensor.cuda(1)

那么代碼會在GPU3上運行。原理是CUDA_VISIBLE_DEVICES使得只有GPU2,3,4,5可見，那么這4張顯卡，程序就會把它們看成GPU0,1,2,3，.cuda(1)把模型/loss/數據都加載到了程序所以為的GPU1上，則實際使用的顯卡是GPU3。

如果利用.cuda()或torch.cuda.set_device()把模型加載到多個顯卡上，而實際上只使用一張顯卡運行程序的話，那么程序會把模型加載到第一個顯卡上，比如如果在代碼中指定了

model.cuda('cuda:2,1')

在運行代碼時使用

CUDA_VISIBLE_DEVICES=2,3,4,5 python3 train.py

這一指令，那么程序最終會在GPU4上運行。

3.多卡數據并行torch.nn.DataParallel

多卡數據并行一般使用

torch.nn.DataParallel(model,device_ids)

其中model是需要運行的模型，device_ids指定部署模型的顯卡，數據類型是list

device_ids中的第一個GPU(即device_ids[0])和model.cuda()或torch.cuda.set_device()中的第一個GPU序號應保持一致，否則會報錯。此外如果兩者的第一個GPU序號都不是0,比如設置為：

model=torch.nn.DataParallel(model,device_ids=[2,3])

model.cuda(2)

那么程序可以在GPU2和GPU3上正常運行，但是還會占用GPU0的一部分顯存(大約500M左右)，這是由于pytorch本身的bug導致的(截止1.4.0，沒有修復這個bug)。

device_ids的默認值是使用可見的GPU，不設置model.cuda()或torch.cuda.set_device()等效于設置了model.cuda(0)

4. 多卡多線程并行torch.nn.parallel.DistributedDataParallel

(這個我是真的沒有搞懂,,,,)

參考了這篇文章和這個代碼，關于GPU的指定，多卡多線程中有2個地方需要設置

torch.cuda.set_device(args.local_rank)

torch.nn.parallel.DistributedDataParallel(model, device_ids=[args.local_rank])

模型/loss/tensor設置為.cuda()或.cuda(args.local_rank)均可，不影響正常運行。

5. 推薦設置方式：

(1) 單卡

使用CUDA_VISIBLE_DEVICES指定GPU，不要使用torch.cuda.set_device()，不要給.cuda()賦值。

(2) 多卡數據并行

直接指定CUDA_VISIBLE_DEVICES，通過調整可見顯卡的順序指定加載模型對應的GPU,不要使用torch.cuda.set_device()，不要給.cuda()賦值，不要給torch.nn.DataParallel中的device_ids賦值。比如想在GPU1,2,3中運行，其中GPU2是存放模型的顯卡，那么直接設置

CUDA_VISIBLE_DEVICES=2,1,3

(3) 多卡多線程

由于這塊還有好多地方沒有搞懂(尤其是torch.nn.parallel.DistributedDataParallel)，所以文章中難免會有很多錯誤和疏漏，歡迎各位大佬指正。

總結

以上是生活随笔為你收集整理的pytorch 指定卡1_在pytorch中指定显卡的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Java程序员该如何学习才能成长为一名优
下一篇： oracle 布尔盲注,Oracle基于

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

pytorch 指定卡1_在pytorch中指定显卡

總結