日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

AMD 显卡/GPU 深度学习折腾指南

發布時間:2023/12/4 综合教程 54 生活家
生活随笔 收集整理的這篇文章主要介紹了 AMD 显卡/GPU 深度学习折腾指南 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文章首發于 個人博客

文章目錄

    • Introduction
    • ZheTeng Conditions
      • GPU 列表
      • CPU 列表
      • 關于 ROCm
    • Install on Ubuntu
      • 系統準備
      • 安裝 ROCm
    • Deep Learning on ROCm
      • Tensorflow
      • PyTorch
    • Conclusion

Introduction

鑒于 NVIDIA 的價格和自己的預算, 因此上了 AMD 的船,自此主機組裝完成。

AMD 的 CPU 加 AMD 的 GPU, AMD, YES !

裝機完成之后,首要問題就是如何在 AMD 的顯卡上進行深度學習煉丹?

經過一番配置(折騰),順利實現上一目標,以下為個人在 Ubuntu 上的折騰指南。

ZheTeng Conditions

由于要使用AMD 的 ROCm 平臺, 其對硬件有一定的要求,請確定是否如何下面的條件,如果符合,則可以參考以下的步驟進行配置。

GPU 列表

以下的型號的 GPU 符合條件:

更詳細的支持的 GPU 列表。

CPU 列表

以下型號的 CPU 在支持之列:

更詳細的說明鏈接。

關于 ROCm

ROCm的英文全稱Radeon Open Compute platform, 目標是建立可替代 CUDA 的生態。ROCm 和CUDA 最大的區別在于其開放性,ROCm希望能在各種不同的硬件上運行,同時 ROCm 完全開源。

更多關于 ROCm 介紹可以參考這篇文章,這里不是重點,不再細說。

Install on Ubuntu

了解了以上內容,下面開始安裝 ROCm。

系統準備

推薦Ubuntu 16.04 或 18.04, 筆者是 18.04

確保系統在最新狀態,安裝libnuma,再重啟:

sudo apt update
sudo apt dist-upgrade
sudo apt install libnuma-dev
sudo reboot

安裝 ROCm

  1. 如果你的系統已經安裝了官方驅動,那么需要運行以下命令刪除系統中已有的的AMD GPU 驅動,并重新啟動。
sudo amdgpu-pro-uninstall
sudo apt autoremove -y
sudo reboot
  1. 添加 APT源 Add the ROCm apt repository
    使用如下命令:
wget -qO - http://repo.radeon.com/rocm/apt/debian/rocm.gpg.key | sudo apt-key add -echo 'deb [arch=amd64] http://repo.radeon.com/rocm/apt/debian/ xenial main' | sudo tee /etc/apt/sources.list.d/rocm.list
  1. Install ROCm by apt
    使用 apt 安裝 rocm 包
sudo apt update
sudo apt install rocm-dkms

以上過程會非常慢,如果你有科學上網的方法,推薦使用之。我在路由端配置了相關加速,正常情況下大概十分鐘完成。

  1. Set user permissions
    設置用戶 GPU 使用權限,將當前用戶加入到權限組:
sudo usermod -a -G video $LOGNAME

為系統以后的用戶都添加權限:

echo 'ADD_EXTRA_GROUPS=1' | sudo tee -a /etc/adduser.conf
echo 'EXTRA_GROUPS=video' | sudo tee -a /etc/adduser.conf
  1. 測試
    重啟系統之后,運行以下命令驗證 ROCm 安裝是否成功,如果看到你的 GPU 在下面的命令中都有顯示,則表示已經安裝成功。
/opt/rocm/bin/rocminfo 
/opt/rocm/opencl/bin/x86_64/clinfo 

結果如下:
rocminfo 命令:

clinfo 命令:

  1. 環境變量
    將 ROCm 添加到環境變量:
echo 'export PATH=$PATH:/opt/rocm/bin:/opt/rocm/profiler/bin:/opt/rocm/opencl/bin/x86_64' | sudo tee -a /etc/profile.d/rocm.sh
  1. 監控(optional)
    AMD 沒有 NVIDIA 類似 nvidia-smi 的命令,只能使用第三方,這里推薦 radeontop,可以直接使用 apt 安裝。
sudo apt-get install radeontop
sudo radeontop

如果你的結果全是0, 那么你最好自己編譯安裝,這里或許比較折騰,因為需要的環境較多。
顯示示例:

Deep Learning on ROCm

當前支持的框架如下:

TensorFlow: TensorFlow for ROCm – latest supported version 1.13

MIOpen: Open-source deep learning library for AMD GPUs – latest supported version 1.7.1

PyTorch: PyTorch for ROCm – latest supported version 1.0

Python 環境管理推薦使用 Anaconda

Tensorflow

Tensorflow 支持較為完善,直接使用 apt 安裝即可。具體方法如下:

  1. 安裝相關包
sudo apt update
sudo apt install rocm-libs miopen-hip cxlactivitylogger
  1. apt 安裝
sudo apt install wget python3-pip
# Pip3 install the whl package from PyPI
pip3 install --user tensorflow-rocm

PyTorch

  1. 安裝依賴包
  • rocrand, hiprand, rocblas, miopen, miopengemm, rocfft, rocsparse, rocm-cmake, rocm-dev, rocm-device-libs,rocm-libs, hcc, hip_base,hip_hcc, hip-thrust
  1. Clone PyTorch repository
git clone https://github.com/ROCmSoftwarePlatform/pytorch.git
cd pytorch
git submodule update --init --recursive
  1. 指定 GPU 型號
    如下:
    .

通過設置環境變量,指明編譯針對的GPU類型,設置為:export PYTORCH_ROCM_ARCH=gfx×××

  1. ‘Hipify’ PyTorch source. 將PyTorch中的CUDA函數 build 為ROCm中的hip函數
python tools/amd_build/build_amd.py
  1. 編譯安裝
export USE_NINJA=1 # 可選
USE_ROCM=1 USE_LMDB=1 BUILD_CAFFE2_OPS=0 BUILD_TEST=0 USE_OPENCV=1 MAX_JOBS=N python setup.py install

MAX_JOBS=N 中的 N 小于你的內存除以4.

  1. torchvision
git clone https://github.com/pytorch/vision
cd vision
python setup.py install
cd ..
  1. 測試
PYTORCH_TEST_WITH_ROCM=1 python test/run_test.py --verbose

我的測試有一定的問題:

Conclusion

AMD, YES!

總結

以上是生活随笔為你收集整理的AMD 显卡/GPU 深度学习折腾指南的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。