适用于AMD ROC GPU的Numba概述
適用于AMD ROC GPU的Numba概述
Numba通過按照HSA執(zhí)行模型將Python代碼的受限子集直接編譯到HSA內(nèi)核和設(shè)備功能中,從而支持AMD ROC GPU編程。用Numba編寫的內(nèi)核似乎可以直接訪問NumPy數(shù)組。
術(shù)語(yǔ)
以下列出了HSA編程主題中的幾個(gè)重要術(shù)語(yǔ):
內(nèi)核:由主機(jī)啟動(dòng)并在設(shè)備上執(zhí)行的GPU功能
設(shè)備功能:在設(shè)備上執(zhí)行的GPU功能,只能從設(shè)備(即從內(nèi)核或其他設(shè)備功能)調(diào)用
需求
本文檔 介紹了使用ROC的要求。從本質(zhì)上講,需要AMD dGPU(iji, Polaris and Vega families,Polaris和Vega系列)和支持PCIe Gen3和PCIe Atomics的CPU(AMD Ryzen和EPYC,以及Intel CPU> = Haswell),鏈接的文檔中有完整的詳細(xì)信息。此外,還需要Linux操作系統(tǒng),鏈接的文檔中也列出了受支持和測(cè)試的Linux操作系統(tǒng)。
安裝
請(qǐng)按照本文檔 中的安裝說明為系統(tǒng)啟用ROC支持。確保將二進(jìn)制軟件包用于系統(tǒng)的linux發(fā)行版,以簡(jiǎn)化該過程。此時(shí),應(yīng)通過運(yùn)行以下命令測(cè)試安裝:
$ /opt/rocm/bin/rocminfo
其輸出應(yīng)列出至少兩個(gè)HAS設(shè)備,其中至少一個(gè)應(yīng)為CPU,至少一個(gè)應(yīng)為dGPU。
假設(shè)安裝工作正常,roctools則可通過condaNumba渠道與Numba一起通過軟件包安裝Numba的ROC支持,如下所示(創(chuàng)建名為的環(huán)境 numba_roc):
$ conda create -n numba_roc -c numba numba roctools
激活環(huán)境,然后運(yùn)行Numba診斷工具,應(yīng)確認(rèn)Numba在啟用ROC支持的情況下運(yùn)行,例如:
$ source activate numba_roc
$ numba -s
輸出應(yīng)包含類似于以下內(nèi)容的部分:numba -s
ROC Information
ROC available : True
Available Toolchains : librocmlite library, ROC command line tools
Found 2 HSA Agents:
Agent id : 0
vendor: CPUname: Intel(R) Core(TM) i7-4790 CPU @ 3.60GHztype: CPU
Agent id : 1
vendor: AMDname: gfx803type: GPU
Found 1 discrete GPU(s) : gfx803
確認(rèn)ROC可用,列出可用的工具鏈并顯示HAS設(shè)備和dGPU計(jì)數(shù)
總結(jié)
以上是生活随笔為你收集整理的适用于AMD ROC GPU的Numba概述的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: nvGraph-NVIDIA图形库
- 下一篇: 知识图:从图和数据库中获取知识