OpenAI Triton 已开始合并 AMD ROCm 代码,9 月 20 日举行开发者大会
9 月 3 日消息,Triton 是一種類似于 Python 的開源編程語言,它可以使沒有 CUDA 經(jīng)驗(yàn)的研究人員順利編寫高效的 GPU 代碼(可以理解為簡化版 CUDA),而且號稱小白也可以寫出與專業(yè)人士相媲美的代碼,就是讓用戶用相對較少的努力實(shí)現(xiàn)最高的硬件性能,但 Triton 初期只支持英偉達(dá) GPU。
OpenAI 聲稱:Triton 只要 25 行代碼,就能在 FP16 矩陣乘法上達(dá)到與 cuBLAS 相當(dāng)?shù)男阅堋?/p>
從 Github 我們可以看到,OpenAI 已經(jīng)開始在最新的Triton 版本中合并 AMD ROCm 相關(guān)分支代碼,也正因此暴露了很多東西。也就是說,最新 Triton 后端已適配 AMD 平臺,可謂意義重大。
值得一提的是,Triton 是開源的,比起閉源的 CUDA,其他硬件加速器能直接集成到 Triton 中,大大減少了為新硬件建立 AI 編譯器棧的時間。
在此前發(fā)布的 PyTorch 2.0 版本中,TorchInductor 便引入了 OpenAI Triton 支持,可為多個加速器和后端自動生成快速代碼,同時實(shí)現(xiàn)用 Python 取代 CUDA 編程來寫底層硬件的代碼。也就是說,Triton 已經(jīng)是PyTorch2.0 后端編譯器關(guān)鍵構(gòu)成部分。
實(shí)際上,此前 AMD ROCm 則主要是采用 Hipify 工具實(shí)現(xiàn)CUDA 兼容,而隨著 AMD 開始為 RDNA 3 消費(fèi)級顯卡提供 ROCm 支持,預(yù)計后續(xù)將會有更多平臺選擇適配 AMD 硬件。
相關(guān)閱讀:
《AMD 將為 RDNA 3 消費(fèi)級顯卡提供 ROCm 支持,從 Radeon RX 7900 XTX 和 Pro W7900 開始》
《AMD 正式推出 HIP SDK:拓展 ROCm 生態(tài),支持運(yùn)行英偉達(dá) CUDA 應(yīng)用》
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,所有文章均包含本聲明。
總結(jié)
以上是生活随笔為你收集整理的OpenAI Triton 已开始合并 AMD ROCm 代码,9 月 20 日举行开发者大会的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 保证主题,JMS规范和ActiveMQ的
- 下一篇: ChatGPT 最常被用来干什么:调查显