NVIDIA GPU的快速傅立叶变换
NVIDIA GPU的快速傅立葉變換
cuFFT庫提供GPU加速的FFT實(shí)現(xiàn),其執(zhí)行速度比僅CPU的替代方案快10倍。cuFFT用于構(gòu)建跨學(xué)科的商業(yè)和研究應(yīng)用程序,例如深度學(xué)習(xí),計(jì)算機(jī)視覺,計(jì)算物理,分子動(dòng)力學(xué),量子化學(xué)以及地震和醫(yī)學(xué)成像。使用cuFFT,應(yīng)用程序會(huì)自動(dòng)受益于常規(guī)性能的改進(jìn)和新的GPU架構(gòu)。cuFFT庫包含在NVIDIA HPC SDK和CUDA Toolkit中。
cuFFT設(shè)備擴(kuò)展
cuFFT設(shè)備擴(kuò)展(cuFFTDx)允許應(yīng)用程序?qū)FT內(nèi)聯(lián)到用戶內(nèi)核中。與cuFFT主機(jī)API相比,這極大地提高了性能,并允許與應(yīng)用程序操作融合。cuFFTDx當(dāng)前是CUDA數(shù)學(xué)庫早期訪問計(jì)劃的一部分。
cuFFT性能
cuFFT庫針對(duì)NVIDIA GPU的性能進(jìn)行了高度優(yōu)化。請(qǐng)注意,第二張圖表將16個(gè)Volta GV100 GPU的性能與8個(gè)新的GA100 Ampere Architecture GPU的性能進(jìn)行了比較。
cuFFT的主要功能
? 復(fù)雜和真實(shí)數(shù)據(jù)類型的1D,2D,3D轉(zhuǎn)換
? 支持多達(dá)16個(gè)GPU系統(tǒng)
? 多GPU C2C,R2C和C2R支持
? 類似于FFTW高級(jí)接口的熟悉的API
? 靈活的數(shù)據(jù)布局允許在單個(gè)元素和數(shù)組維度之間任意跨越
? 流式異步執(zhí)行
? 半精度,單精度和雙精度轉(zhuǎn)換
? 批量執(zhí)行
? In-place and out-of-place transforms轉(zhuǎn)換
? 線程安全且可從多個(gè)主機(jī)線程調(diào)用
總結(jié)
以上是生活随笔為你收集整理的NVIDIA GPU的快速傅立叶变换的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: nvJPEG库
- 下一篇: deeplearning模型分析