當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

IMX8基于FFT的GPU和CPU的性能测试

發布時間：2023/12/10 编程问答 33 豆豆

生活随笔收集整理的這篇文章主要介紹了 IMX8基于FFT的GPU和CPU的性能测试小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

IMX8基于FFT的GPU和CPU的性能測試對比

i.MX 8系列應用處理器是一種功能和性能可擴展的多核平臺，包括基于 Arm Cortex架構的單核、雙核和四核系列產品，提供基于Cortex-A72 + Cortex-A53、Cortex-A35、Cortex-M4和Cortex M7組合的解決方案，適用于高級圖形、成像、機器視覺、音頻、語音、視頻和安全關鍵應用。集成高性能的雙核 GC7000 3D GPU，支持 Open GL ES 3.0 和Vulkan，最高支持4路 1080p或者1路 4K 顯示。
由于免去了數據的遠程傳輸，邊緣計算能夠帶來更低的延時、更可靠的數據安全。但這也對邊緣計算設備帶來更大的挑戰，特別是計算性能。下面我們將介紹如何在NXP 最新的 iMX8X ARM處理器上面利用 GPU 加速運算快速傅里葉變換 FFT
FFT 運行在GPU上（具體的運行方法可參考https://blog.csdn.net/qq_38505858/article/details/119642596）我之前寫的一篇文章。

FFT 級數GPU TIME/s

16	0.002253
32	0.003386
64	0.002212
128	0.003437
256	0.003520
512	0.004341
1024	0.002770
2048	0.006684
4096	0.007329
8192	0.005271
16384	0.003939
32768	0.007297
65536	0.007875

GPU 會根據采樣點數，分解成多個蝶型運算模型，并將每個模型并行在 GPU 上執行，從而有效降低運算時間。從日志看到每個模型耗時都在1ms以內，GPU 累計耗時為0.004604 秒。但由于是并行計算，最終的時間則是小于該值。

FFT 運行在CPU上（FFTW庫http://fftw.org/）

FFT 級數GPU TIME/s

16	0.000576
32	0.000821
64	0.000986
128	0.001110
256	0.001854
512	0.002455
1024	0.003548
2048	0.004353
4096	0.005370
8192	0.006686
16384	0.008905
32768	0.013279
65536	0.021859

相比較而言，在FFT的點數低的情況下，GPU沒什么優勢，但是隨著FFT的點數增多，GPU的優勢就會慢慢凸顯出來。之后我會將FFT在CPU 上測試的源碼和所需要的頭文件庫文件上傳至我的資源，大家有需要的可以下載。

總結

以上是生活随笔為你收集整理的IMX8基于FFT的GPU和CPU的性能测试的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： LOJ10121 与众不同
下一篇：集腋成裘-10-ECharts -未知-