當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

从CUDA开始读OpenCL

發(fā)布時間：2025/3/17 编程问答 44 豆豆

生活随笔收集整理的這篇文章主要介紹了从CUDA开始读OpenCL 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

就像大一學(xué)C++，大二學(xué)匯編一樣，我也寫弄了些個月的CUDA，然后，想想，應(yīng)該開始刨根問底地，去學(xué)點在CUDA之下層的東西，可能會對異構(gòu)這個編程了解的多。

1 簡介
OpenCL全稱：開發(fā)計算語言，是并行程序的開發(fā)標(biāo)準(zhǔn)，使用與任何異構(gòu)平臺——包括多CPU、GPU、CPU與GPU結(jié)合等。OpenCL由Khronos Group維護(hù)。
OpenCL是一個用于異構(gòu)平臺上編程的開放性行業(yè)標(biāo)準(zhǔn)。這個平臺可以包括 CPU GPU和其他各類計算設(shè)備，例如 DSP和Cell/B.E.等等。
OpenCL和CUDA的關(guān)系很和諧，前者是異構(gòu)編程規(guī)范標(biāo)準(zhǔn)，后者是英偉達(dá)基于OpenCL之上開發(fā)的一個更面向程序員的GPUAPI。所以，OpenCL適合于包括英偉達(dá)和AMD等的顯卡
程序開發(fā)。

2 認(rèn)識OpenCL的框架

2.1 平臺模型

[1個host]-[1..N個device] (主機(jī)：host；設(shè)備：device)
[1個device]-[1..N個CU] (計算單元：CU)
[1個CU]-[1..N個PE] (處理單元：PU)

host端管理者整個平臺的所有計算資源，應(yīng)用程序會從host端向各個 OpenCL設(shè)備的處理單元發(fā)送計算命令。在一個計算單元內(nèi)的所有處理單元會執(zhí)行完全相同的一套指令
流程。指令流可以是 SIMD模式或者SPMD模式。所有由OpenCL編寫的應(yīng)用程序都是從Host啟動并結(jié)束，最終的計算都發(fā)生在PE中。

2.2 內(nèi)存模型

內(nèi)存介紹：
全局內(nèi)存 (global memory):工作空間內(nèi)所有的工作節(jié)點都可以讀寫此類內(nèi)存中的任意元素。OpenCL C提供了緩存global buer的內(nèi)建函數(shù)。
常量內(nèi)存 (constant memory):工作空間內(nèi)所有的工作節(jié)點可以只讀此類內(nèi)存中的任意元素。 host負(fù)責(zé)分配和初始化 constant buer，在內(nèi)核執(zhí)行過程中保持不變。
局部內(nèi)存 (local memory):從屬于一個工作組的內(nèi)存，同一個工作組中所有的工作節(jié)點都可以共享使用該類內(nèi)存。其實現(xiàn)既可以為 OpenCL執(zhí)行為其分配一塊專有內(nèi)存空間，
也有可能直接將其映射到一塊global buer上。
私有內(nèi)存 (private memory):只從屬于當(dāng)前的工作節(jié)點。一個工作節(jié)點內(nèi)部的private buer其他節(jié)點是完全不可見的。
在這點上，基本上和CUDA介紹的內(nèi)存是一樣的。這里的局部內(nèi)存和CUDA的私有變量差不多一個概念。

內(nèi)存使用：
在內(nèi)存的使用上，有兩種方式：內(nèi)存拷貝和內(nèi)存映射。
拷貝數(shù)據(jù)是指host通過相應(yīng)的OpenCL API將數(shù)據(jù)從host寫入到OpenCL設(shè)備的內(nèi)存中或者從 OpenCL設(shè)備內(nèi)存讀出數(shù)據(jù)到 host內(nèi)存中。
內(nèi)存映射方法允許用戶通過相應(yīng) OpenCLAPI將OpenCL的內(nèi)存對象映射到 host端可見的內(nèi)存地址空間中。映射之后用戶就可以在 host端的映
射地址讀寫該內(nèi)存了，在讀寫完成之后用戶必須使用對應(yīng) API解除這種映射關(guān)系。同拷貝內(nèi)存方式一樣，映射內(nèi)存也分block和non-block模式。

2.3 執(zhí)行模型

OpenCL的執(zhí)行模型可以分為兩部分，一部分是在 host上執(zhí)行的主程序（host program），另一部分是在 OpenCL設(shè)備上執(zhí)行的內(nèi)核程序（kernels），OpenCL通過主程序來
定義上下文并管理內(nèi)核程序在OpenCL設(shè)備的執(zhí)行。
執(zhí)行模式最重要的是分配線程網(wǎng)絡(luò)，這點和CUDA是一回事，可以引用。

2.4 編程模型

OpenCL支持按數(shù)據(jù)并行的編程模型和按任務(wù)并行的編程模型。
數(shù)據(jù)并行模型是指同一系的列指令會作用在內(nèi)存對象的不同元素上，即在不同內(nèi)存元素上按這個指令序列定義了統(tǒng)一的運算。
在任務(wù)并行編程模型是指工作空間內(nèi)的每個工作節(jié)點在執(zhí)行 kernel程序時相對于其他節(jié)點是絕對獨立的。在這種模式下對每個工作節(jié)點都相當(dāng)于工作在一個單一的計算單
元內(nèi)，該單元內(nèi)只有單一工作組，該工作組中只有該節(jié)點本身在執(zhí)行。用戶可以通過如下方法實現(xiàn)按任務(wù)并行:
-使用OpenCL設(shè)備支持的向量類型數(shù)據(jù)結(jié)構(gòu)
-同時執(zhí)行或選擇性執(zhí)行多個kernels
-在執(zhí)行kernels同時交叉性執(zhí)行一些native kernels程序

OpenCL提供了兩個領(lǐng)域的同步：
-在同一個工作組中所有的工作節(jié)點之間的同步
-同一個上下文中不同的 command queues之間和同一個 command queue的不同commands之間的同步

從CUDA了解openCL是在閱讀和理解相關(guān)CUDA編程知識后，在讀《OpenCL中文教程》的一個第一章和第二章的知識匯總，去掉了CUDA編程指南中講解的雷同知識。在了解和
明白OpenCL是怎么一回事兒后，我將開始o(jì)penCL的Hello world了，雖然，僅僅一個helloword可能沒什么意義，但是，象征性的程序必須寫起來。

轉(zhuǎn)載于:https://www.cnblogs.com/viviman/archive/2012/12/24/2830610.html

總結(jié)

以上是生活随笔為你收集整理的从CUDA开始读OpenCL的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

CUDA
OpenCL

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

从CUDA开始读OpenCL

總結(jié)