第七篇:使用 CUDA 进行计算优化的两种思路
前言
?????? 本文討論如何使用 CUDA 對代碼進(jìn)行并行優(yōu)化,并給出不同并行思路對均值濾波的實(shí)現(xiàn)。
并行優(yōu)化的兩種思路
?????? 思路1: global 函數(shù)
??????????? ? 在 global 函數(shù)中創(chuàng)建出多個(gè)塊多個(gè)線程對矩陣每個(gè)元素進(jìn)行并行計(jì)算
??????????? ? 請參考:http://www.cnblogs.com/scut-fm/p/3750119.html
?????? 思路2: CUDA 庫
??????????? ? 將遍歷矩陣分別對每個(gè)元素的操作轉(zhuǎn)化成以矩陣整體為單位的操作
??????????? ? 請參考:http://www.cnblogs.com/scut-fm/p/3756242.html
兩種思路在均值濾波中的應(yīng)用
?????? 思路1的應(yīng)用:創(chuàng)建多個(gè)線程,每個(gè)線程對其負(fù)責(zé)元素做均值卷積操作。
?????? 思路2的應(yīng)用:
??????????? ? 第一步:將矩陣向上平移一個(gè)單位得到矩陣副本1
??????????? ? 第二步:將矩陣向下平移一個(gè)單位得到矩陣副本2
??????????? ? 第三步:將矩陣向左平移一個(gè)單位得到矩陣副本3
??????????? ? 第四步:將矩陣向右平移一個(gè)單位得到矩陣副本4
????? ????? ? 第五步:將矩陣副本1-4相加然后除以 4 得到結(jié)果矩陣
《新程序員》:云原生和全面數(shù)字化實(shí)踐50位技術(shù)專家共同創(chuàng)作,文字、視頻、音頻交互閱讀總結(jié)
以上是生活随笔為你收集整理的第七篇:使用 CUDA 进行计算优化的两种思路的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: AIX中查找端口号和进程
- 下一篇: JDK1.8源码阅读系列之二:Linke