當(dāng)前位置:
首頁 >
cuda nsight 调试和性能分析
發(fā)布時(shí)間:2024/8/23
50
豆豆
生活随笔
收集整理的這篇文章主要介紹了
cuda nsight 调试和性能分析
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
如果cuda需要調(diào)試需要在配置cmake:
cmake配置
set(CUDA_NVCC_FLAGS?-G;-g)
命令行編譯配置:
nvcc –g –G?MatrixCUDA.cu –o?MatrixCUDA
打開 nvidia nsight monitor ->options進(jìn)行設(shè)置
2.盡量把WDDM TDR Delay 調(diào)大點(diǎn)
3.將 use this monitor for cuda attach 設(shè)置為true
現(xiàn)在就可以開始debug和性能分析了
設(shè)置斷點(diǎn)后,需要重新生成一下,點(diǎn)擊nsight
?
我們主要使用兩個(gè)功能: 1 :start cuda debugging(legacy) 2: start performance analyis
1:點(diǎn)擊start cuda debugging(legacy)就可以debug了
2.start performance analyis
需要勾選 trace setting cuda 才能分析
點(diǎn)擊 application control ->launch 開始運(yùn)行 可以通過capture control 來控制開始停止
結(jié)束直接kill掉
總結(jié)
以上是生活随笔為你收集整理的cuda nsight 调试和性能分析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MySQL Binlog增量同步工具go
- 下一篇: Failed to connect to