日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

<tbody id="6qagl"><listing id="6qagl"><tfoot id="6qagl"></tfoot></listing></tbody>

歡迎訪問生活随笔！

生活随笔

生活随笔是一个全网技术分享平台，涵盖前端开发（HTML/CSS/JavaScri...

生活随笔

當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

GPU中的SM和warp的关系

發布時間：2023/12/29 编程问答 57 豆豆

生活随笔收集整理的這篇文章主要介紹了 GPU中的SM和warp的关系小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

介紹

我們在cpu上做好了準備工作，然后將指令發送給GPU, 在這里我們看到grid為10，block為128，也就說有10個block，每一block有128個thread,

如何分配這些block?
原則

在GPU中一個block是不能拆分到兩個SM中
一個SM中的block要滿足SM的條件限制

SM有哪些限制？
簡單有這些，當然還有其他的沒有展示，這里數值都是我瞎編的，具體的可以去官網文檔查看參數：

一個block需要哪些資源？
一個SM能給的資源如上，那么一個block需要哪些資源呢？簡單如下：

分配結果如下：
可以看到還有4個block沒地方擱，不用擔心，中間的調度器會一直輪詢所有SM的，只要有空閑的位置就會將還沒安排的block安排上去。

block里面所有線程都是同時執行嗎？
在SM中，block繼續分割為warp.一個warp為32個thread，共用一套指令，至于為啥是32，這和硬件有關系，比如人家卡里就32個cuda core，那可不是一次就只能執行1個warp(32個線程)。

warp如何執行？
好了，到現在為止warp也切割好了，具體執行方式如下：

這個就不詳細解釋了，跟CPU調度類似，就是你io耽誤了，其他的任務上，你IO結束了，你在繼續占有計算資源。

總結

以上是生活随笔為你收集整理的GPU中的SM和warp的关系的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：高级编程技术课后作业十三（第8周第2次
下一篇：共话新科技新商业，2017全球虚拟现实产

<tbody id="vfkgq"><em id="vfkgq"><s id="vfkgq"></s></em></tbody>

<li id="vfkgq"></li>

<li id="vfkgq"><dd id="vfkgq"><menu id="vfkgq"></menu></dd></li>

<span id="vfkgq"><listing id="vfkgq"></listing></span><pre id="vfkgq"></pre>