流式多处理器(streamingMultiproeessor,SM)与流处理器(strcamingProcessor, sp)
SM是一種單指令多線程((single Instruction?MultipleThread,SIMT)架構的處理器,類似單指令流多數(shù)據(jù)流(SIMD)的特點,含有指令發(fā)射單元,及若干個流處理器(strcamingProcessor,sp)或標量處理器(Scalarproeessor,SP),特殊函數(shù)處理器(speeial Funetion?Proeessor,SFU),可快速訪問的共享存儲器(shared memory)以及指令和常量(constant)緩存"。
?真正進行運算操作的就是流處理器SP,包含有浮點及整數(shù)處理單元和寄存器,可以進行浮點數(shù)的乘加/乘/加(FMAD/FMUL/FADD),整數(shù)的加/乘/比較/移位(ADD/MUL/CMP/MOVE)等操作"。
在cuda編程中,可用如下庫函數(shù)獲得顯卡的相關參數(shù)信息。
cudaDeviceProp prop; int count; cudaGetDeviceCount( &count ); for (int i = 0; i < count; i++)cudaGetdeviceProperties(& prop,i);
其中,prop.multiProcessorCount,prop.maxThreadsPerMultiProcessor 分別指設備上的流多處理器(SM)的數(shù)量和每個流多處理器(SM)最大線程數(shù)量。
在費米構架中,每個流多處理器中運算單元(SM,或Cores)與計算GPU能力相關:
于是筆者算著自己電腦里GeForce 630 顯卡的流多處理器數(shù)量數(shù)2,運算單元數(shù)是96,即每個流多處理器中運算單元數(shù)是48。更多顯卡的詳細參數(shù)和最大并行執(zhí)行線程數(shù)量相關問題請參考下面的鏈接。
http://en.wikipedia.org/
http://stackoverflow.com
總結
以上是生活随笔為你收集整理的流式多处理器(streamingMultiproeessor,SM)与流处理器(strcamingProcessor, sp)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 民族企业家周景川:凡事勤则易,凡事惰则难
- 下一篇: 域控服务器错误事件解决方法,求大神帮忙,