系统英伟达gpu驱动卸载_绕过CPU,英伟达让GPU直连存储设备
英偉達最近發(fā)布了一個新的GPUDirect Storage,暫且叫做GPU直連存儲,讓GPU直接連到NVMe存儲設(shè)備上。這一方案用到了RDMA設(shè)備來把數(shù)據(jù)從閃存存儲轉(zhuǎn)移到GPU本地的內(nèi)存里,無需經(jīng)過CPU還有系統(tǒng)內(nèi)存。
如果這一舉措順利的話,英偉達就能擺脫對于CPU的依賴開辟一片全新的領(lǐng)地,全新的市場,比如數(shù)據(jù)科學(xué)和機器學(xué)習(xí)市場,這一市場將造就每年200億到250億美金的服務(wù)器市場,跟HPC和深度學(xué)習(xí)市場加起來的市場規(guī)模差不多一樣大。
英偉達在拼命的把要做的事情往GPU里放,去年十月份,英偉達發(fā)布了RAPIDS,這是一個開源的工具庫,用于幫助人們用GPU做分析和機器學(xué)習(xí)。RAPIDS可以對Apache Arrow, Spark等數(shù)據(jù)科學(xué)類的工具提供GPU加速,將GPU放入大數(shù)據(jù)企業(yè)應(yīng)用的生態(tài),這一領(lǐng)域現(xiàn)如今仍舊是以基于CPU的Hadoopp和Mapreduce這種方案。
RAPIDS涵蓋了機器學(xué)習(xí)的所有方面,包括監(jiān)督式和無監(jiān)督式的機器學(xué)習(xí),還有各種數(shù)據(jù)處理方面的內(nèi)容,但是,這一做法也遭到了一些懷疑。
GPU現(xiàn)在越做越大,連接性也越來越好,從應(yīng)用的角度來看,GPU的通用也很好。與此同時,數(shù)據(jù)分析越來越負載,機器學(xué)習(xí)經(jīng)常會集成到工作流程中,這樣一來,對TB級數(shù)據(jù)進行千萬億次計算的應(yīng)用程序也會越來越多。
想做好這點必須有很好的可擴展性,通過NVLink和NVSwitch等技術(shù)可以連接多個GPU,組成一個巨大的加速器,該技術(shù)最初是為DGX架構(gòu)設(shè)計的,這一架構(gòu)主要也是為了解決規(guī)模更大,更復(fù)雜的神經(jīng)網(wǎng)絡(luò)訓(xùn)練問題。英偉達想把GPU的計算能力用于大數(shù)據(jù)的想法是說的通的,但唯獨就是缺少快速的數(shù)據(jù)存儲路徑。
通常,在GPU加速系統(tǒng)當(dāng)中,所有的IO操作都會先經(jīng)過主機端,也就是需要經(jīng)過CPU指令把數(shù)據(jù)傳到主機內(nèi)存里,然后才會到達GPU,CPU通常會通過“bounce buffer”來實現(xiàn)數(shù)據(jù)傳輸,“bounce buffer”是系統(tǒng)內(nèi)存中的一塊區(qū)域,數(shù)據(jù)在傳輸?shù)紾PU之前會在這里保存一個副本。很明顯,這種中轉(zhuǎn)會引額外延遲和內(nèi)存消耗,降低運行在GPU上的應(yīng)用程序的性能,還會占用CPU資源,這就是GPUDirect Storage要解決的問題。
英偉達方面表示這一技術(shù)能提升50%的IO帶寬,延遲能降低3.8倍。如果通過NVMeoF技術(shù)的話,GPU就能連上PB級別的存儲資源池,更厲害的是,英偉達聲稱數(shù)據(jù)存取的效率比內(nèi)存的頁面緩存速度還要快。
英偉達表示,如果你的DGX-2系統(tǒng)里有16個GPU,主機端有1.5TB內(nèi)存的話,GPUDirect Storage的吞吐帶寬能提升8倍(跟原來不支持GPUDirect Storage的DGX-2系統(tǒng)相比)。這是因為,DGX-2的吞吐帶寬能達到大約200GB/s,而原來依靠主機端內(nèi)存的話,最多也就50GB/s。
多出來的這150GB/s傳輸速度對于數(shù)據(jù)分析型工作負載的提升將非常可觀,對于像深度學(xué)習(xí)這種文件密集型應(yīng)用程序,對于傳統(tǒng)的HPC也將會帶來很大改觀。
英偉達的這一做法讓GPU直連到存儲,直接拿到原始數(shù)據(jù),意味著GPU也可以對文件進行解壓縮和解碼操作,解放CPU。目前,GPUDirect Storage支持各種常見的文件格式進行操作。
GPUDirect Storage方案用到了兩項高端技術(shù),一個是RDMA,一個是NVMe(NVMe-oF),其中,RDMA被封裝在GPUDirect的協(xié)議中,依靠各種網(wǎng)絡(luò)適配器工作(比如Mellanox的NIC),既可以訪問遠程的存儲也可以訪問本地的存儲設(shè)備。
目前,GPUDirect Storage只面向少數(shù)合作伙伴提供,預(yù)計今年十月份將推出beta版本。
在譯者看來,這是英偉達跟英特爾競爭的又一大舉措,可以看做是對英特爾再度進軍GPU市場的一個回應(yīng)。
繞開CPU,開辟一片新的生態(tài),這在理論上是可行的,也確實有明顯的需求場景,最后能否在市場上推行開來,還得看方案構(gòu)建的水平,包括方案的易用性,穩(wěn)定性,場景的優(yōu)化水平,當(dāng)然,最重要的還是不要對現(xiàn)有軟件架構(gòu)帶來太多變化,控制用戶的使用成本和購置成本。
總結(jié)
以上是生活随笔為你收集整理的系统英伟达gpu驱动卸载_绕过CPU,英伟达让GPU直连存储设备的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 特工皇妃之楚乔传分集剧情介绍 01
- 下一篇: 宋城门票多少钱啊?