當(dāng)前位置：首頁 > 运维知识 > windows >内容正文

windows

系统英伟达gpu驱动卸载_绕过CPU，英伟达让GPU直连存储设备

發(fā)布時間：2023/12/1 windows 38 豆豆

生活随笔收集整理的這篇文章主要介紹了系统英伟达gpu驱动卸载_绕过CPU，英伟达让GPU直连存储设备小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

英偉達最近發(fā)布了一個新的GPUDirect Storage，暫且叫做GPU直連存儲，讓GPU直接連到NVMe存儲設(shè)備上。這一方案用到了RDMA設(shè)備來把數(shù)據(jù)從閃存存儲轉(zhuǎn)移到GPU本地的內(nèi)存里，無需經(jīng)過CPU還有系統(tǒng)內(nèi)存。

如果這一舉措順利的話，英偉達就能擺脫對于CPU的依賴開辟一片全新的領(lǐng)地，全新的市場，比如數(shù)據(jù)科學(xué)和機器學(xué)習(xí)市場，這一市場將造就每年200億到250億美金的服務(wù)器市場，跟HPC和深度學(xué)習(xí)市場加起來的市場規(guī)模差不多一樣大。

英偉達在拼命的把要做的事情往GPU里放，去年十月份，英偉達發(fā)布了RAPIDS，這是一個開源的工具庫，用于幫助人們用GPU做分析和機器學(xué)習(xí)。RAPIDS可以對Apache Arrow, Spark等數(shù)據(jù)科學(xué)類的工具提供GPU加速，將GPU放入大數(shù)據(jù)企業(yè)應(yīng)用的生態(tài)，這一領(lǐng)域現(xiàn)如今仍舊是以基于CPU的Hadoopp和Mapreduce這種方案。

RAPIDS涵蓋了機器學(xué)習(xí)的所有方面，包括監(jiān)督式和無監(jiān)督式的機器學(xué)習(xí)，還有各種數(shù)據(jù)處理方面的內(nèi)容，但是，這一做法也遭到了一些懷疑。

GPU現(xiàn)在越做越大，連接性也越來越好，從應(yīng)用的角度來看，GPU的通用也很好。與此同時，數(shù)據(jù)分析越來越負載，機器學(xué)習(xí)經(jīng)常會集成到工作流程中，這樣一來，對TB級數(shù)據(jù)進行千萬億次計算的應(yīng)用程序也會越來越多。

想做好這點必須有很好的可擴展性，通過NVLink和NVSwitch等技術(shù)可以連接多個GPU，組成一個巨大的加速器，該技術(shù)最初是為DGX架構(gòu)設(shè)計的，這一架構(gòu)主要也是為了解決規(guī)模更大，更復(fù)雜的神經(jīng)網(wǎng)絡(luò)訓(xùn)練問題。英偉達想把GPU的計算能力用于大數(shù)據(jù)的想法是說的通的，但唯獨就是缺少快速的數(shù)據(jù)存儲路徑。

通常，在GPU加速系統(tǒng)當(dāng)中，所有的IO操作都會先經(jīng)過主機端，也就是需要經(jīng)過CPU指令把數(shù)據(jù)傳到主機內(nèi)存里，然后才會到達GPU，CPU通常會通過“bounce buffer”來實現(xiàn)數(shù)據(jù)傳輸，“bounce buffer”是系統(tǒng)內(nèi)存中的一塊區(qū)域，數(shù)據(jù)在傳輸?shù)紾PU之前會在這里保存一個副本。很明顯，這種中轉(zhuǎn)會引額外延遲和內(nèi)存消耗，降低運行在GPU上的應(yīng)用程序的性能，還會占用CPU資源，這就是GPUDirect Storage要解決的問題。

英偉達方面表示這一技術(shù)能提升50%的IO帶寬，延遲能降低3.8倍。如果通過NVMeoF技術(shù)的話，GPU就能連上PB級別的存儲資源池，更厲害的是，英偉達聲稱數(shù)據(jù)存取的效率比內(nèi)存的頁面緩存速度還要快。

英偉達表示，如果你的DGX-2系統(tǒng)里有16個GPU，主機端有1.5TB內(nèi)存的話，GPUDirect Storage的吞吐帶寬能提升8倍(跟原來不支持GPUDirect Storage的DGX-2系統(tǒng)相比)。這是因為，DGX-2的吞吐帶寬能達到大約200GB/s，而原來依靠主機端內(nèi)存的話，最多也就50GB/s。

多出來的這150GB/s傳輸速度對于數(shù)據(jù)分析型工作負載的提升將非常可觀，對于像深度學(xué)習(xí)這種文件密集型應(yīng)用程序，對于傳統(tǒng)的HPC也將會帶來很大改觀。

英偉達的這一做法讓GPU直連到存儲，直接拿到原始數(shù)據(jù)，意味著GPU也可以對文件進行解壓縮和解碼操作，解放CPU。目前，GPUDirect Storage支持各種常見的文件格式進行操作。

GPUDirect Storage方案用到了兩項高端技術(shù)，一個是RDMA，一個是NVMe(NVMe-oF)，其中，RDMA被封裝在GPUDirect的協(xié)議中，依靠各種網(wǎng)絡(luò)適配器工作(比如Mellanox的NIC)，既可以訪問遠程的存儲也可以訪問本地的存儲設(shè)備。

目前，GPUDirect Storage只面向少數(shù)合作伙伴提供，預(yù)計今年十月份將推出beta版本。

在譯者看來，這是英偉達跟英特爾競爭的又一大舉措，可以看做是對英特爾再度進軍GPU市場的一個回應(yīng)。

繞開CPU，開辟一片新的生態(tài)，這在理論上是可行的，也確實有明顯的需求場景，最后能否在市場上推行開來，還得看方案構(gòu)建的水平，包括方案的易用性，穩(wěn)定性，場景的優(yōu)化水平，當(dāng)然，最重要的還是不要對現(xiàn)有軟件架構(gòu)帶來太多變化，控制用戶的使用成本和購置成本。

總結(jié)

以上是生活随笔為你收集整理的系统英伟达gpu驱动卸载_绕过CPU，英伟达让GPU直连存储设备的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：特工皇妃之楚乔传分集剧情介绍 01
下一篇：宋城门票多少钱啊？