CPU失业前兆?英伟达显卡直连SSD技术了解下
傳統(tǒng)的數(shù)據(jù)讀取依賴于CPU執(zhí)行虛擬地址轉(zhuǎn)換、基于頁(yè)面的按需數(shù)據(jù)加載以及其它針對(duì)內(nèi)存和外存的大量數(shù)據(jù)管理工作,作為電腦核心部件之一的顯卡是無(wú)法直接從SSD中讀取數(shù)據(jù)。
但隨著人工智能和云計(jì)算的興起,有GPU直接讀取SSD硬件內(nèi)數(shù)據(jù),是最高效的方式。
為了讓GPU應(yīng)用程序能夠直接讀取數(shù)據(jù),英偉達(dá)聯(lián)合IBM,通過(guò)與幾所大學(xué)的合作打造一套新架構(gòu),為大量數(shù)據(jù)存儲(chǔ)提供快速“細(xì)粒度訪問(wèn)”,也就是所謂的“大加速器內(nèi)存”(Big Accelerator Memory,簡(jiǎn)稱BaM)。
通過(guò)這一技術(shù),能夠提升GPU顯存容量、有效提升存儲(chǔ)訪問(wèn)帶寬,同時(shí)為GPU線程提供高級(jí)抽象層,以便輕松按需、細(xì)粒度地訪問(wèn)擴(kuò)展內(nèi)存層次中的海量數(shù)據(jù)結(jié)構(gòu)。
對(duì)于普通用戶來(lái)說(shuō),BaM擁有兩大優(yōu)勢(shì),第一是基于軟件管理的GPU緩存,數(shù)據(jù)存儲(chǔ)和顯卡間的信息傳輸分配,都交給GPU核心上的線程來(lái)管理。
并通過(guò)使用RDMA、PCI Express接口以及自定義的Linux內(nèi)核驅(qū)動(dòng)程序,BaM允許GPU直接打通SSD數(shù)據(jù)讀寫。
第二就是打通NVMe SSD的數(shù)據(jù)通信請(qǐng)求,BaM只會(huì)在特定數(shù)據(jù)不在軟件管理的緩存區(qū)域時(shí),才讓GPU線程做好參考執(zhí)行驅(qū)動(dòng)程序命令的準(zhǔn)備。在圖形處理器上運(yùn)行繁重工作負(fù)載的算法,能夠通過(guò)針對(duì)特定數(shù)據(jù)的訪問(wèn)例程優(yōu)化,從而實(shí)現(xiàn)針對(duì)重要信息的高效訪問(wèn)。
在以CPU為中心的策略電腦中,會(huì)因?yàn)镃PU、GPU之間的數(shù)據(jù)傳輸以及I/O流量的放大,拖累具有細(xì)粒度的數(shù)據(jù)相關(guān)訪問(wèn)模式。
研究人員在BaM模型的GPU內(nèi)存中,提供基于高并發(fā)NVMe的提交/完成隊(duì)列的用戶級(jí)庫(kù),使未從軟件緩存中丟失的GPU線程,能夠以高吞吐量的方式來(lái)高效訪問(wèn)存儲(chǔ)。
更重要的是,BaM方案在每次存儲(chǔ)訪問(wèn)時(shí)的軟件開(kāi)銷極低,并支持高度并發(fā)的線程。在基于BaM設(shè)計(jì)+標(biāo)準(zhǔn)GPU+NVMe SSD的Linux原型測(cè)試平臺(tái)的相關(guān)實(shí)驗(yàn)測(cè)試中,BaM交出相當(dāng)喜人的成績(jī)。
作為代替基于CPU統(tǒng)管一切事務(wù)的解決方案,BaM的研究表明,存儲(chǔ)訪問(wèn)可同時(shí)工作、消除同步限制,并且明顯提升I/O帶寬效率,讓應(yīng)用程序的性能獲得大幅提升。
NVIDIA首席科學(xué)家Bill Dally指出:得益于軟件緩存,BaM不依賴于虛擬內(nèi)存地址轉(zhuǎn)換,天生就免疫TLB未命中等序列化事件。
編輯點(diǎn)評(píng):隨著Resizable BAR和SAM技術(shù)的發(fā)展和應(yīng)用,GPU和CPU之間的帶寬瓶頸得到極大的緩解,但相比于從CPU獲取數(shù)據(jù),讓GPU直接從SSD中獲得數(shù)據(jù)的應(yīng)用效率會(huì)更高。
雖然新的BaM目前尚未明確如何在消費(fèi)者領(lǐng)域應(yīng)用,但相信不久后也會(huì)有相關(guān)產(chǎn)品面世。
總結(jié)
以上是生活随笔為你收集整理的CPU失业前兆?英伟达显卡直连SSD技术了解下的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 多家视频网站发狠!火狐中国浏览器已屏蔽去
- 下一篇: 曝格力成立数字化渠道管理部:任命王自如为