NVIDIA发布新一代H100 GPU核心:4nm工艺、1.8万核心、700W功耗
黃仁勛終于公布了NVIDIA新一代架構(gòu)與核心,當(dāng)然這次是面向HPC高性能計(jì)算、AI人工智能的“Hopper”,對(duì)應(yīng)核心編號(hào)“GH100”,同時(shí)發(fā)布的還有基于新核心的加速計(jì)算卡“H100”、AI計(jì)算系統(tǒng)“DGX H100”。
與傳聞不同,GH100核心采用的其實(shí)是臺(tái)積電目前最先進(jìn)的4nm工藝,而且是定制版,CoWoS 2.5D晶圓級(jí)封裝,單芯片設(shè)計(jì),集成多達(dá)800億個(gè)晶體管,號(hào)稱(chēng)世界上最先進(jìn)的芯片。
顯存支持六顆HBM3或者HBM2e,控制器是12組512-bit,總計(jì)位寬6144-bit。
,七倍于PCIe 5.0,相比A100也多了一半。整卡對(duì)外總帶寬4.9TB/s。
性能方面,F(xiàn)P64/FP32 60TFlops(每秒60萬(wàn)億次),F(xiàn)P16 2000TFlops(每秒2000萬(wàn)億次),TF32 1000TFlops(每秒1000萬(wàn)億次),都三倍于A100,F(xiàn)P8 4000TFlops(每秒4000萬(wàn)億次),六倍于A100。
按慣例也不是滿(mǎn)血,GPC雖然還是8組,但是SXM5版本只開(kāi)啟了62組TPC(魅族GPC屏蔽一組TPC)、128組SM,總計(jì)有15872個(gè)CUDA核心、528個(gè)Tensor核心、50MB二級(jí)緩存。
,Tensor核心只有456個(gè)。
DGX H100系統(tǒng)集成八顆H100芯片、搭配兩顆PCIe 5.0 CPU處理器(Intel Sapphire Rapids四代可擴(kuò)展至器?),擁有總計(jì)6400億個(gè)晶體管、640GB HBM3顯存、24TB/s顯存帶寬。
性能方面,AI算力32PFlops(每秒3.2億億次),浮點(diǎn)算力FP64 480TFlops(每秒480萬(wàn)億次),F(xiàn)P16 1.6PFlops(每秒1.6千萬(wàn)億次),F(xiàn)P8 3.2PFlops(每秒3.2千億次),分別是上代DGX A100的3倍、3倍、6倍,而且新增支持網(wǎng)絡(luò)內(nèi)計(jì)算,性能3.6TFlops。
PCIe 5.0版本的性能基本都再下降20%。
同時(shí)配備Connect TX-7網(wǎng)絡(luò)互連芯片,臺(tái)積電7nm工藝,800億個(gè)晶體管,400G GPUDirect吞吐量,400G加密加速,4.05億/秒信息率。
DGX H100是最小的計(jì)算單元,為了擴(kuò)展,這一次NVIDIA還設(shè)計(jì)了全新的VNLink Swtich互連系統(tǒng),可以連接最多32個(gè)節(jié)點(diǎn),也就是256顆H100芯片,稱(chēng)之為“DGX POD”。
系統(tǒng)合作伙伴包括Atos、思科、戴爾、富士通、技嘉、新華三、慧與、浪潮、聯(lián)想、寧暢、超威。
云服務(wù)合作伙伴包括阿里云、亞馬遜云、百度云、Google云、微軟Azure、甲骨文云、騰訊云。
總結(jié)
以上是生活随笔為你收集整理的NVIDIA发布新一代H100 GPU核心:4nm工艺、1.8万核心、700W功耗的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: NVIDIA发布Grace CPU处理器
- 下一篇: 优惠幅度1300元!攀升12代酷睿台式机