打破16项AI性能记录!英伟达A100 GPU要无人能敌?
2020 年 7 月 30 日,MLPerf 組織發(fā)布第三個(gè)版本 MLPerf Training v0.7 基準(zhǔn)測(cè)試(Benchmark)結(jié)果。結(jié)果顯示,英偉達(dá)基于今年 5 月最新發(fā)布的 Ampere 架構(gòu) GPU A100,和 HDR InfiniBand 實(shí)現(xiàn)多個(gè) DGX A100 系統(tǒng)互聯(lián)的龐大集群——DGX SuperPOD 系統(tǒng)在性能上分別開(kāi)創(chuàng)了八個(gè)全新里程碑,共打破 16 項(xiàng)紀(jì)錄。
打破 MLPerf Training 最新基準(zhǔn)測(cè)試 16 項(xiàng)記錄
MLPerf 是 2018 年 5 月成立的行業(yè)基準(zhǔn)測(cè)試組織,在 AI 備受關(guān)注的當(dāng)下,獲得了芯片巨頭和 AI 芯片公司以及 AI 業(yè)界的廣泛關(guān)注。為了能夠讓機(jī)器學(xué)習(xí)處理器的基準(zhǔn)測(cè)試也像 CPU 那樣,MLPerf 組織囊括了該行業(yè)中的所有知名企業(yè)和機(jī)構(gòu),比如英特爾、英偉達(dá)、Google、亞馬遜、阿里巴巴和百度、微軟、斯坦福大學(xué)等。
巨頭公司們樂(lè)于通過(guò) MLPerf 的成績(jī)證明其 AI 實(shí)力,平頭哥在去年 11 月 MLPerf 首個(gè)版本基準(zhǔn)測(cè)試成績(jī)公布之后就強(qiáng)調(diào)其自主研發(fā)的 AI 芯片含光 800 在 Resnet50 基準(zhǔn)測(cè)試中獲得單芯片性能第一。
作為 AI 的領(lǐng)軍者,英偉達(dá)自然也不會(huì)錯(cuò)過(guò) MLPerf 的基準(zhǔn)測(cè)試。2018 年 12 月,英偉達(dá)首次在 MLPerf 訓(xùn)練基準(zhǔn)測(cè)試中創(chuàng)下了六項(xiàng)紀(jì)錄,次年 7 月英偉達(dá)再次創(chuàng)下八項(xiàng)紀(jì)錄。在最新 MLPerf Training v0.7 基準(zhǔn)測(cè)試中,有兩項(xiàng)新的測(cè)試和一項(xiàng)經(jīng)大幅修訂的測(cè)試。
其中一項(xiàng)基準(zhǔn)測(cè)試對(duì)推薦系統(tǒng)的性能進(jìn)行了排名,推薦系統(tǒng)是日益普及的一項(xiàng) AI 任務(wù)。另一項(xiàng)基準(zhǔn)測(cè)試對(duì)使用 BERT 的對(duì)話式 AI 進(jìn)行了測(cè)試,BERT 是現(xiàn)有最復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型之一。還有,強(qiáng)化學(xué)習(xí)測(cè)試中使用了 Mini-go 和全尺寸 19x19 圍棋棋盤(pán),該測(cè)試是本輪最復(fù)雜的測(cè)試,內(nèi)容涵蓋從游戲到訓(xùn)練的多項(xiàng)操作。
特別值得一提的是,英偉達(dá)是唯一一家在 MLPerf Training v0.7 測(cè)試中均采用市售商用產(chǎn)品的公司。其他大多數(shù)提交使用的要么是預(yù)覽類別(preview category),其所用的產(chǎn)品預(yù)計(jì)需要幾個(gè)月后才會(huì)面市,使用研究類別的產(chǎn)品,更是較長(zhǎng)一段時(shí)間內(nèi)都不會(huì)面市。
另外,在此次提交結(jié)果的九家公司中,除英偉達(dá)外,還有六家公司多家生態(tài)系統(tǒng)合作伙伴也提交了基于英偉達(dá) GPU 的 MLPerf 測(cè)試結(jié)果。包括三家云服務(wù)提供商(阿里云、谷歌云和騰訊云)和三家服務(wù)器制造商(戴爾、富士通和浪潮)。
18 個(gè)月內(nèi)實(shí)現(xiàn) AI 性能 4 倍提升
創(chuàng)造紀(jì)錄的英偉達(dá) DGX SuperPOD 系統(tǒng)是基于 Ampere 架構(gòu)以及 Volta 架構(gòu)。雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng))此前報(bào)道,5 月份發(fā)布的最近 Ampere 架構(gòu) GPU A100 基于臺(tái)積電 7nm 工藝,面積高達(dá) 826 平方毫米,集成了 540 億個(gè)晶體管。相比 Volta 架構(gòu)實(shí)現(xiàn)了高達(dá) 20 倍的性能提升,并且可以同時(shí)滿足 AI 訓(xùn)練和推理的需求。
A100 對(duì)比 V100
由 8 個(gè)安培 A100 GPU 打造的 NVIDIA DGX A100 AI 系統(tǒng)單節(jié)點(diǎn)性能達(dá)到了創(chuàng)紀(jì)錄的 5 petaflops。
此次,英偉達(dá)在 Selene 上運(yùn)行了系統(tǒng)的 MLPerf 測(cè)試,Selene 是基于 DGX SuperPOD 的內(nèi)部集群。DGX SuperPOD 是針對(duì)大規(guī)模 GPU 集群的公共參考架構(gòu),可在數(shù)周內(nèi)完成部署。
根據(jù)測(cè)試結(jié)果,相較于首輪 MLPerf 訓(xùn)練測(cè)試中使用的基于 V100 GPU 的系統(tǒng),如今的 DGX A100 系統(tǒng)能夠以相同的吞吐率,在 18 個(gè)月內(nèi)實(shí)現(xiàn)了 4 倍的性能提升。
能夠取得里程碑的成就除了強(qiáng)大的硬件,還有兩大關(guān)鍵——軟件和網(wǎng)絡(luò)連接。
A100 GPU 搭配 CUDA-X 庫(kù)的軟件更新,為通過(guò) Mellanox HDR 200Gb/s InfiniBand 網(wǎng)絡(luò)構(gòu)建的擴(kuò)展集群提供支持。HDR InfiniBand 可實(shí)現(xiàn)極低的延遲和高數(shù)據(jù)吞吐量,同時(shí)通過(guò)可擴(kuò)展分層聚合和縮減協(xié)議(SHARP)技術(shù),提供智能深度學(xué)習(xí)計(jì)算加速引擎。
英偉達(dá) A100 能否無(wú)人能敵?
英偉達(dá) A100 發(fā)布之后,就有業(yè)內(nèi)人士表示 GPU 的性能又上了一個(gè)臺(tái)階,AI 芯片初創(chuàng)公司想要超越英偉達(dá)的難度有增加了。
但相比硬件的超越,雷鋒網(wǎng)認(rèn)為軟硬件生態(tài)才是巨頭公司更大的優(yōu)勢(shì)所在。據(jù)悉,通過(guò)最新的軟件優(yōu)化,基于 NVIDIA V100 的 DGX-1 系統(tǒng)也可實(shí)現(xiàn) 2 倍的性能提升。
就此次最新基準(zhǔn)測(cè)試而言,提交了基于英偉達(dá) GPU 的 MLPerf 測(cè)試結(jié)果的公司大多采用了英偉達(dá)的軟件中心 NGC 容易,以及用于參賽的公開(kāi)框架。另外,包括這些 MLPerf 合作伙伴在內(nèi)的近二十家云服務(wù)提供商和 OEM 組成的生態(tài)系統(tǒng),已采用或計(jì)劃采用 A100 GPU 來(lái)打造在線實(shí)例、服務(wù)器和 PCIe 卡。
英偉達(dá)表示,A100 進(jìn)入市場(chǎng)的速度也比以往英偉達(dá)的 GPU 更快,發(fā)布之初用于英偉達(dá)的第三代 DGX 系統(tǒng),正式發(fā)布僅六周后,A100 就正式登陸了 Google Cloud 。
當(dāng)然,英偉達(dá)也在通過(guò)更多行業(yè)軟件吸引用戶。比如今年 5 月,英偉達(dá)發(fā)布了兩個(gè)應(yīng)用框架——用于對(duì)話式 AI 的 Jarvis 和用于推薦系統(tǒng)的 Merlin。還有面向汽車行業(yè)市場(chǎng)的 NVIDIA DRIVE,面向醫(yī)療健康市場(chǎng)的 Clara,面向機(jī)器人技術(shù)市場(chǎng)的 Isaac,以及面向零售/智能城市市場(chǎng)的 Metropolis。
性能和生態(tài)都足夠好的 A100,能讓英偉達(dá)在 AI 市場(chǎng)無(wú)人能敵嗎??jī)r(jià)格會(huì)是阻礙嗎?
總結(jié)
以上是生活随笔為你收集整理的打破16项AI性能记录!英伟达A100 GPU要无人能敌?的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 求一个qq二字网名男。
- 下一篇: 微软加入 Blender 基金会