我国最新申威 SW26010-Pro 处理器展示,新一代超算同步亮相
11 月 26 日消息,SC (International Conference for High Performance Computing, Networking, Storage, and Analysis) 是高性能計算,體系結構領域頂級會議。
在剛剛舉行的 SC23 上,我國向世界展示了全新的申威 SW26010-Pro 處理器,性能比上一代提高了四倍。這是我國采用自主指令集(基于 Alpha 進行擴展),具有完全自主知識產權的處理器系列產品。
據介紹,基于申威 SW26010 處理器的神威太湖之光目前在 Top 500 超算榜單中排名第 11 名,而使用新處理器的超級計算機則排在第二名,僅次于美國橡樹嶺國家實驗室的 Frontier。
SW26010-Pro 由 6 個核心組和 1 個協議處理單元(PPU)構成,每個核心組包含 64 個計算處理元素,總計 384 個內核,相比下 SW26010 只有 4 個核心組。
此外,它支持的內存控制器也已經從 DDR3 升級到 DDR4-3200;而且每個核心組都有自己的內存控制器,配備 16 GB 內存,理論帶寬達 307.2 GB/s。一個芯片能訪問 96 GB 主內存,相比 SW26010 的 32 GB 實現了顯著提升。
據 Chips and Cheese 稱,SW26010 Pro C 擁有比前代產品更快的運行速度(CPE 頻率為 2.25 GHz,MPE 頻率為 2.10 GHz,前代產品僅 1.45 GHz),再加上全新 64 位 RISC 微架構和系統架構的改進,其 FP64 計算吞吐量也增加了四倍以上。
數據顯示,每顆 SW26010 Pro 的最大 FP64 吞吐量為 13.8 TFLOPS。從理論計算吞吐量的角度來看,新型超級計算機十分強悍。雖然 SW26010-Pro 在節點級別與 Fugaku A64FX 相似,但我們的超級計算機可以在使用更少芯片的同時提供更高的 FP64 吞吐量。匯總數據對比如下:
| CPU | 計算核心 | FP64 | FP32 |
| SW26010-Pro | 384 | 13.8 TFLOPS | 27.6 TFLOPS |
| SW26010 | 256 | 2.9 TFLOPS | 5.8 TFLOPS |
| A64FX | 48 | 3 TFLOPS | 6 TFLOPS |
| MI250X (單 GCD) | 110 | 23.9 TFLOPS | 23.9 TFLOPS | 47.8 TFLOPS (packed) |
不過,它的內存帶寬未能與計算吞吐量相匹配,因此內存帶寬成為了它的性能瓶頸。
SW26010-Pro 試圖通過將緩存容量增加到 256 KB(SW26010 為 64 KB)來解決問題,但在缺乏適當的 L2 緩存的情況下,每個 CPE 只有 256KB 的緩存明顯是不夠的,因此兩個處理器仍然存在主要的性能瓶頸。同時,一個雙通道 DDR4-3200(51.2 GB/s)的內存子系統對于擁有 512 位向量 FPU、每周期最高可達 16 FP64 FLOPS 的 64 核處理器來說也非常不夠用。
| 超算系統 | 節點 | HPL-MxP 性能(Eflop/s) | 理論 FP64 吞吐量 (Pflop/s) |
| 新一代神威 | 107,136 申威 SW26010-Pro | 5.048 | 1,481.05 |
| 神威?太湖之光 | 40,960 申威 SW26010 | ? | 121.6 |
| 富岳 | 158,976 A64FX | 2 | 537.21 |
| Frontiers | 9,408(64c AMD 霄龍 7A53 + 4x AMD MI250X) | 9.9507 | 1,821.84 (僅 GPU 為 1,679.62) |
相關閱讀:
《最新 TOP500 超算排行榜揭曉:Frontier 仍保持全球第一,Aurora、Eagle 空降》
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節省甄選時間,結果僅供參考,所有文章均包含本聲明。
總結
以上是生活随笔為你收集整理的我国最新申威 SW26010-Pro 处理器展示,新一代超算同步亮相的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 床垫多少钱啊?
- 下一篇: 押注新能源汽车,韩国三大电池制造商今年研