世界超算TOP 500排名出爐:中國依然遙遙領先 但算力不及第二名

發布時間:2021-06-30 08:20:38  |  來源:IT之家  

6 月 30 日消息 一年一度的高性能計算大會 ISC 如期而至,世界 TOP 500 超級計算機排名昨日正式公布。

對比去年的榜單,今年 TOP 10 的榜單中,來自美國新能源部勞倫斯伯克利國家實驗室的 Perlmutter 系統新晉入圍。中國超級計算機的數量雖然下降至 186 臺(去年 212),但對比位居第二的美國的 123 臺,依然遙遙領先。不過美國超算算力更強,美國超算的綜合性能為 856.8 Pflop/s,而中國超算為 445.3 Pflop/s。

以下是 Top10 中的系統摘要(引用自 Top500):

日本的 Fugaku 仍然是第一的超算系統。它擁有 7,630,848 個內核,使其能夠達到 442 Pflop/s 的 HPL 基準測試分數。這使它領先第二名 3 倍。

Summit 是美國田納西州橡樹嶺國家實驗室 (ORNL) 的 IBM 構建的系統,仍然是美國最快的系統,在 HPL 基準測試中的性能為 148.8 Pflop/s,全球排名第二。用于對 TOP500 榜單進行排名。Summit 有 4,356 個節點,每個節點包含兩個 Power9 CPU,每個 CPU 有 22 個內核,六個 NVIDIA Tesla V100 GPU,每個都有 80 個流式多處理器 (SM)。這些節點通過 Mellanox 雙軌 EDR InfiniBand 網絡鏈接在一起。

美國加利福尼亞州勞倫斯利弗莫爾國家實驗室的 Sierra 系統排名第 3。其架構與 #2 的 Summit 系統非常相似。它由 4,320 個節點構建,具有兩個 Power9 CPU 和四個 NVIDIA Tesla V100 GPU。Sierra 達到了 94.6 Pflop/s。

由中國國家并行計算機工程與技術研究中心(NRCPC)開發并設立在江蘇無錫國家超級計算中心的神威太湖之光以 93 Pflop/s 排名第四.

排名第 5 的 Perlmutter 是 TOP10 中的新晉成員。它基于 HPE Cray“Shasta”平臺,以及一個具有基于 AMD EPYC 的節點和 1536 個 NVIDIA A100 加速節點的異構系統。Perlmutter 達到了 64.6 Pflop/s。

Selene 現在排名第 6,是 NVIDIA 內部安裝的 NVIDIA DGX A100 SuperPOD。該系統基于 AMD EPYC 處理器,采用 NVIDIA A100 加速,Mellanox HDR InfiniBand 作為網絡,實現了 63.4 Pflop/s。

由中國國防科技大學(NUDT)開發并部署在中國廣州國家超級計算機中心的系統天河 2A(Milky Way-2A)現在以 61.4 Pflop /s 被列為世界第 7 系統。

名為“JUWELS Booster Module”系統是 No. 8。由 Atos 構建的 BullSequana 系統安裝在德國的 Forschungszentrum Juelich (FZJ)。該系統使用帶有 NVIDIA A100 的 AMD EPYC 處理器進行加速,并使用 Mellanox HDR InfiniBand 作為類似于 Selene 系統的網絡。這是歐洲最強大的系統,算力達 44.1 Pflop/s。

排在第 9 位的 HPC5 是戴爾構建、意大利 Eni SpA 安裝的 PowerEdge 系統,由于使用 NVIDIA Tesla V100 作為加速器和 Mellanox HDR InfiniBand 作為網絡,實現了 35.5 Pflop/s 的性能。

Frontera 是一款戴爾 C6420 系統,安裝在得克薩斯大學的得克薩斯高級計算中心,目前排名第 10。它使用 448,448 個英特爾至強內核實現了 23.5 Pflop/s。

值得注意的是,此次榜單中大多數系統采用了 AMD 和英偉達的方案。另外,名單上更新的兩個新系統“超級云”,能夠同時滿足 AI、高性能計算(HPC)和云端需求,這意味著,高性能計算正在同 AI 加速融合。

此外,英偉達也在本次 ISC 大會上發布了全新的 HGX A100 系統,且已經在英國愛丁堡大學托管的 DiRAC 超級計算機中落地。

據介紹,英偉達 HGX A100 加入了三項關鍵技術:NVIDIA A100 80GB PCIe GPU、NVIDIA NDR 400G InfiniBand 網絡和 NVIDIA Magnum IO GPUDirect Storage 軟件。

其中,A100 80GB PCle GPU 采用 NVIDIA Ampere 架構,與 A100 40GB 相比其內存帶寬帶到 2TB/S,提升 25% 。更高的內存容量和內存帶寬,能夠將更多的數據和更大的神經網絡保存在內存中,從而最大限度地減少節點通信和能耗,研究人員也能獲得更高的吞吐率和更快的結果。

目前,英偉達最新 HGX 高性能計算平臺已落地英國愛丁堡大學,為其托管的新型 DiRAC 超級計算機 Tursa 提供動力支持。

關鍵詞: 中國 超級計算機

 

關于我們 - 聯系我們 - 版權聲明 - 招聘信息 - 友鏈交換

2014-2020  電腦商網 版權所有. All Rights Reserved.

備案號:京ICP備2022022245號-1 未經過本站允許,請勿將本站內容傳播或復制.

聯系我們:435 226 40@qq.com