日本Fugaku超级计算机仍然是TOP500的王者

在第58届百强榜上,前10名几乎没有变化。被称为Voyager-EUS2的微软Azure系统是唯一一台撼动榜首位置的机器,排名第10。基于AMD EPYC 48核2.45GHz处理器,NVIDIA A100 GPU和80gb内存,Voyager-EUS2还使用Mellanox HDR Infiniband进行数据传输。

虽然Top10中的系统位置没有其他变化,但NERSC的Perlmutter将其性能提高到70.9 Pflop/s。在劳伦斯伯克利国家实验室,Perlmutter的性能提升并没有改变它之前的第五名的位置。

Fugaku继续保持着它在2020年6月首次获得的第一名的位置。其HPL基准评分为442 Pflop/s,比排名第二的Summit高出3倍。它安装在日本神户的理研计算科学中心(R-CCS),由理研和富士通共同开发,基于富士通定制的ARM A64FX处理器。Fugaku还使用富士通的豆腐D互连网络在节点之间传输数据。

在机器学习和人工智能应用中经常使用的单精度或进一步降低精度方面,Fugaku的峰值性能超过1,000 PFlop/s (1 Exaflop/s)。因此,Fugaku经常被介绍为第一台“百亿亿次级”超级计算机。

虽然也有报道称中国的一些系统达到了Exaflop级别的性能,但这些系统都没有向TOP500提交HPL结果。

以下是Top10系统的总结:

  • Fugaku仍然是排名第一的系统。它拥有7,630,848个内核,这使得它能够实现442 Pflop/s的HPL基准评分。这使得它比榜单上排名第二的系统领先3倍。
  • Summit是ibm在美国田纳西州橡树岭国家实验室(ORNL)建造的系统,目前仍是美国最快的系统,在全球排名第二。它在HPL基准上的性能为148.8 Pflop/s,用于排名TOP500榜单。Summit有4356个节点,每个节点包含两个22核的Power9 cpu和6个NVIDIA Tesla V100 gpu,每个gpu有80个流多处理器(S.M.)。节点通过Mellanox双轨EDR InfiniBand网络连接。
  • 美国加州劳伦斯利弗莫尔国家实验室的Sierra系统排名第三。它的架构非常类似于#2系统峰会。它由4320个节点、2个Power9 cpu和4个NVIDIA Tesla V100 gpu组成。Sierra达到94.6 Pflop/s。
  • 神威太湖之光是由中国国家并行计算机工程与技术研究中心(NRCPC)开发的系统,安装在中国江苏省无溪市的国家超级计算中心,以93 Pflop/s排名第四。
  • 排名第5位的珀尔马特是去年6月新进入TOP10的。它基于HPE Cray“Shasta”平台,是一个异构系统,具有AMD EPYC节点和1536个NVIDIA A100加速节点。Perlmutter将其性能提高到70.9 Pflop/s
  • 目前排名第六的Selene是NVIDIA DGX A100 SuperPOD,安装在NVIDIA在美国的内部。该系统基于AMD EPYC处理器,NVIDIA A100加速,Mellanox HDR InfiniBand网络。达到63.4 Pflop/s。
  • 天河- 2a(银河- 2a)系统由中国国防科技大学(NUDT)开发,部署在中国广州的国家超级计算机中心,目前排名第七,速度为61.4 Pflop/s。
  • 一个名为“JUWELS助推器模块”的系统是8号。由Atos建造的BullSequana系统安装在德国的Forschungszentrum Juelich (FZJ)。该系统使用AMD EPYC处理器和NVIDIA A100进行加速,Mellanox HDR InfiniBand作为类似Selene系统的网络。该系统是欧洲最强大的系统,具有44.1 Pflop/s。
  • 排名第九的HPC5是由戴尔公司制造,意大利埃尼公司安装的PowerEdge系统,它使用NVIDIA Tesla V100作为加速器,Mellanox HDR InfiniBand作为网络,实现了35.5 Pflop/s的性能。
  • 在美国微软公司安装的微软Azure系统Voyager-EUS2是唯一进入TOP10的新系统。它达到了30.05 Pflop/s,排名第10。该架构基于AMD EPYC 48核2.45GHz处理器与NVIDIA A100 80 gb内存GPU协同工作,并使用Mellanox HDR Infiniband进行数据传输。

其他TOP500亮点
虽然前10名没有太多变化,但我们确实看到了前15名的一些变化。微软的新Voyager-EUS系统紧随其后,排名第11位,而三星的SSC-21系统排名第12位。同样是新系统的北极星(Polaris)排名第13,而新的CEA-HF排名第15。

和上一个列表一样,AMD处理器也取得了很大的成功。搭载至强白金8280处理器的Frontera被搭载AMD EPYC处理器的Voyager-EUS2取代。更重要的是,上面描述的所有新Top15机器都有AMD处理器

不出所料,来自中国和美国的系统占据了榜单。虽然中国从186台下降到173台,但美国从123台增加到150台。这两个国家总共占据了TOP500超级计算机的近三分之二。

新版榜单在系统互联方面没有显示出太多变化。以太网仍然在240台机器中占主导地位,而Infiniband占180台。Ominpath互连在列表上有40个点,有34个自定义互连,只有6个系统具有专有网络。

Green500的结果
Green500排名第一的系统是日本Preferred Networks的MN-3。依靠MN-Core芯片和为矩阵运算优化的加速器,这台机器能够达到令人难以置信的39.38 gigaflops/watt的功率效率。这台机器在最后一个列表中提供了29.7千兆次/瓦特的性能,清楚地展示了一些令人印象深刻的改进。它在TOP500榜单上的排名也有所提升,从第337位上升到第302位。

在韩国三星电子安装的HPE Apollo 6500系统的新SSC-21可扩展模块达到了令人印象深刻的33.98 gigaflops/watt。他们通过提交HPL基准测试的功率优化运行来做到这一点。在TOP500中排名第292位。

NVIDIA安装了一个名为Tethys的新型液冷DGX A100原型系统。通过优化的HPL运行,Tethys达到了31.5 gigaflops/watt,在Green500中排名第三。在TOP500中排名296位。

Wilkes-3系统的成绩有所提高,但在Green500中仍然排在第四位。位于英国剑桥大学的Wilkes-3的电力效率为30.8 gigaflops/watt。然而,它在TOP500榜单上的排名从第100位跌至第281位。

美国佛罗里达大学的HiPerGator人工智能系统从第2名挤到了第5名。这台机器稳定地保持在29.52亿次每秒/瓦特。这个NVIDIA系统有138,880个核,并依赖于AMD EPYC 7742处理器。尽管表现令人印象深刻,但HiPerGator AI在TOP500上的排名从第22位升至第31位

HPCG结果
TOP500榜单包含了高性能共轭梯度(HPCG)基准测试结果,该结果为评估超级计算机性能提供了另一种指标,旨在补充HPL测量。

这里的HPCG结果与上一个列表非常相似。Fugaku以每秒16.0次HPCG-petaflops的成绩明显胜出,而Summit以每秒2.93次HPCG-petaflops的成绩蝉联第二。位于美国劳伦斯伯克利国家实验室的Perlmutter以每秒1.91 HPCG-petaflops的成绩排名第三。

HPL-AI结果
HPL-AI基准测试旨在突出基于机器学习和深度学习的HPC和人工智能(AI)工作负载的融合,通过使用利用现代硬件的新型混合精度算法求解线性方程系统。

Fugaku在这方面处于领先地位,实现了2 Exaflops的HPL-AI基准。凭借年复一年如此出色的指标,再加上被许多人认为是第一台“百亿亿次级”超级计算机,Fugaku显然是一个令人兴奋的系统。

最新头条

LG C1(2021年)OLED电视将打折32%

视听
2022年4月4日 0
这就是我所说的便宜货!在亚马逊网站(https://amzn.to/3K2uwnL)享受32折优惠。65英寸OLED大屏幕,4K分辨率,120Hz刷新率,...
温斯顿在信息技术行业有超过20年的经验。他推出Funky Kitnba季后赛欧宝直播的目的是吸引更多的全球用户。他在PC硬件方面的知识非常出色,不仅发表了令人愉快的评论,而且还写了很棒的文章。乌克兰捷克预测