【新智元导读】全球最新的超级计算机排名出炉,在TOP10榜单上变化不大,日本富岳凭借着领先第二名3倍的算力继续霸榜,不过从技术趋势来看,却有了新的变化。
在德国法兰克福举行的国际超级计算大会上,2021第57版世界TOP500超级计算机排名正式公布,这一版Top10排名相比上一版只有很小的变化,唯一的一个新入围的超级计算机是来自美国新能源部劳伦斯伯克利国家实验室的Perlmutter系统。
全球超级计算机500强是指国际TOP500组织发布的,全球已安装的超级计算机系统排名,始于1993年,由美国与德国超算专家联合编制,以超级计算机基准程序Linpack测试值为序进行排名,每年发布两次,其目的是促进国际超级计算机领域的交流和合作,促进超级计算机的推广应用。
这台超算基于HPECray“Shasta”平台和由GPU加速和CPU节点的异构系统。Perlmutter实现了64.6Pflop/s的算力,使这台超级计算机在新列表中排名第5。
来自日本的“富岳”超级计算机仍然高居榜首,并且遥遥领先。
富岳由日本理化研究所和富士通联合研发,在HPL标准下算力为442Pflop/s,这样的性能表现超过了排名第二的美国顶点超级计算机的3倍。
这套系统基于富士通定制的ARMA64FX处理器,另外,在人工智能领域经常使用的降精度计算中,这台计算机的峰值性能超过了每秒钟1exaflop,也就是每秒百万亿亿次浮点运算。
富岳是世界上第一台算力达到exaflop级别的超级计算机。
尽管前十名榜单变化不大,但是从整体排名来看,还是能发现一些重要的趋势。
首先就是采用AMD处理器的超级计算机显著增加,比如刚入选TOP10榜单的Perlmutter就是在用的AMDEPYC7763处理器,排在第6的Selene也采用了AMDEPYC7742。
另外一个现象是在TOP500榜单中,尽管其中中国超级计算机的绝对数量还是遥遥领先,但是由上一次的212变为现在186台,相应的,美国则由上一次的113台增至如今的123台。尚不清楚是否是由于芯片供应问题导致的负面效应。
在综合性能指标上,来自美国的超级计算机仍然处于领先,目前总算力达到了856.8Pflop/s,而中国则为445.3Pflop/s。
从制造商维度来看,中国联想目前是世界最大的超级计算机制造商,在TOP500中占据了35.8%的份额,而浪潮则紧随其后。
而在性能表现上,富士通由于打造了富岳这台怪物,所以在总算力上超过了联想排在第一。
全球TOP10超级计算机排名
排名
系统
核心数
测试性能
TFlop/s
峰值性能
1日本
富岳
7,630,848
442,010.0
537,212.0
2美国
顶点
2,414,592
148,600.0
200,794.9
3美国
山脊
1,572,480
94,640.0
125,712.0
4中国
神威·太湖之光
10,649,600
93,014.6
125,435.9
5美国
Perlmutter
706,304
64,590.0
89,794.5
6美国
月之女神Selene
555,520
63,460.0
79,215.0
7中国
天河二号
4,981,760
61,444.5
100,678.7
8德国
JUWELSBoosterModule
449,280
44,120.0
70,980.0
9意大利
HPC5
669,760
35,450.0
51,720.8
10美国
Frontera
448,448
23,516.4
38,745.9
「富岳」超算系统拥有158,976个节点,4.85PB总内存,163PB/s内存带宽,15.9PBNVMeL1存储。
算力
CPU默频:2GHz
CPU超频:2.2GHz
64位双精度FP
488PFLOP/s
537PFLOP/s
32位单精度FP
977PFLOP/s
1.07EFLOP/s
16位半精度FP
(AI训练)
1.95EFLOP/s
2.15EFLOP/s
8位整数(AI推理)
3.90Exaops
4.30Exaops
与那些使用X86+显卡的超算不同,「富岳」使用的是基于ARM架构的A64FX处理器。
A64FX拥有48个计算内核,以及提供给操作系统使用的2或4个辅助内核。
其采用全新的内核设计,ARMV8架构、64位生态系统、Tofu-D互联网络和PCIeGen3×16。
同时还封装有HBM2内存,理论峰值内存带宽可达163PB/s。
Tofu-D是什么?
Tofu是指「torusfusion」——「环形融合」,代表设计的尺寸组合与独立配置和路由算法。D是指高「密度」节点和「动态」数据包切片的「双轨」传输。
这个难道真的不是日语的「豆腐」的谐音梗么。
虽然处理器没有GPU加速器,但它具有SVE512位×2向量扩展,可以在整数1、2、4和8字节以及浮点16、32和64位级别上运行。
中国的超算
高性能计算主用在理论、实验难以解决的科学问题;大型、复杂、甚至不可重复和危险的工程设计和实验等。
早在2015年美国就开始对中国施行超算芯片禁售,从产业链条和技术层面进行遏制。
不过,我国目前正在进行超算生态系统的国产化。
「天河一号」和「天河二号」已经开始试用自主研制的飞腾CPU,而「神威·太湖之光」更是搭载了40960个我国自主研发的「申威26010」众核处理器。
然而,目前更多的超算仍使用英特尔芯片。
好消息是,神威E级原型机的处理器、网络芯片组、存储和管理系统等核心器件全部实现国产化。
「天河三号」E级原型机则采用自主的飞腾处理器、天河高速互联通信和麒麟操作系统,实现了芯片的全国产化,告别了前代的英特尔芯片。