TOP500官方公布了第56期榜單,日本的Fugaku超算鞏固了在榜單中第一的地位,也反映出榜單上性能增長曲線趨于平緩。雖然有兩個新系統(tǒng)成功進入前十名,但整個榜單錄得的新入榜數(shù)量是自1993年該項目開始以來最少的。
在高性能Linpack(HPL)基準里,榜單的入圍門檻上升至1.32 PetaFLOPS,與2020年6月排名中記錄的1.23 PetaFLOPS相比有小幅增長。
Top500的總性能也從6月的2.22 ExaFLOPS增長到最新榜單上的2.43 ExaFLOPS。但每個系統(tǒng)的平均性能幾乎沒有任何增長,從6個月前的145,363個核心增長到當前榜單中的145,465個核心。
不過前十名中也有一些顯著的進展,包括兩個新系統(tǒng),以及排名第一的Fugaku超級計算機創(chuàng)下的新高。
得益于這段時間內添加的新硬件,F(xiàn)ugaku將其HPL性能增長到442 PetaFLOPS,與該系統(tǒng)在2020年6月首次亮相時的416 PetaFLOPS相比,有小幅增長。
更重要的是,F(xiàn)ugaku將其混合精度HPC-AI基準上的性能提高到2.0 ExaFLOPS,優(yōu)于其六個月前1.4 ExaFLOPS的記錄。這代表著在任何類型的硬件上,對任何精度的基準測量值首次超過1 ExaFLOPS。
Top500前十名:
1、Fugaku,由富士通建造,安裝在日本神戶的RIKEN計算科學中心(R-CCS)。擁有442 PetaFLOPS的新世界紀錄。這使其領先榜單中排名第二的系統(tǒng)三倍。
2、Summit,是IBM在田納西州橡樹嶺國家實驗室(ORNL)建造的系統(tǒng),以148.8 PetaFLOPS的性能保持著美國最快的系統(tǒng)。擁有4356個節(jié)點,每個節(jié)點都容納了兩個22核Power9 CPU和6個NVIDIA Tesla V100 GPU。
3、位于加利福尼亞州勞倫斯-利弗莫爾國家實驗室的系統(tǒng)Sierra,以94.6 PetaFLOPS的HPL排名第三。其架構與Summit非常相似,其4320個節(jié)點中的每個節(jié)點都配備了兩顆Power9 CPU和四顆NVIDIA Tesla V100 GPU。
4、由中國國家并行計算機工程與技術研究中心(NRCPC)開發(fā)并安裝在無錫國家超級計算中心的神威太湖之光位列第四,它完全采用了Sunway SW26010處理器,在HPL上實現(xiàn)了93 PetaFLOPS。
5、Selene,它是NVIDIA公司內部安裝的NVIDIA DGX A100 SuperPOD。在6月份的時候是第七名,但現(xiàn)在規(guī)模已經翻了一番,使得它的排名上升了兩位。該系統(tǒng)基于AMD EPYC處理器,采用英偉達新的A100 GPU進行加速。由于升級,Selene在HPL上實現(xiàn)了63.4 PetaFLOPS。
6、天河-2A(Milky Way-2A),由中國國防科技大學開發(fā)的系統(tǒng),部署在廣州的國家超級計算機中心,排名第六。它采用英特爾Xeon CPU和NUDT的Matrix-2000 DSP加速器,在HPL上達到61.4 PetaFLOPS。
7、新上榜的JUWELS Booster Module,位列榜單第七。阿托斯制造的BullSequana機器最近安裝在德國Forschungszentrum Jülich(FZJ)。它是模塊化系統(tǒng)架構的一部分,第二款基于Xeon的JUWELS模塊單獨列在TOP500的第44位。這些模塊通過使用ParTec Modulo集群軟件套件進行集成。增壓模塊使用AMD EPYC處理器與NVIDIA A100 GPU進行加速,與排名第5的Selene系統(tǒng)類似。JUWELS Booster Module單獨運行時能夠達到44.1 HPL PetaFLOPS,這使其成為歐洲最強大的系統(tǒng)。
8、意大利Eni S.p.A.公司安裝的戴爾PowerEdge系統(tǒng)HPC5排名第八,使用了英特爾Xeon Gold CPU和NVIDIA Tesla V100 GPU,性能達到35.5 PetaFLOPS。在榜單上用于商業(yè)用途的系統(tǒng)里,以這臺性能最為強大。
9、安裝在德克薩斯大學德克薩斯高級計算中心的戴爾C6420系統(tǒng)Frontera現(xiàn)在列在第九位,它使用其448,448個英特爾Platinum Xeon核心,實現(xiàn)了23.5 PetaFLOPS。
10、排名第十的Dammam-7安裝在沙特阿拉伯的沙特阿美公司,是目前前十名中的第二臺商用超級計算機,也是前十里第二臺新上榜的機器。HPE Cray CS-Storm系統(tǒng)采用英特爾Xeon Gold CPU和NVIDIA Tesla V100 GPU。它在HPL基準上達到了22.4 PetaFLOPS。
Green500的情況:
1、最節(jié)能的系統(tǒng)是美國NVIDIA新推出的DGX SuperPOD。它在2.4 HPL性能運行期間取得了26.2 GigaFLOPS/Watt的能效,功耗為38MW(忽略擴展所需的額外硬件),位列TOP500的第172位。
2、雖然上屆Green500冠軍MN-3的得分從21.1提高到了26.0 GigaFLOPS/Watt,但卻滑落到了第二名的位置。該系統(tǒng)采用MN-Core芯片,這是一款針對矩陣運算進行優(yōu)化的加速器。它在TOP500中排名第332位。
3、安裝在德國Forschungszentrum Jülich(FZJ),它實現(xiàn)了25.0 GigaFLOPS/Watt,在TOP500中排名第七。
4、阿托斯制造的另一臺機器Spartan-2。它在HPL上實現(xiàn)了24.3 GigaFLOPS/Watt,在TOP500榜單中排名第148位。
5、Selene,效率為24.0 GigaFLOPS/Watt。它也占據(jù)了TOP500榜單的第五位。
6、除MN-3系統(tǒng)外,其余排名前五的Green500系統(tǒng)均采用了全新的NVIDIA A100 GPU作為加速器,同時這四款系統(tǒng)均采用AMD EPYC作為主CPU。
7、在Green500排名前40的系統(tǒng)中,有37個系統(tǒng)利用了加速卡,2個系統(tǒng)使用了A64FX矢量處理器,1個系統(tǒng)(神威太湖之光)是申威多核處理器。
TOP500其他一些數(shù)據(jù):
1、共有149個系統(tǒng)使用加速卡/協(xié)從處理器技術,比6個月前的146個有所增加,其中140個采用了NVIDIA芯片。
2、Intel繼續(xù)在TOP500的處理器份額中占據(jù)主導地位,超過90%的系統(tǒng)配備了Xeon或Xeon Phi芯片。盡管最近高性能計算領域的替代處理器架構興起,但AMD處理器(包括中國海光的芯片)在目前的榜單中僅占21個系統(tǒng),還有10個基于Power架構的系統(tǒng)和5個基于ARM架構的系統(tǒng)。不過,采用基于AMD處理器的系統(tǒng)數(shù)量比半年前增加了一倍。
3、系統(tǒng)互連的分類基本沒有變化,大約一半的系統(tǒng)(254個)使用以太網,大約三分之一的系統(tǒng)(182個)使用InfiniBand,大約十分之一的系統(tǒng)(47個)使用OmniPath,一個系統(tǒng)使用Myrinet;其余的系統(tǒng)使用定制互連(38個)和專有網絡(6個)。在總容量方面,InfiniBand連接的系統(tǒng)仍然占主導地位,其性能超過1個ExaFLOPS。由于Fugaku使用專有的Tofo D互連,6個專有網絡系統(tǒng)的總性能(472.9 PetaFLOPS)幾乎與254個基于以太網的系統(tǒng)(477.7 PetaFLOPS)相當。
4、中國以212臺機器上榜,繼續(xù)在系統(tǒng)占有率上領先,輕松擊敗美國的113臺,和日本的34臺。盡管系統(tǒng)數(shù)量較少,美國仍以668.7 PetaFLOPS的總性能領先于中國的564.0 PetaFLOPS。得益于排名第一的Fugaku系統(tǒng),日本593.7 PetaFLOPS的總性能超過了中國。
責任編輯:pj
-
處理器
+關注
關注
68文章
19265瀏覽量
229673 -
芯片
+關注
關注
455文章
50732瀏覽量
423263 -
intel
+關注
關注
19文章
3482瀏覽量
185939
發(fā)布評論請先 登錄
相關推薦
評論