博客專欄

EEPW首頁 > 博客 > 全球Top500超算公布:Frontier蟬聯(lián)第一,中國超算不再參加測(cè)試!

全球Top500超算公布:Frontier蟬聯(lián)第一,中國超算不再參加測(cè)試!

發(fā)布人:芯智訊 時(shí)間:2024-06-06 來源:工程師 發(fā)布文章

image.png

近日,全球Top500組織在德國漢堡舉行的國際超算大會(huì)(ISC 2024)上,正式發(fā)布了第63屆全球超級(jí)計(jì)算機(jī)Top500榜單。其中,美國橡樹嶺國家實(shí)驗(yàn)室和AMD合作的Frontier以 1.206 EFlop/s的峰值性能排名第一,美國阿貢國家實(shí)驗(yàn)室和英特爾合作的Aurora則首次突破E級(jí)大關(guān),以1.012 EFlop/s的峰值性能排名第二。中國的超算依舊是無緣前十,并且不再參與該HPL基準(zhǔn)測(cè)試。

Frontier蟬聯(lián)第一,Aurora排名第二

在Top500超算榜單中,前十大性能最強(qiáng)超級(jí)計(jì)算機(jī)的排名基本上與六個(gè)月前在SC23會(huì)議期間公布的排名保持一致。唯一的新進(jìn)前10的超級(jí)計(jì)算機(jī)是來自瑞士國家超級(jí)計(jì)算中心(CSCS)的Alps machine,排名第6名位。

具體前十名單如下:

1、Frontier以 1.206 EFlop/s的HPL性能繼續(xù)蟬聯(lián)第一。該超算位于美國田納西州的橡樹嶺國家實(shí)驗(yàn)室(ORNL),由美國能源部(DOE)運(yùn)營。其采用了HPE Cray EX235a架構(gòu),2GHz AMD EPYC 64C CPU和AMD Instinct 250X GPU,共有8699904個(gè)CPU和GPU核心,并借助于Slingshot 11網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)傳輸。此外,F(xiàn)rontier還具有高達(dá)52.59 GFlops/W的額定能效,

2、Aurora以1.012 Exaflop/s的HPL性能排名第二。相比去年首次上榜時(shí)(當(dāng)時(shí)未全部安裝完成)性能幾乎翻了一倍。該超算安裝在美國伊利諾伊州的阿貢國家實(shí)驗(yàn)室,也是由美國能源部運(yùn)營。Aurora 基于HPE Cray EX網(wǎng)絡(luò),整合了21248個(gè)Intel Xeon Max系列CPU、63744個(gè)Intel Max系列GPU、20.42PB內(nèi)存,峰值性能號(hào)稱可達(dá) 2 EFlop / s,遠(yuǎn)超 Frontier。

3、Eagle以561.2PFlop/s的HPL性能排名第三。該超算安裝在微軟Azure云平臺(tái)上,并且它依然是Top500超算中最高排名的云計(jì)算系統(tǒng)。這款微軟NDv5系統(tǒng)的強(qiáng)大性能,源于英特爾Xeon Platinum 8480C處理器和英偉達(dá)(NVIDIA) H100 GPU加速器的結(jié)合。

4、Fugaku憑借其442 PFlop/s的HPL性能排名第四。該超算安裝在日本神戶的理研計(jì)算科學(xué)研究中心(R-CCS),基于 2.2GHz Fujitsu A64FX 48C處理器,Tofu interconnect D互聯(lián),共計(jì)擁有7630848個(gè)核心,繼續(xù)保持了美國以外地區(qū)排名最高的超級(jí)計(jì)算機(jī)的地位。

5、LUMI以379.7 PFlop/s的HPL性能排名第五。該超算安裝在芬蘭CSC EuroHPC中心,是歐洲最強(qiáng)的超級(jí)計(jì)算機(jī),其基于HPE Cray EX235a系統(tǒng),AMD第三代EPYC 64C 2GHz處理器,AMD Instinct MI250X加速器,Slingshot-11網(wǎng)絡(luò)、

6、Alps 以270 PFlop/s的HPL性能排名第六。該超算安裝于瑞士國家超級(jí)計(jì)算中心 (CSCS),基于HPE Cray 254n系統(tǒng)構(gòu)建的超算,3.1GHz NVIDIA Grace 72C處理器,NVIDIA GH200超級(jí)芯片,Slingshot-11網(wǎng)絡(luò)互聯(lián)。

7、Leonardo以241.2PFlop/s的HPL性能排名第七。該超算安裝在意大利CINECA的EuroHPC,基于Atos BullSequana XH2000系統(tǒng),由英特爾Xeon Platinum CPU和NVIDIA A100加速器提供強(qiáng)大的計(jì)算能力,還采用了四軌NVIDIA HDR100 Infiniband。

8、MareNostrum 5 ACC以175.3PFlop/s的HPL性能排名第八。該超算安裝在西班牙的EuroHPC/巴塞羅那超級(jí)計(jì)算中心,基于BullSequana XH3000系統(tǒng),采用了英特爾Xeon Platinum 8460Y處理器、NVIDIA H100加速器以及Infiniband NDR200網(wǎng)絡(luò)連接技術(shù)。

9、Summit以148.6PFlop/s的HPL性能排名第九。該超算是IBM公司在美國橡樹嶺國家實(shí)驗(yàn)室建造的超級(jí)計(jì)算機(jī),擁有4356個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)配備了兩個(gè)22核的3.07GHz IBM POWER9 CPU和六個(gè)NVIDIA Tesla V100 GPU,每個(gè)GPU上集成了80個(gè)流式處理器(SM)。

10、Eos以121.4PFlop/s的HPL性能排名第十。該超算是英偉達(dá)內(nèi)部使用的 DGX SuperPOD,由Xeon Platinum 8480C 56C 3.8GHz,NVIDIA H100加速器共同驅(qū)動(dòng),還采用了英偉達(dá)Infiniband NDR 400G交換機(jī)。

image.png

image.png

對(duì)于排名第二的Aurora超算實(shí)際測(cè)試性能僅1.012 ExaFlop/s,遠(yuǎn)低于號(hào)稱性能最高可達(dá)2 EFlop/s的問題,阿貢國家實(shí)驗(yàn)室的副主任兼杰出研究員Rick Stevens表示,2 exaFLOPS這一數(shù)值是基于Aurora核心處理器數(shù)量與處理器峰值性能相乘得出的理論峰值,但這并非負(fù)責(zé)維護(hù)和運(yùn)營Aurora的阿貢系統(tǒng)經(jīng)理所設(shè)定的實(shí)際性能目標(biāo)或期望。

Stevens解釋說:“峰值性能是一個(gè)通過計(jì)算得出的理論數(shù)字,它基于時(shí)鐘速率與單個(gè)計(jì)算元件運(yùn)算次數(shù)的乘積。實(shí)際上,典型的系統(tǒng)只能達(dá)到這個(gè)峰值的一小部分,這取決于它們所執(zhí)行的任務(wù),通常在50%、60%或70%之間。Aurora上標(biāo)稱的2 exaFlop/s峰值實(shí)際上是結(jié)合了GPU和CPU的FLOPS得出的。在基準(zhǔn)測(cè)試中,通常不會(huì)這樣做。如果查看Top500榜單中其他類似的系統(tǒng),就會(huì)發(fā)現(xiàn)它們同樣擁有非常大的理論峰值,但實(shí)際達(dá)到的峰值比例與Aurora類似。因此,這并不是一個(gè)根本性的問題?!?/p>

Stevens表示,Aurora在基準(zhǔn)測(cè)試中應(yīng)該能夠?qū)崿F(xiàn)LINPACK性能的提升,因?yàn)樵谧罱幕鶞?zhǔn)測(cè)試執(zhí)行時(shí),Aurora的11%計(jì)算能力尚未被激活。他預(yù)測(cè),當(dāng)整個(gè)系統(tǒng)安裝完成之后,將會(huì)產(chǎn)生更高的基準(zhǔn)測(cè)試數(shù)據(jù)。然而,他拒絕透露阿貢國家實(shí)驗(yàn)室對(duì)于Aurora在完全運(yùn)行狀態(tài)下的具體性能目標(biāo)數(shù)字。

根據(jù)HPC-AI行業(yè)分析機(jī)構(gòu)Hyperion Research公司的首席執(zhí)行官Earl Joseph的預(yù)計(jì),隨著時(shí)間的推移和系統(tǒng)的進(jìn)一步調(diào)優(yōu),Aurora最終將會(huì)超過1.5 exaFlop/s。

中國不再參加Top500的HPL基準(zhǔn)測(cè)試

在中國的國家級(jí)超算去年跌出Top500榜單前十之后,依然無緣于最新的前十榜單。在去年的榜單上,中國的神威·太湖之光和天河二號(hào)A也進(jìn)入了前十五,分別排名第11和第14位。

Top500組織在最新發(fā)布的報(bào)告中指出,中國已決定不再參加Top500的HPL基準(zhǔn)測(cè)試。

在最新的Top500名單中,美國依然是擁有超級(jí)計(jì)算機(jī)數(shù)量最多的國家。美國在其之前的基礎(chǔ)上新增了7臺(tái)超級(jí)計(jì)算機(jī),使得其總數(shù)達(dá)到了168臺(tái)。而中國則從104臺(tái)減少到了80臺(tái)。

Top500組織表示,“事實(shí)上,中國在這份新名單上并未報(bào)告任何新加入的超級(jí)計(jì)算機(jī)?!?/p>

從大的區(qū)域變化來看,北美地區(qū)依然保持領(lǐng)先地位,從上一份榜單的160臺(tái)系統(tǒng)增加到171臺(tái)。而亞洲地區(qū)則出現(xiàn)了下滑,從169臺(tái)系統(tǒng)減少到148臺(tái)。與此同時(shí),歐洲地區(qū)實(shí)現(xiàn)了顯著的增長,從143臺(tái)增加到160臺(tái),位列北美地區(qū)之后,成為了全球第二大超級(jí)計(jì)算機(jī)分布區(qū)域。

英特爾拿下63%的處理器份額

Top500組織表示,此次前500強(qiáng)的超算當(dāng)中,采用英特爾CPU的占比依然是高達(dá)63.00%,雖然低于六個(gè)月前的67.80%。相比之下,前500強(qiáng)超算當(dāng)中,有156個(gè)系統(tǒng)(31.20%)使用的AMD處理器,高于六個(gè)月前的28.00%。

另外,還有194個(gè)超算系統(tǒng)使用了加速器/協(xié)處理器技術(shù),高于六個(gè)月前的185個(gè)。其中有83個(gè)使用了NVIDIA Ampere GPU,48個(gè)使用NVIDIA Volta GPU。

從總算力來看,所有Top500超算的的總綜合性能從6個(gè)月前的7.01 ExaFlop/s(EFlop/s)提高到現(xiàn)在的8.21 ExaFlop/s。Top100的性能門檻達(dá)到了9.44 PFlop/s。

從核心數(shù)量來看,TOP500超算的平均并發(fā)級(jí)別達(dá)到了每個(gè)系統(tǒng)229426個(gè)內(nèi)核,高于六個(gè)月前的212027個(gè)。

Green 500超算

今年的超級(jí)計(jì)算機(jī)Green500榜單也有了顯著的變化,前三名的綠色超級(jí)計(jì)算機(jī)均為新上榜者。

排名第一的是JEDI–JUPITER Exascale Development Instrument,這臺(tái)超級(jí)計(jì)算機(jī)由德國的EuroHPC/FZJ開發(fā)。在TOP500超級(jí)計(jì)算機(jī)排名中,JEDI位列第190位,展現(xiàn)出了不俗的性能實(shí)力。其能效評(píng)級(jí)高達(dá)72.73GFlop/W,HPL得分為4.5 PFlop/s。JEDI是一款配備NVIDIA Grace Hopper Superchip 72C的BullSequana XH3000架構(gòu)的超級(jí)計(jì)算,總共有19584個(gè)核心處理器。

英國布里斯托爾大學(xué)的Isambard-AI以68.83 GFlop/W能效評(píng)級(jí)和7.42 PFLop/s的HPL得分位居第二。Isambard-AI在TOP500中排名第129位,擁有34,272個(gè)核心處理器。

排名第三的是來自波蘭Cyfronet的Helios system。該機(jī)器的能效得分為66.95GFlop/W HPL得分為19.14 PFlop/s。

Top500組織在討論能源效率時(shí),還特別提到了Top500榜單第一的Frontier系統(tǒng)。Frontier系統(tǒng)取得了1.206EFlop/s的HPL成績,這一成績證明了其優(yōu)秀的計(jì)算能力。同時(shí),F(xiàn)rontier在能源效率方面也表現(xiàn)出色,獲得了56.97GFlop/W的分?jǐn)?shù)。這使得Frontier在Green500榜單中排名第11位。

編輯:芯智訊-浪客劍


*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



關(guān)鍵詞: 超算

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉