近日,全球Top500組織在德國漢堡舉行的國際超算大會(ISC 2024)上,正式發(fā)布了第63屆全球超級計算機(jī)Top500榜單,。
其中,美國橡樹嶺國家實(shí)驗(yàn)室和AMD合作的Frontier以 1.206 EFlop/s的峰值性能排名第一,,美國阿貢國家實(shí)驗(yàn)室和Intel合作的Aurora則首次突破E級大關(guān),以1.012 EFlop/s的峰值性能排名第二,。
中國的超算依舊是無緣前十,,并且不再參與該HPL基準(zhǔn)測試。
Frontier蟬聯(lián)第一,,Aurora排名第二
在Top500超算榜單中,,前十大性能最強(qiáng)超級計算機(jī)的排名基本上與六個月前在SC23會議期間公布的排名保持一致,。
唯一的新進(jìn)前10的超級計算機(jī)是來自瑞士國家超級計算中心(CSCS)的Alps machine,,排名第6名位
具體前十名單如下:
1、Frontier以 1.206 EFlop/s的HPL性能繼續(xù)蟬聯(lián)第一,。
該超算位于美國田納西州的橡樹嶺國家實(shí)驗(yàn)室(ORNL),,由美國能源部(DOE)運(yùn)營。其采用了HPE Cray EX235a架構(gòu),,2GHz AMD EPYC 64C CPU和AMD Instinct 250X GPU,,共有8699904個CPU和GPU核心,并借助于Slingshot 11網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)傳輸,。此外,,F(xiàn)rontier還具有高達(dá)52.59 GFlops/W的額定能效,
2,、Aurora以1.012 Exaflop/s的HPL性能排名第二,。
相比去年首次上榜時(當(dāng)時未全部安裝完成)性能幾乎翻了一倍。該超算安裝在美國伊利諾伊州的阿貢國家實(shí)驗(yàn)室,,也是由美國能源部運(yùn)營,。
Aurora 基于HPE Cray EX網(wǎng)絡(luò),整合了21248個Intel Xeon Max系列CPU,、63744個Intel Max系列GPU,、20.42PB內(nèi)存,峰值性能號稱可達(dá) 2 EFlop / s,,遠(yuǎn)超 Frontier,。
3,、Eagle以561.2PFlop/s的HPL性能排名第三。
該超算安裝在微軟Azure云平臺上,,并且它依然是Top500超算中最高排名的云計算系統(tǒng),。這款微軟NDv5系統(tǒng)的強(qiáng)大性能,源于IntelXeon Platinum 8480C處理器和英偉達(dá)(NVIDIA) H100 GPU加速器的結(jié)合,。
4,、Fugaku憑借其442 PFlop/s的HPL性能排名第四。
該超算安裝在日本神戶的理研計算科學(xué)研究中心(R-CCS),,基于 2.2GHz Fujitsu A64FX 48C處理器,,Tofu interconnect D互聯(lián),共計擁有7630848個核心,,繼續(xù)保持了美國以外地區(qū)排名最高的超級計算機(jī)的地位,。
5、LUMI以379.7 PFlop/s的HPL性能排名第五,。
該超算安裝在芬蘭CSC EuroHPC中心,,是歐洲最強(qiáng)的超級計算機(jī),其基于HPE Cray EX235a系統(tǒng),,AMD第三代EPYC 64C 2GHz處理器,,AMD Instinct MI250X加速器,Slingshot-11網(wǎng)絡(luò),、
6,、Alps 以270 PFlop/s的HPL性能排名第六。
該超算安裝于瑞士國家超級計算中心 (CSCS),,基于HPE Cray 254n系統(tǒng)構(gòu)建的超算,,3.1GHz NVIDIA Grace 72C處理器,NVIDIA GH200超級芯片,,Slingshot-11網(wǎng)絡(luò)互聯(lián),。
7、Leonardo以241.2PFlop/s的HPL性能排名第七,。
該超算安裝在意大利CINECA的EuroHPC,,基于Atos BullSequana XH2000系統(tǒng),由IntelXeon Platinum CPU和NVIDIA A100加速器提供強(qiáng)大的計算能力,,還采用了四軌NVIDIA HDR100 Infiniband,。
8、MareNostrum 5 ACC以175.3PFlop/s的HPL性能排名第八,。
該超算安裝在西班牙的EuroHPC/巴塞羅那超級計算中心,,基于BullSequana XH3000系統(tǒng),采用了IntelXeon Platinum 8460Y處理器,、NVIDIA H100加速器以及Infiniband NDR200網(wǎng)絡(luò)連接技術(shù),。
9,、Summit以148.6PFlop/s的HPL性能排名第九。
該超算是IBM公司在美國橡樹嶺國家實(shí)驗(yàn)室建造的超級計算機(jī),,擁有4356個節(jié)點(diǎn),,每個節(jié)點(diǎn)配備了兩個22核的3.07GHz IBM POWER9 CPU和六個NVIDIA Tesla V100 GPU,每個GPU上集成了80個流式處理器(SM),。
10,、Eos以121.4PFlop/s的HPL性能排名第十。
該超算是英偉達(dá)內(nèi)部使用的 DGX SuperPOD,,由Xeon Platinum 8480C 56C 3.8GHz,,NVIDIA H100加速器共同驅(qū)動,還采用了英偉達(dá)Infiniband NDR 400G交換機(jī),。
對于排名第二的Aurora超算實(shí)際測試性能僅1.012 ExaFlop/s,,遠(yuǎn)低于號稱性能最高可達(dá)2 EFlop/s的問題,阿貢國家實(shí)驗(yàn)室的副主任兼杰出研究員Rick Stevens表示,,2 exaFLOPS這一數(shù)值是基于Aurora核心處理器數(shù)量與處理器峰值性能相乘得出的理論峰值,,但這并非負(fù)責(zé)維護(hù)和運(yùn)營Aurora的阿貢系統(tǒng)經(jīng)理所設(shè)定的實(shí)際性能目標(biāo)或期望。
Stevens解釋說:“峰值性能是一個通過計算得出的理論數(shù)字,,它基于時鐘速率與單個計算元件運(yùn)算次數(shù)的乘積,。實(shí)際上,典型的系統(tǒng)只能達(dá)到這個峰值的一小部分,,這取決于它們所執(zhí)行的任務(wù),,通常在50%,、60%或70%之間,。Aurora上標(biāo)稱的2 exaFlop/s峰值實(shí)際上是結(jié)合了GPU和CPU的FLOPS得出的。在基準(zhǔn)測試中,,通常不會這樣做,。如果查看Top500榜單中其他類似的系統(tǒng),就會發(fā)現(xiàn)它們同樣擁有非常大的理論峰值,,但實(shí)際達(dá)到的峰值比例與Aurora類似,。因此,這并不是一個根本性的問題,?!?/p>
Stevens表示,Aurora在基準(zhǔn)測試中應(yīng)該能夠?qū)崿F(xiàn)LINPACK性能的提升,,因?yàn)樵谧罱幕鶞?zhǔn)測試執(zhí)行時,,Aurora 11%的計算能力尚未被激活。
他預(yù)測,,當(dāng)整個系統(tǒng)安裝完成之后,,將會產(chǎn)生更高的基準(zhǔn)測試數(shù)據(jù),。然而,他拒絕透露阿貢國家實(shí)驗(yàn)室對于Aurora在完全運(yùn)行狀態(tài)下的具體性能目標(biāo)數(shù)字,。
根據(jù)HPC-AI行業(yè)分析機(jī)構(gòu)Hyperion Research公司的首席執(zhí)行官Earl Joseph的預(yù)計,,隨著時間的推移和系統(tǒng)的進(jìn)一步調(diào)優(yōu),Aurora最終將會超過1.5 exaFlop/s,。
中國不再參加Top500的HPL基準(zhǔn)測試
在中國的國家級超算去年跌出Top500榜單前十之后,,依然無緣于最新的前十榜單。
在去年的榜單上,,中國的神威·太湖之光和天河二號A也進(jìn)入了前十五,,分別排名第11和第14位。
Top500組織在最新發(fā)布的報告中指出,,中國已決定不再參加Top500的HPL基準(zhǔn)測試,。
在最新的Top500名單中,美國依然是擁有超級計算機(jī)數(shù)量最多的國家,。美國在其之前的基礎(chǔ)上新增了7臺超級計算機(jī),,使得其總數(shù)達(dá)到了168臺。而中國則從104臺減少到了80臺,。
Top500組織表示:“事實(shí)上,,中國在這份新名單上并未報告任何新加入的超級計算機(jī)?!?/p>
從大的區(qū)域變化來看,,北美地區(qū)依然保持領(lǐng)先地位,從上一份榜單的160臺系統(tǒng)增加到171臺,。而亞洲地區(qū)則出現(xiàn)了下滑,,從169臺系統(tǒng)減少到148臺。
與此同時,,歐洲地區(qū)實(shí)現(xiàn)了顯著的增長,,從143臺增加到160臺,位列北美地區(qū)之后,,成為了全球第二大超級計算機(jī)分布區(qū)域,。
Intel拿下63%的處理器份額
Top500組織表示,此次前500強(qiáng)的超算當(dāng)中,,采用Intel CPU的占比依然是高達(dá)63.00%,,但低于六個月前的67.80%。
相比之下,,前500強(qiáng)超算當(dāng)中,,有156個系統(tǒng)(31.20%)使用的AMD處理器,高于六個月前的28.00%。
另外,,還有194個超算系統(tǒng)使用了加速器/協(xié)處理器技術(shù),,高于六個月前的185個。其中有83個使用了NVIDIA Ampere GPU,,48個使用NVIDIA Volta GPU,。
從總算力來看,所有Top500超算的的總綜合性能從6個月前的7.01 ExaFlop/s(EFlop/s)提高到現(xiàn)在的8.21 ExaFlop/s,。Top100的性能門檻達(dá)到了9.44 PFlop/s,。
從核心數(shù)量來看,TOP500超算的平均并發(fā)級別達(dá)到了每個系統(tǒng)229426個內(nèi)核,,高于六個月前的212027個,。
Green 500超算
今年的超級計算機(jī)Green500榜單也有了顯著的變化,前三名的綠色超級計算機(jī)均為新上榜者,。
排名第一的是JEDI–JUPITER Exascale Development Instrument,,這臺超級計算機(jī)由德國的EuroHPC/FZJ開發(fā)。在TOP500超級計算機(jī)排名中,,JEDI位列第190位,,展現(xiàn)出了不俗的性能實(shí)力。其能效評級高達(dá)72.73GFlop/W,,HPL得分為4.5 PFlop/s,。JEDI是一款配備NVIDIA Grace Hopper Superchip 72C的BullSequana XH3000架構(gòu)的超級計算,總共有19584個核心處理器,。
英國布里斯托爾大學(xué)的Isambard-AI以68.83 GFlop/W能效評級和7.42 PFLop/s的HPL得分位居第二,。Isambard-AI在TOP500中排名第129位,擁有34,272個核心處理器,。
排名第三的是來自波蘭Cyfronet的Helios system,。該機(jī)器的能效得分為66.95GFlop/W HPL得分為19.14 PFlop/s。
Top500組織在討論能源效率時,,還特別提到了Top500榜單第一的Frontier系統(tǒng),。Frontier系統(tǒng)取得了1.206EFlop/s的HPL成績,,這一成績證明了其優(yōu)秀的計算能力,。同時,F(xiàn)rontier在能源效率方面也表現(xiàn)出色,,獲得了56.97GFlop/W的分?jǐn)?shù),。這使得Frontier在Green500榜單中排名第11位。