其關(guān)鍵在于選擇,、開放性和規(guī)模
Jeff McVeigh,,英特爾副總裁兼超級(jí)計(jì)算事業(yè)部總經(jīng)理
高性能計(jì)算(HPC)代表了當(dāng)今技術(shù)的頂峰,,現(xiàn)代一些最重要的發(fā)現(xiàn)都借助了這些先進(jìn)的機(jī)器?,F(xiàn)在,,我們正站在新一代高性能計(jì)算的入口處,,其技術(shù)的可擴(kuò)展性和普遍性能夠?yàn)槲覀兊纳顜矸旄驳氐淖兓?/p>
這一點(diǎn)在抗擊新冠肺炎疫情中表現(xiàn)得最為明顯,。疫情爆發(fā)之初,,科研機(jī)構(gòu)就在研究實(shí)驗(yàn)室以及“高性能計(jì)算即服務(wù)”的云環(huán)境中利用這些先進(jìn)的超級(jí)計(jì)算機(jī),來監(jiān)測(cè),、研究,、治療新冠病毒,并運(yùn)用此項(xiàng)技術(shù)開發(fā)了用于治療新冠肺炎的藥物,。人們正以驚人的速度逐步實(shí)現(xiàn)這些目標(biāo),,這離不開高性能計(jì)算技術(shù)的廣泛應(yīng)用。
其實(shí)在迎來E級(jí)運(yùn)算時(shí)代之際,,我們才剛剛起步?,F(xiàn)階段,超級(jí)計(jì)算已經(jīng)推動(dòng)了科學(xué)探索的發(fā)展,,并能夠幫助解決氣候變化和慢性病治療等關(guān)鍵問題,。未來,它將有助于解決我們尚未遇到,、甚至無法想象的問題和危機(jī),。
英特爾的目標(biāo)是普及高性能計(jì)算并實(shí)現(xiàn)高性能計(jì)算普及化。為此,,我們必須擁抱各種技術(shù),,以實(shí)現(xiàn)數(shù)量級(jí)的性能提升、轉(zhuǎn)變高性能計(jì)算的可訪問性并重新思考我們?nèi)绾螛?gòu)建為這些系統(tǒng)提供動(dòng)力的組件,?;诖耍覀円孕阅?、開放性和規(guī)模作為策略基礎(chǔ),。
性能:從無所不在的計(jì)算架構(gòu)開始
x86架構(gòu)是當(dāng)今高性能計(jì)算的發(fā)動(dòng)機(jī),,為絕大多數(shù)系統(tǒng)提供動(dòng)力。龐大的安裝量使開發(fā)人員和客戶能夠訪問世界上最大的生態(tài)系統(tǒng)以支持和部署高性能計(jì)算工作負(fù)載,。x86 架構(gòu)還提供了始終如一的代際性能提升,。
現(xiàn)有的這一代英特爾?至強(qiáng),?可擴(kuò)展處理器已被我們的高性能計(jì)算生態(tài)系統(tǒng)合作伙伴廣泛采用,,而下一代英特爾至強(qiáng)可擴(kuò)展處理器Sapphire Rapids也增加了新功能,目前也作為樣品正提供給客戶進(jìn)行測(cè)試,。Sapphire Rapids為高性能計(jì)算生態(tài)系統(tǒng)提供多種功能,,首次封裝了能夠充分利用Sapphire Rapids多單元架構(gòu)的高帶寬內(nèi)存HBM2e。Sapphire Rapids還帶來了增強(qiáng)的性能,、新的加速器,、PCIe 5.0和其他針對(duì)人工智能、數(shù)據(jù)分析和高性能計(jì)算負(fù)載而優(yōu)化的新功能,。
高性能計(jì)算負(fù)載發(fā)展迅猛,。它們變得更加多樣化、專有化,,也同時(shí)需要混合的異構(gòu)架構(gòu),。盡管x86架構(gòu)仍然是標(biāo)量負(fù)載的動(dòng)力來源,但如果要想實(shí)現(xiàn)數(shù)量級(jí)的性能提升并進(jìn)一步超越E級(jí)運(yùn)算時(shí)代,,就必須以批判性的思維來審視高性能計(jì)算負(fù)載在矢量,、矩陣和空間架構(gòu)中的運(yùn)行方式,并且必須確保這些架構(gòu)能夠無縫地協(xié)同配合,。
英特爾已經(jīng)采用了“整體工作負(fù)載”策略,,即針對(duì)特定負(fù)載的加速器和圖形處理器(GPU),無論是硬件還是軟件,,都可以與中央處理器(CPU)無縫配合,。我們正在通過下一代英特爾至強(qiáng)可擴(kuò)展處理器和Xe HPC GPU(代號(hào)“Ponte Vecchio”)來實(shí)施該戰(zhàn)略,它們將用于阿貢國家實(shí)驗(yàn)室的2百億億次級(jí)*極光(Aurora)超級(jí)計(jì)算機(jī),。Ponte Vecchio具備最高的單插槽和單節(jié)點(diǎn)計(jì)算密度,,利用我們先進(jìn)的封裝技術(shù)即嵌入式多芯片互連橋接(EMIB)和Foveros封裝了47個(gè)單元。Ponte Vecchio上運(yùn)行著100多個(gè)高性能計(jì)算應(yīng)用,。我們還與包括ATOS,、戴爾、惠普,、聯(lián)想,、浪潮、Quanta以及超微在內(nèi)的合作伙伴和客戶合作,在他們最新的超級(jí)計(jì)算機(jī)上安裝部署Ponte Vecchio處理器,。
通過開放性實(shí)現(xiàn)高性能計(jì)算的普及
要想真正普及高性能計(jì)算并實(shí)現(xiàn)高性能計(jì)算普及化,,就需要一種開放的協(xié)作方式。英特爾致力于提供基于行業(yè)標(biāo)準(zhǔn)的開放平臺(tái),,以此促進(jìn)廣泛的協(xié)作,。我們的目標(biāo)是推動(dòng)標(biāo)準(zhǔn)制定并創(chuàng)建關(guān)鍵硬件平臺(tái),讓整個(gè)行業(yè)團(tuán)結(jié)在一起,,在此基礎(chǔ)上進(jìn)行開發(fā),。
眾所周知,GPU編程由于缺乏適用標(biāo)準(zhǔn)而發(fā)展受阻,。因此自從GPU進(jìn)入高性能計(jì)算領(lǐng)域以來,,行業(yè)就面臨著CPU和GPU各有一個(gè)獨(dú)立的軟件堆棧的挑戰(zhàn),而oneAPI編程模式則試圖打破這些孤島,。
oneAPI是一種開放,、統(tǒng)一的跨架構(gòu)編程模式,適用于CPU,、GPU和諸如FPGA等的加速器架構(gòu),,能夠允許異構(gòu)計(jì)算環(huán)境的編程,所有這些都使用一個(gè)代碼庫和軟件堆棧,。如此一來,開發(fā)人員只需跨架構(gòu)編程一次,,而且客戶也不會(huì)受制于某個(gè)單獨(dú)的供應(yīng)商,。
下個(gè)月,我們將發(fā)布英特爾,? oneAPI 2022工具包,。相比于去年12月份發(fā)布的oneAPI 2021版本,該款新的工具包增加了900多項(xiàng)新功能,。通過第一個(gè)統(tǒng)一的C++/SYCL/Fortran 編譯器和數(shù)據(jù)并行Python,,即將發(fā)布的版本增加了面向CPU和GPU的跨架構(gòu)開發(fā)功能。今天,,我們還宣布建立另外兩個(gè)oneAPI卓越中心,,加入由領(lǐng)先的科研學(xué)術(shù)機(jī)構(gòu)組成的蓬勃發(fā)展的全球生態(tài)系統(tǒng),提供開源端口并擴(kuò)展硬件支持,、新技術(shù),、服務(wù)和課程,以推動(dòng)oneAPI在生態(tài)系統(tǒng)內(nèi)部的普及,。
我們深知,,要想真正普及高性能計(jì)算,還有很多工作有待完成。現(xiàn)階段我們正在做的事將使人們能夠在未來隨時(shí)隨地利用最新的高性能計(jì)算技術(shù),。
大規(guī)模制造:英特爾的IDM 2.0戰(zhàn)略
高性能計(jì)算普及化需要規(guī)模效應(yīng),。英特爾致力于提供推動(dòng)創(chuàng)新和增長(zhǎng)所需的組件和技術(shù)。通過英特爾IDM 2.0戰(zhàn)略的差異化優(yōu)勢(shì),,我們能夠帶領(lǐng)高性能計(jì)算客戶進(jìn)入創(chuàng)新,、制造和產(chǎn)品領(lǐng)先的新時(shí)代。
我們正在快速執(zhí)行為期多年的 IDM 2.0戰(zhàn)略,,這對(duì)我們的高性能計(jì)算客戶來說,,是個(gè)大好消息,因?yàn)槲覀兡軌蚶眯袠I(yè)領(lǐng)先的制造能力以及我們?cè)诜庋b技術(shù)方面的領(lǐng)先地位來設(shè)計(jì)最好的產(chǎn)品,,并使用最好的IP,,提供下一個(gè)超級(jí)計(jì)算機(jī)時(shí)代所需的產(chǎn)品。
我們堅(jiān)定不移地致力于實(shí)現(xiàn)高性能計(jì)算普及化這一承諾,,為此我們也持續(xù)投入以推動(dòng)技術(shù)進(jìn)步來解決最棘手的問題,。
當(dāng)我們?cè)絹碓浇咏乱淮?jí)計(jì)算機(jī)的時(shí)候,我們能取得哪些成就,?我無比期待答案的揭曉,。
Jeff McVeigh是英特爾公司副總裁兼超級(jí)計(jì)算事業(yè)部總經(jīng)理
1 巔峰性能