7月15日消息,AMD近日在美國(guó)洛杉磯舉行的技術(shù)日活動(dòng)中,,介紹了其全新的Zen 5 CPU架構(gòu),,將會(huì)帶來(lái)平均16%的每時(shí)鐘指令數(shù)(IPC)性能提升,相關(guān)處理器產(chǎn)品將于7月底上市,。
在今年6月初的Computex 2024展會(huì)上,,AMD正式發(fā)布了基于全新的Zen5架構(gòu)的Ryzen 9000系列桌面處理器(Granite Ridge)和面向筆記本電腦的Ryzen AI 300系列AI PC處理器(Strix Point)。
其中,,Ryzen 9000系列當(dāng)中的旗艦產(chǎn)品——Ryzen 9 9950X配備16核心32線(xiàn)程,,170W TDP,最高主頻5.7 GHz,。而Ryzen AI 300系列的旗艦產(chǎn)品——Ryzen AI 9 HX 370的CPU為12核心24線(xiàn)程,,包括4個(gè)Zen 5 內(nèi)核和8個(gè)Zen 5C 內(nèi)核,每個(gè)核心1MB二級(jí)緩存,,三級(jí)緩存為24MB,,最高主頻5.1GHz。GPU不但升級(jí)架構(gòu),,CU單元數(shù)量也從12個(gè)增至16個(gè),,命名為“Radeon 890M”。NPU算力則提升到了50TOPS,,增加了2倍有余,。
根據(jù)此前AMD公布的數(shù)據(jù)顯示,與英特爾Core i9-14900K相比,,AMD旗艦16核心Ryzen 9 9950X在游戲性能測(cè)試中的速度快4%到23%,。在生產(chǎn)力性能測(cè)試中,9950X顯示出更大的優(yōu)勢(shì),,比英特爾Core i9-14900K快7%至56%,。同樣Ryzen AI 300系列相比上代產(chǎn)品也帶來(lái)的很大的性能提升。
當(dāng)然,,制程工藝,、CPU核心數(shù)量、緩存容量和主頻上的提升,,都對(duì)于其CPU的性能提升帶來(lái)了不小的助力,,但是其中關(guān)鍵的性能提升則是來(lái)源于Zen 5 內(nèi)核架構(gòu)的提升。
Zen 5 內(nèi)核帶來(lái)了平均16%的IPC性能提升
據(jù)介紹,,其 Zen 5 內(nèi)核擁有 6 個(gè) ALU,,數(shù)量是上一代的 3 倍,采用了 48KB 的 12 路一級(jí)緩存,,在浮點(diǎn)運(yùn)算以及最大帶寬上均是上代的 2 倍,,并且Zen 5內(nèi)核也同樣支持完整版的 AVX-512 指令,,從而在一些專(zhuān)業(yè)應(yīng)用上有事半功倍的作用。得益于這些方面的提升,,Zen 5的IPC性能比上一代的Zen 4 內(nèi)核高出了10%-35%,,平均提升了16%。
據(jù)AMD首席技術(shù)官M(fèi)ark Papermaster介紹,,Zen 5內(nèi)核的最大改進(jìn)之一是其前端,,在其IPC整體性能提升當(dāng)中的占比為39%。
具體來(lái)說(shuō),,AMD已經(jīng)擴(kuò)大了前端,,允許每個(gè)周期進(jìn)行更多的分支預(yù)測(cè)——這是現(xiàn)代CPU內(nèi)核性能的主要貢獻(xiàn)者——并實(shí)施了雙解碼管道以及i-cache和op-cache改進(jìn),以遏制延遲并提高帶寬,。
Zen 5 這個(gè)更寬的前端與一個(gè)更大的整數(shù)執(zhí)行引擎配對(duì),,該引擎現(xiàn)在每個(gè)周期中最多支持8條指令——調(diào)度和報(bào)廢,而上代的Zen 4 只有6條指令,。AMD 還將算術(shù)邏輯單元 (ALU) 的數(shù)量從 4 個(gè)增加到 6 個(gè),,還有3個(gè)乘法器,并實(shí)施了更統(tǒng)一的調(diào)度程序,,以提高執(zhí)行效率,。
為了減少錯(cuò)誤預(yù)測(cè)增加的可能性,AMD還將Zen 5的執(zhí)行窗口延長(zhǎng)了約40%,?!八淖饔檬菐?lái)新的性能水平,因?yàn)樗c這些前端進(jìn)步相結(jié)合......它允許我們使用這些指令,,并利用通過(guò)管道向我們提供的改進(jìn)預(yù)測(cè),,“Papermaster 解釋道。
Zen 5 的 IPC 性能增長(zhǎng)當(dāng)中,,約 27% 可歸因于后端數(shù)據(jù)帶寬的增加。與上一代相比,,AMD 將 L1 數(shù)據(jù)緩存從 32KB 提升到 48KB,,并將 L1 和浮點(diǎn)單元的最大帶寬增加了一倍。
關(guān)鍵的一點(diǎn)是,,AMD不僅對(duì)分支預(yù)測(cè)器或執(zhí)行引擎進(jìn)行了優(yōu)化,,還試圖平衡內(nèi)核的每個(gè)元素,以避免瓶頸或增加延遲,。其結(jié)果是,,器核心可以比前幾代更快地消化更多指令。
Zen 5 內(nèi)核所帶來(lái)的最大的IPC提升,,在于其改進(jìn)了AVX-512指令的實(shí)施,,對(duì)于A(yíng)VX-512矢量擴(kuò)展進(jìn)行了重新設(shè)計(jì),,以提供完整的512位數(shù)據(jù)路徑,使得其在A(yíng)VX-512 矢量擴(kuò)展的工作負(fù)載中表現(xiàn)更為出色,。
雖然 Papermaster 聲稱(chēng) Zen 5 現(xiàn)在可以運(yùn)行完整的 AVX-512 工作負(fù)載而不會(huì)受到頻率損失,,但這些指令在歷史上一直運(yùn)行得非常熱。這在臺(tái)式機(jī)或工作站上沒(méi)什么大不了的,,但對(duì)于散熱空間有限的筆記本電腦來(lái)說(shuō)并不理想,。所以對(duì)于“Strix Point”系列移動(dòng)芯片,AMD則是堅(jiān)持使用“double-pumped” AVX-512來(lái)實(shí)現(xiàn)——可能會(huì)針對(duì)每瓦性能和散熱限制進(jìn)行優(yōu)化,。相比之下,,上代的Zen 4 則是“double-pumped” AVX-256。
此外,,Papermaster 還強(qiáng)調(diào)了了AVX-512 工矢量擴(kuò)展在 CPU 上運(yùn)行AI工作負(fù)載的潛力,。在機(jī)器學(xué)習(xí)方面,AMD聲稱(chēng)單核Zen 5 性能比Zen 4 提高了32%,,在A(yíng)ES-XTS 加密算法性能上也提升了35%,。特別是在其移動(dòng)芯片方面,AMD強(qiáng)調(diào)了在每個(gè)領(lǐng)域運(yùn)行機(jī)器學(xué)習(xí)的概念,,而不僅僅是在集成GPU或NPU上,。
AMD表示 Zen 5 架構(gòu)將會(huì)應(yīng)用于各個(gè)領(lǐng)域,除了桌面與移動(dòng)處理器之外,,包括 EPYC 霄龍?zhí)幚砥饕约扒度胧教幚砥鞯榷紝⒉捎?Zen 5 架構(gòu),,從而讓企業(yè)部署更加得心應(yīng)手。
在A(yíng)MD的技術(shù)日披露中,,其Zen 5和緊湊型Zen 5C 內(nèi)核在功能方面在架構(gòu)上基本保持相同,,只不過(guò)較小的 Zen 5C 內(nèi)核可以以較低的頻率換取更高的性能密度。
據(jù)介紹,,首批基于 Zen 5 內(nèi)核的處理器系列(Ryzen 9000系列和Ryzen AI 300系列處理器)將于 7 月 31 日上市,。但是基于Zen 5 內(nèi)核的數(shù)據(jù)中心處理器可能必須等待更長(zhǎng)的時(shí)間才能到達(dá)。
根據(jù)之前曝光的信息顯示,,在第5代 Epyc服務(wù)器處理器,,預(yù)計(jì)將會(huì)采用臺(tái)積電3nm制程,并將具有192個(gè)CPU內(nèi)核和384個(gè)線(xiàn)程,。與此同時(shí),,頻率優(yōu)化的“Turin”可能會(huì)有128 個(gè)內(nèi)核和256 個(gè)線(xiàn)程。
競(jìng)爭(zhēng)白熱化
在Zen 5 內(nèi)核推出之際,,AMD 正面臨多年來(lái)最激烈的競(jìng)爭(zhēng),。因?yàn)楦咄ü就瞥隽艘豢顝?qiáng)大的基于 Arm 架構(gòu)的Windows筆記本電腦芯片,而英特爾也準(zhǔn)備在其至強(qiáng)和酷睿產(chǎn)品系列中推出一系列改進(jìn)的CPU。
在客戶(hù)端領(lǐng)域,,高通具有45TOPS NPU算力的驍龍?zhí)幚砥魇蛊湓谖④浀腃opilot + AI PC推動(dòng)中處于領(lǐng)先地位,。AMD的具備50TOPS NPU算力的Ryzen AI 300系列則希望帶來(lái)更多競(jìng)爭(zhēng)優(yōu)勢(shì)。但是,,英特爾即將上市的Lunar Lake則具有48TOPS NPU算力,,AI綜合算力更是高達(dá)120TOPS。顯然,,AMD的Ryzen AI 300在與英特爾Lunar Lake的競(jìng)爭(zhēng)當(dāng)中,,可能并沒(méi)有多少優(yōu)勢(shì)。
在數(shù)據(jù)中心領(lǐng)域也有類(lèi)似的情況,,隨著英特爾 144 核 Sierra Forest 和即將推出的 128 核 Granite Rapids Xeon 6 平臺(tái)的推出,,AMD在該市場(chǎng)也面臨更加激烈的競(jìng)爭(zhēng)。英特爾Xeon 6系列除了架構(gòu)轉(zhuǎn)向了全大核和全小核,,也轉(zhuǎn)向新的小芯片架構(gòu),,并且這些芯片也升級(jí)到了Intel 3 制程工藝。
與此同時(shí),,越來(lái)越多的云服務(wù)提供商也在自研基于A(yíng)rm 架構(gòu)的定制芯片,,來(lái)處理其超大規(guī)模工作負(fù)載。比如亞馬遜的Graviton 現(xiàn)在已經(jīng)是發(fā)展到了第四代,,并普遍可用,。此外,谷歌,、阿里云,、百度、微軟,、Meta也都已開(kāi)始部署或研發(fā)自己的Arm架構(gòu)服務(wù)器芯片,。