AMD Zen 5 CPU架構(gòu)內(nèi)核解析-AET-電子技術(shù)應(yīng)用

AMD Zen 5 CPU架構(gòu)內(nèi)核解析

IPC性能提升了16%！

日期： 2024-07-16

來源：芯智訊

關(guān)鍵詞： AMD Zen5

7月15日消息，AMD近日在美國洛杉磯舉行的技術(shù)日活動(dòng)中，介紹了其全新的Zen 5 CPU架構(gòu)，將會(huì)帶來平均16%的每時(shí)鐘指令數(shù)（IPC）性能提升，相關(guān)處理器產(chǎn)品將于7月底上市。

在今年6月初的Computex 2024展會(huì)上，AMD正式發(fā)布了基于全新的Zen5架構(gòu)的Ryzen 9000系列桌面處理器（Granite Ridge）和面向筆記本電腦的Ryzen AI 300系列AI PC處理器（Strix Point）。

其中，Ryzen 9000系列當(dāng)中的旗艦產(chǎn)品——Ryzen 9 9950X配備16核心32線程，170W TDP，最高主頻5.7 GHz。而Ryzen AI 300系列的旗艦產(chǎn)品——Ryzen AI 9 HX 370的CPU為12核心24線程，包括4個(gè)Zen 5 內(nèi)核和8個(gè)Zen 5C 內(nèi)核，每個(gè)核心1MB二級緩存，三級緩存為24MB，最高主頻5.1GHz。GPU不但升級架構(gòu)，CU單元數(shù)量也從12個(gè)增至16個(gè)，命名為“Radeon 890M”。NPU算力則提升到了50TOPS，增加了2倍有余。

根據(jù)此前AMD公布的數(shù)據(jù)顯示，與英特爾Core i9-14900K相比，AMD旗艦16核心Ryzen 9 9950X在游戲性能測試中的速度快4%到23%。在生產(chǎn)力性能測試中，9950X顯示出更大的優(yōu)勢，比英特爾Core i9-14900K快7%至56%。同樣Ryzen AI 300系列相比上代產(chǎn)品也帶來的很大的性能提升。

當(dāng)然，制程工藝、CPU核心數(shù)量、緩存容量和主頻上的提升，都對于其CPU的性能提升帶來了不小的助力，但是其中關(guān)鍵的性能提升則是來源于Zen 5 內(nèi)核架構(gòu)的提升。

Zen 5 內(nèi)核帶來了平均16%的IPC性能提升

據(jù)介紹，其 Zen 5 內(nèi)核擁有 6 個(gè) ALU，數(shù)量是上一代的 3 倍，采用了 48KB 的 12 路一級緩存，在浮點(diǎn)運(yùn)算以及最大帶寬上均是上代的 2 倍，并且Zen 5內(nèi)核也同樣支持完整版的 AVX-512 指令，從而在一些專業(yè)應(yīng)用上有事半功倍的作用。得益于這些方面的提升，Zen 5的IPC性能比上一代的Zen 4 內(nèi)核高出了10%-35%，平均提升了16%。

據(jù)AMD首席技術(shù)官M(fèi)ark Papermaster介紹，Zen 5內(nèi)核的最大改進(jìn)之一是其前端，在其IPC整體性能提升當(dāng)中的占比為39%。

具體來說，AMD已經(jīng)擴(kuò)大了前端，允許每個(gè)周期進(jìn)行更多的分支預(yù)測——這是現(xiàn)代CPU內(nèi)核性能的主要貢獻(xiàn)者——并實(shí)施了雙解碼管道以及i-cache和op-cache改進(jìn)，以遏制延遲并提高帶寬。

Zen 5 這個(gè)更寬的前端與一個(gè)更大的整數(shù)執(zhí)行引擎配對，該引擎現(xiàn)在每個(gè)周期中最多支持8條指令——調(diào)度和報(bào)廢，而上代的Zen 4 只有6條指令。AMD 還將算術(shù)邏輯單元（ALU）的數(shù)量從 4 個(gè)增加到 6 個(gè)，還有3個(gè)乘法器，并實(shí)施了更統(tǒng)一的調(diào)度程序，以提高執(zhí)行效率。

為了減少錯(cuò)誤預(yù)測增加的可能性，AMD還將Zen 5的執(zhí)行窗口延長了約40%。“它的作用是帶來新的性能水平，因?yàn)樗c這些前端進(jìn)步相結(jié)合......它允許我們使用這些指令，并利用通過管道向我們提供的改進(jìn)預(yù)測，“Papermaster 解釋道。

Zen 5 的 IPC 性能增長當(dāng)中，約 27% 可歸因于后端數(shù)據(jù)帶寬的增加。與上一代相比，AMD 將 L1 數(shù)據(jù)緩存從 32KB 提升到 48KB，并將 L1 和浮點(diǎn)單元的最大帶寬增加了一倍。

關(guān)鍵的一點(diǎn)是，AMD不僅對分支預(yù)測器或執(zhí)行引擎進(jìn)行了優(yōu)化，還試圖平衡內(nèi)核的每個(gè)元素，以避免瓶頸或增加延遲。其結(jié)果是，器核心可以比前幾代更快地消化更多指令。

Zen 5 內(nèi)核所帶來的最大的IPC提升，在于其改進(jìn)了AVX-512指令的實(shí)施，對于AVX-512矢量擴(kuò)展進(jìn)行了重新設(shè)計(jì)，以提供完整的512位數(shù)據(jù)路徑，使得其在AVX-512 矢量擴(kuò)展的工作負(fù)載中表現(xiàn)更為出色。

雖然 Papermaster 聲稱 Zen 5 現(xiàn)在可以運(yùn)行完整的 AVX-512 工作負(fù)載而不會(huì)受到頻率損失，但這些指令在歷史上一直運(yùn)行得非常熱。這在臺(tái)式機(jī)或工作站上沒什么大不了的，但對于散熱空間有限的筆記本電腦來說并不理想。所以對于“Strix Point”系列移動(dòng)芯片，AMD則是堅(jiān)持使用“double-pumped” AVX-512來實(shí)現(xiàn)——可能會(huì)針對每瓦性能和散熱限制進(jìn)行優(yōu)化。相比之下，上代的Zen 4 則是“double-pumped” AVX-256。

此外，Papermaster 還強(qiáng)調(diào)了了AVX-512 工矢量擴(kuò)展在 CPU 上運(yùn)行AI工作負(fù)載的潛力。在機(jī)器學(xué)習(xí)方面，AMD聲稱單核Zen 5 性能比Zen 4 提高了32%，在AES-XTS 加密算法性能上也提升了35%。特別是在其移動(dòng)芯片方面，AMD強(qiáng)調(diào)了在每個(gè)領(lǐng)域運(yùn)行機(jī)器學(xué)習(xí)的概念，而不僅僅是在集成GPU或NPU上。

AMD表示 Zen 5 架構(gòu)將會(huì)應(yīng)用于各個(gè)領(lǐng)域，除了桌面與移動(dòng)處理器之外，包括 EPYC 霄龍?zhí)幚砥饕约扒度胧教幚砥鞯榷紝⒉捎?Zen 5 架構(gòu)，從而讓企業(yè)部署更加得心應(yīng)手。

在AMD的技術(shù)日披露中，其Zen 5和緊湊型Zen 5C 內(nèi)核在功能方面在架構(gòu)上基本保持相同，只不過較小的 Zen 5C 內(nèi)核可以以較低的頻率換取更高的性能密度。

據(jù)介紹，首批基于 Zen 5 內(nèi)核的處理器系列（Ryzen 9000系列和Ryzen AI 300系列處理器）將于 7 月 31 日上市。但是基于Zen 5 內(nèi)核的數(shù)據(jù)中心處理器可能必須等待更長的時(shí)間才能到達(dá)。

根據(jù)之前曝光的信息顯示，在第5代 Epyc服務(wù)器處理器，預(yù)計(jì)將會(huì)采用臺(tái)積電3nm制程，并將具有192個(gè)CPU內(nèi)核和384個(gè)線程。與此同時(shí)，頻率優(yōu)化的“Turin”可能會(huì)有128 個(gè)內(nèi)核和256 個(gè)線程。

競爭白熱化

在Zen 5 內(nèi)核推出之際，AMD 正面臨多年來最激烈的競爭。因?yàn)楦咄ü就瞥隽艘豢顝?qiáng)大的基于 Arm 架構(gòu)的Windows筆記本電腦芯片，而英特爾也準(zhǔn)備在其至強(qiáng)和酷睿產(chǎn)品系列中推出一系列改進(jìn)的CPU。

在客戶端領(lǐng)域，高通具有45TOPS NPU算力的驍龍?zhí)幚砥魇蛊湓谖④浀腃opilot + AI PC推動(dòng)中處于領(lǐng)先地位。AMD的具備50TOPS NPU算力的Ryzen AI 300系列則希望帶來更多競爭優(yōu)勢。但是，英特爾即將上市的Lunar Lake則具有48TOPS NPU算力，AI綜合算力更是高達(dá)120TOPS。顯然，AMD的Ryzen AI 300在與英特爾Lunar Lake的競爭當(dāng)中，可能并沒有多少優(yōu)勢。

在數(shù)據(jù)中心領(lǐng)域也有類似的情況，隨著英特爾 144 核 Sierra Forest 和即將推出的 128 核 Granite Rapids Xeon 6 平臺(tái)的推出，AMD在該市場也面臨更加激烈的競爭。英特爾Xeon 6系列除了架構(gòu)轉(zhuǎn)向了全大核和全小核，也轉(zhuǎn)向新的小芯片架構(gòu)，并且這些芯片也升級到了Intel 3 制程工藝。

與此同時(shí)，越來越多的云服務(wù)提供商也在自研基于Arm 架構(gòu)的定制芯片，來處理其超大規(guī)模工作負(fù)載。比如亞馬遜的Graviton 現(xiàn)在已經(jīng)是發(fā)展到了第四代，并普遍可用。此外，谷歌、阿里云、百度、微軟、Meta也都已開始部署或研發(fā)自己的Arm架構(gòu)服務(wù)器芯片。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時(shí)通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：[email protected]。

AMD Zen 5 CPU架構(gòu)內(nèi)核解析

日期： 2024-07-16

來源：芯智訊

相關(guān)內(nèi)容