《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 模擬設(shè)計(jì) > 業(yè)界動(dòng)態(tài) > AMD Zen 5 CPU架構(gòu)內(nèi)核解析

AMD Zen 5 CPU架構(gòu)內(nèi)核解析

IPC性能提升了16%!
2024-07-16
來(lái)源:芯智訊
關(guān)鍵詞: AMD Zen5

7月15日消息,AMD近日在美國(guó)洛杉磯舉行的技術(shù)日活動(dòng)中,,介紹了其全新的Zen 5 CPU架構(gòu),,將會(huì)帶來(lái)平均16%的每時(shí)鐘指令數(shù)(IPC)性能提升,相關(guān)處理器產(chǎn)品將于7月底上市,。

在今年6月初的Computex 2024展會(huì)上,,AMD正式發(fā)布了基于全新的Zen5架構(gòu)的Ryzen 9000系列桌面處理器(Granite Ridge)和面向筆記本電腦的Ryzen AI 300系列AI PC處理器(Strix Point)。

其中,,Ryzen 9000系列當(dāng)中的旗艦產(chǎn)品——Ryzen 9 9950X配備16核心32線(xiàn)程,,170W TDP,最高主頻5.7 GHz,。而Ryzen AI 300系列的旗艦產(chǎn)品——Ryzen AI 9 HX 370的CPU為12核心24線(xiàn)程,,包括4個(gè)Zen 5 內(nèi)核和8個(gè)Zen 5C 內(nèi)核,每個(gè)核心1MB二級(jí)緩存,,三級(jí)緩存為24MB,,最高主頻5.1GHz。GPU不但升級(jí)架構(gòu),,CU單元數(shù)量也從12個(gè)增至16個(gè),,命名為“Radeon 890M”。NPU算力則提升到了50TOPS,,增加了2倍有余,。

根據(jù)此前AMD公布的數(shù)據(jù)顯示,與英特爾Core i9-14900K相比,,AMD旗艦16核心Ryzen 9 9950X在游戲性能測(cè)試中的速度快4%到23%,。在生產(chǎn)力性能測(cè)試中,9950X顯示出更大的優(yōu)勢(shì),,比英特爾Core i9-14900K快7%至56%,。同樣Ryzen AI 300系列相比上代產(chǎn)品也帶來(lái)的很大的性能提升。

當(dāng)然,,制程工藝,、CPU核心數(shù)量、緩存容量和主頻上的提升,,都對(duì)于其CPU的性能提升帶來(lái)了不小的助力,,但是其中關(guān)鍵的性能提升則是來(lái)源于Zen 5 內(nèi)核架構(gòu)的提升。

Zen 5 內(nèi)核帶來(lái)了平均16%的IPC性能提升

據(jù)介紹,,其 Zen 5 內(nèi)核擁有 6 個(gè) ALU,,數(shù)量是上一代的 3 倍,采用了 48KB 的 12 路一級(jí)緩存,,在浮點(diǎn)運(yùn)算以及最大帶寬上均是上代的 2 倍,,并且Zen 5內(nèi)核也同樣支持完整版的 AVX-512 指令,,從而在一些專(zhuān)業(yè)應(yīng)用上有事半功倍的作用。得益于這些方面的提升,,Zen 5的IPC性能比上一代的Zen 4 內(nèi)核高出了10%-35%,,平均提升了16%。

1.jpg

據(jù)AMD首席技術(shù)官M(fèi)ark Papermaster介紹,,Zen 5內(nèi)核的最大改進(jìn)之一是其前端,,在其IPC整體性能提升當(dāng)中的占比為39%。

具體來(lái)說(shuō),,AMD已經(jīng)擴(kuò)大了前端,,允許每個(gè)周期進(jìn)行更多的分支預(yù)測(cè)——這是現(xiàn)代CPU內(nèi)核性能的主要貢獻(xiàn)者——并實(shí)施了雙解碼管道以及i-cache和op-cache改進(jìn),以遏制延遲并提高帶寬,。

2.png

Zen 5 這個(gè)更寬的前端與一個(gè)更大的整數(shù)執(zhí)行引擎配對(duì),,該引擎現(xiàn)在每個(gè)周期中最多支持8條指令——調(diào)度和報(bào)廢,而上代的Zen 4 只有6條指令,。AMD 還將算術(shù)邏輯單元 (ALU) 的數(shù)量從 4 個(gè)增加到 6 個(gè),,還有3個(gè)乘法器,并實(shí)施了更統(tǒng)一的調(diào)度程序,,以提高執(zhí)行效率,。

3.png

為了減少錯(cuò)誤預(yù)測(cè)增加的可能性,AMD還將Zen 5的執(zhí)行窗口延長(zhǎng)了約40%,?!八淖饔檬菐?lái)新的性能水平,因?yàn)樗c這些前端進(jìn)步相結(jié)合......它允許我們使用這些指令,,并利用通過(guò)管道向我們提供的改進(jìn)預(yù)測(cè),,“Papermaster 解釋道。

Zen 5 的 IPC 性能增長(zhǎng)當(dāng)中,,約 27% 可歸因于后端數(shù)據(jù)帶寬的增加。與上一代相比,,AMD 將 L1 數(shù)據(jù)緩存從 32KB 提升到 48KB,,并將 L1 和浮點(diǎn)單元的最大帶寬增加了一倍。

4.png

關(guān)鍵的一點(diǎn)是,,AMD不僅對(duì)分支預(yù)測(cè)器或執(zhí)行引擎進(jìn)行了優(yōu)化,,還試圖平衡內(nèi)核的每個(gè)元素,以避免瓶頸或增加延遲,。其結(jié)果是,,器核心可以比前幾代更快地消化更多指令。

Zen 5 內(nèi)核所帶來(lái)的最大的IPC提升,,在于其改進(jìn)了AVX-512指令的實(shí)施,,對(duì)于A(yíng)VX-512矢量擴(kuò)展進(jìn)行了重新設(shè)計(jì),,以提供完整的512位數(shù)據(jù)路徑,使得其在A(yíng)VX-512 矢量擴(kuò)展的工作負(fù)載中表現(xiàn)更為出色,。

5.png

雖然 Papermaster 聲稱(chēng) Zen 5 現(xiàn)在可以運(yùn)行完整的 AVX-512 工作負(fù)載而不會(huì)受到頻率損失,,但這些指令在歷史上一直運(yùn)行得非常熱。這在臺(tái)式機(jī)或工作站上沒(méi)什么大不了的,,但對(duì)于散熱空間有限的筆記本電腦來(lái)說(shuō)并不理想,。所以對(duì)于“Strix Point”系列移動(dòng)芯片,AMD則是堅(jiān)持使用“double-pumped” AVX-512來(lái)實(shí)現(xiàn)——可能會(huì)針對(duì)每瓦性能和散熱限制進(jìn)行優(yōu)化,。相比之下,,上代的Zen 4 則是“double-pumped” AVX-256。

此外,,Papermaster 還強(qiáng)調(diào)了了AVX-512 工矢量擴(kuò)展在 CPU 上運(yùn)行AI工作負(fù)載的潛力,。在機(jī)器學(xué)習(xí)方面,AMD聲稱(chēng)單核Zen 5 性能比Zen 4 提高了32%,,在A(yíng)ES-XTS 加密算法性能上也提升了35%,。特別是在其移動(dòng)芯片方面,AMD強(qiáng)調(diào)了在每個(gè)領(lǐng)域運(yùn)行機(jī)器學(xué)習(xí)的概念,,而不僅僅是在集成GPU或NPU上,。

AMD表示 Zen 5 架構(gòu)將會(huì)應(yīng)用于各個(gè)領(lǐng)域,除了桌面與移動(dòng)處理器之外,,包括 EPYC 霄龍?zhí)幚砥饕约扒度胧教幚砥鞯榷紝⒉捎?Zen 5 架構(gòu),,從而讓企業(yè)部署更加得心應(yīng)手。

在A(yíng)MD的技術(shù)日披露中,,其Zen 5和緊湊型Zen 5C 內(nèi)核在功能方面在架構(gòu)上基本保持相同,,只不過(guò)較小的 Zen 5C 內(nèi)核可以以較低的頻率換取更高的性能密度。

據(jù)介紹,,首批基于 Zen 5 內(nèi)核的處理器系列(Ryzen 9000系列和Ryzen AI 300系列處理器)將于 7 月 31 日上市,。但是基于Zen 5 內(nèi)核的數(shù)據(jù)中心處理器可能必須等待更長(zhǎng)的時(shí)間才能到達(dá)。

根據(jù)之前曝光的信息顯示,,在第5代 Epyc服務(wù)器處理器,,預(yù)計(jì)將會(huì)采用臺(tái)積電3nm制程,并將具有192個(gè)CPU內(nèi)核和384個(gè)線(xiàn)程,。與此同時(shí),,頻率優(yōu)化的“Turin”可能會(huì)有128 個(gè)內(nèi)核和256 個(gè)線(xiàn)程。

競(jìng)爭(zhēng)白熱化

在Zen 5 內(nèi)核推出之際,,AMD 正面臨多年來(lái)最激烈的競(jìng)爭(zhēng),。因?yàn)楦咄ü就瞥隽艘豢顝?qiáng)大的基于 Arm 架構(gòu)的Windows筆記本電腦芯片,而英特爾也準(zhǔn)備在其至強(qiáng)和酷睿產(chǎn)品系列中推出一系列改進(jìn)的CPU。

在客戶(hù)端領(lǐng)域,,高通具有45TOPS NPU算力的驍龍?zhí)幚砥魇蛊湓谖④浀腃opilot + AI PC推動(dòng)中處于領(lǐng)先地位,。AMD的具備50TOPS NPU算力的Ryzen AI 300系列則希望帶來(lái)更多競(jìng)爭(zhēng)優(yōu)勢(shì)。但是,,英特爾即將上市的Lunar Lake則具有48TOPS NPU算力,,AI綜合算力更是高達(dá)120TOPS。顯然,,AMD的Ryzen AI 300在與英特爾Lunar Lake的競(jìng)爭(zhēng)當(dāng)中,,可能并沒(méi)有多少優(yōu)勢(shì)。

在數(shù)據(jù)中心領(lǐng)域也有類(lèi)似的情況,,隨著英特爾 144 核 Sierra Forest 和即將推出的 128 核 Granite Rapids Xeon 6 平臺(tái)的推出,,AMD在該市場(chǎng)也面臨更加激烈的競(jìng)爭(zhēng)。英特爾Xeon 6系列除了架構(gòu)轉(zhuǎn)向了全大核和全小核,,也轉(zhuǎn)向新的小芯片架構(gòu),,并且這些芯片也升級(jí)到了Intel 3 制程工藝。

與此同時(shí),,越來(lái)越多的云服務(wù)提供商也在自研基于A(yíng)rm 架構(gòu)的定制芯片,,來(lái)處理其超大規(guī)模工作負(fù)載。比如亞馬遜的Graviton 現(xiàn)在已經(jīng)是發(fā)展到了第四代,,并普遍可用,。此外,谷歌,、阿里云,、百度、微軟,、Meta也都已開(kāi)始部署或研發(fā)自己的Arm架構(gòu)服務(wù)器芯片,。


000.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀(guān)點(diǎn),。轉(zhuǎn)載的所有的文章、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容,、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話(huà)通知我們,,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話(huà):010-82306118,;郵箱:[email protected],。