《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 電子元件 > 業(yè)界動態(tài) > 蘋果M1芯片深度測試

蘋果M1芯片深度測試

2020-11-18
來源:半導(dǎo)體行業(yè)觀察
關(guān)鍵詞: 蘋果公司 MAC 芯片

  上周,蘋果公司發(fā)布了基于他們新Apple Silicon M1 SoC芯片打造新Mac產(chǎn)品,,這個新聞在行業(yè)內(nèi)引起了轟動,,因為這標志著蘋果正式開啟了從Intel的x86 CPU過渡到該公司自己基于Arm架構(gòu)設(shè)計的內(nèi)部產(chǎn)品的兩年計劃第一步。

  在發(fā)布會期間,,我們根據(jù)該公司已經(jīng)發(fā)布的Apple A14芯片(在新一代iPhone 12手機中使用)撰寫了一篇詳盡的文章,,當中包括對Apple的新Firestorm內(nèi)核的微體系結(jié)構(gòu)的深入研究,,這些內(nèi)核同時為A14和新的Apple Silicon M1提供動力,如果您還沒有機會看的話,,我建議您閱讀《深度解讀蘋果M1芯片》,。

  幾天以來,我們已經(jīng)能夠接觸到首批Apple Silicon M1設(shè)備之一:全新的Mac mini 2020版本,。在上周的分析文章中,,我們基于A14得出了數(shù)字,而這次,,我們根據(jù)實際的新高功率設(shè)計測量了實際性能,。我們沒有很多時間,但是我們將為您帶來與新的Apple Silicon M1相關(guān)的關(guān)鍵數(shù)據(jù)點,。

  Apple Silicon M1:Firestorm內(nèi)核的3.2GHz和約20-24W TDP,?

  在Apple的演示文稿中,缺少芯片時鐘頻率的實際細節(jié)以及可以保持最高性能的TDP是他們的一貫風(fēng)格,。

微信圖片_20201118104833.png

  但我們可以確認,,在單線程工作負載中,Apple的Firestorm內(nèi)核現(xiàn)在的時鐘頻率為3.2GHz,,比Apple A14的3GHz頻率提高了6.66%,。只要有散熱空間,此時鐘也適用于所有內(nèi)核負載,,除了4個3.2GHz性能內(nèi)核以外,,我們在2064MHz處還可以看到4個Thunde效率內(nèi)核,這也比A14上的1823MHz高出很多,。

  除了四個高性能的Firestorm核心之外,,M1還包括四個Icestorm核心,旨在降低閑置功率并提高電池供電情境下的電源效率,。4個性能內(nèi)核和4個效率內(nèi)核都可以同時激活,,這意味著這是8內(nèi)核SoC,盡管所有內(nèi)核的性能吞吐量并不相同,。

  發(fā)布會期間最大的問題是這些設(shè)計的功耗,。蘋果已經(jīng)提供了包括性能和功率軸在內(nèi)的幾張圖表,但是我們?nèi)狈Ρ容^數(shù)據(jù)來得出正確的結(jié)論,。

  由于我們可以使用Mac mini而不是Macbook,,因此這意味著設(shè)備上的功率測量非常簡單,因為我們只需將儀表連接到設(shè)備的AC輸入即可,。值得一提的是,,由于我們在這里測量的是交流電源,因此功率數(shù)字不能直接與電池供電的設(shè)備相提并論,因為Mac mini的電源會帶來比其他設(shè)備更大的效率損失,。

  尤其重要的是要記住,,我們通常談到的處理器中的TDP數(shù)實際上只是此處提供的數(shù)字的一個子集,因為除了SoC,,我們還在測量DRAM和電壓調(diào)節(jié)開銷,,而這并不是包含在TDP數(shù)據(jù)中,也不包括筆記本電腦上的典型封裝電源讀數(shù),。

微信圖片_20201118104837.png

  從空閑的Mac mini處于默認狀態(tài)開始,,我們把打開電源后的設(shè)備看作空閑狀態(tài),在通過HDMI連接到2560p144顯示器,,Wi-Fi 6和鼠標和鍵盤,,我們看到的設(shè)備總功率為4.2W。鑒于我們正在測量設(shè)備的交流電源,,這在低負載下可能效率很低,,這在很大程度上是有意義的,并且代表了一個很好的數(shù)字,。

  該閑置數(shù)據(jù)還用作后續(xù)測量的基準,,在這些測量中我們計算“有功功率”(active power),這意味著我們通常采用的方法是測量總功率并減去閑置功率,。

  在3.2GHz Firestorm內(nèi)核上的平均單線程工作負載(例如GCC代碼編譯)期間,,我們看到設(shè)備功率高達10.5W,有功功率約為6.3W,。有功功率與我們對更高頻率的Firestorm內(nèi)核的期望非常一致,,并且對于Apple和M1來說是極有希望的。

  在工作量更大的DRAM上,,從而在Mac mini上的LPDDR4X級128位16GB DRAM上造成更大的功率損失,我們看到有功功率高達10.5W,。有了這些數(shù)據(jù),,新的M1可能會給人留下深刻的印象,并且其展示能力還不到高端英特爾移動CPU的三分之一,。

  在多線程方案中,,電源高度依賴于工作負載。在CPU利用率不高的內(nèi)存密集型工作負載中,,我們看到有功功率為18W,,平均工作負載約為22W,在計算繁重的工作負載中峰值約為27W,。這些數(shù)字通常是您希望與其他平臺的“ TDP”進行比較的數(shù)字,,盡管要再次進行比較,您需要進一步減去一些在Mac mini上測算的開銷,。最好的猜測是20至24W的范圍,。

  最后,,在GPU方面,我們看到GFXBench Aztec High的功耗降低了17.3W,。這將包含大量的DRAM功耗,,因此Apple GPU的功耗絕對是極低的功耗,并且遠遠小于CPU可以消耗的峰值功率,。

  存儲差異

  除了CPU和GPU上的其他內(nèi)核外,,M1與A14的主要區(qū)別還在于它運行在128位內(nèi)存總線上,而不是在移動64位總線上,。在8個16位內(nèi)存通道和LPDDR4X-4266級內(nèi)存中,,這意味著M1達到了68.25GB / s的內(nèi)存帶寬峰值。

微信圖片_20201118104840.png

  在內(nèi)存延遲方面,,我們發(fā)現(xiàn)M1較之A14(預(yù)期的)減少了,,在128MB完全隨機測試深度(full random test depth)下測量為96ns,而在A14上為102ns,。

  還需要注意的是性能核心的12MB L2緩存,,盡管在這里蘋果似乎仍在對單個核心可使用的數(shù)量進行分區(qū),因為我們?nèi)匀豢吹?MB之后的延遲有所增加,。

  M1還包含一個較大的SLC緩存,,芯片上的所有IP塊都應(yīng)可以訪問該緩存,但我們不確定,。不給過測試結(jié)果的確與A14相似,,因此我們假設(shè)這是SoC上類似的16MB緩存塊,因為某些訪問模式超出了A14的訪問范圍,,這在一定程度上是合理的較大的L2,。

微信圖片_20201118104843.png

  我們從未真正有機會進行測試的一個方面就是,蘋果的核心在內(nèi)存帶寬方面到底有多出色,。在M1內(nèi)部,,結(jié)果是突破性的:一次Firestorm可以實現(xiàn)高達58GB / s的內(nèi)存讀取速度,而內(nèi)存寫入速度則為33-36GB / s,。最重要的是,,根據(jù)您使用的是標量指令還是矢量指令,內(nèi)存副本(memory copies)的傳輸速度可以高達60至62GB / s,。單個Firestorm內(nèi)核幾乎可以使內(nèi)存控制器飽和的事實令人震驚,,因為這是我們以前在設(shè)計中從未見過的。

  因為一個內(nèi)核幾乎可以利用整個內(nèi)存帶寬,,所以讓多個內(nèi)核同時訪問事物實際上并不會增加系統(tǒng)帶寬,,但是實際上由于擁塞會降低有效實現(xiàn)的總帶寬。當在內(nèi)存副本(memory copies)中同時使用性能核心和效率核心時,我特別指出了這一點——4個大核心以59GB / s的內(nèi)存副本(memory copies)達到峰值,,但是一旦添加了效率核心,,它就會降至49GB / s,當所有內(nèi)核都處于活動狀態(tài)時,,速度可降至46GB / s,,這表明系統(tǒng)中某處中存在瓶頸。

  除了增加時鐘速度,,增加L2之外,,這種內(nèi)存提升還很有可能是M1區(qū)別于A14之外的另一個關(guān)鍵點,并讓其有能力與現(xiàn)有的x86廠商的競爭,。

  基準測試

  由于我們使用Mac mini的時間很少,,而且這不僅是一個macOS系統(tǒng),而且是一個新的基于Arm64的macOS系統(tǒng),,因此我們無法使用我們通常使用的基準測試,。在發(fā)布時,我們已經(jīng)進行了各種可用的測試,,以使我們對性能有一個大致的了解:

微信圖片_20201118104847.jpg

微信圖片_20201118104849.png

  Cinebench是在macOS和Apple Silicon上初露頭角的一個特定基準,。在基于Cinema4D的首次基準測試中,我們看到蘋果M1與市場上大部分的x86 CPU相比,,擁有相當大的優(yōu)勢,,但輸給了Zen3和Tiger Lake CPU,后者似乎仍然具有優(yōu)勢,。

  值得注意的是,,在x86模式下,Rosetta2基準測試的性能不僅能夠跟上過去的Mac,,而且還能勝過它們,。

微信圖片_20201118104852.png

  在多線程R23運行中,M1版本Mac具有絕對的領(lǐng)先優(yōu)勢,。值得一提的是,,我們正在嘗試訪問其他系統(tǒng)以收集更多數(shù)據(jù),并希望進一步更新圖表,。

微信圖片_20201118104855.png

  在瀏覽器基準測試中,Apple的CPU占據(jù)了主導(dǎo)地位,,但是人們懷疑這是由于iPhone的CPU本身,,還是僅歸因于瀏覽器和瀏覽器引擎。現(xiàn)在可以在macOS和桌面Safari上運行,,并且能夠?qū)?shù)據(jù)與其他Intel Mac系統(tǒng)進行比較,,我們可以得出這樣的結(jié)論:性能優(yōu)勢歸功于Apple的CPU設(shè)計。

  Web瀏覽性能似乎是Apple CPU的頭等大事,這是有道理的,,因為它是移動SoC的殺手級工作量,,也是日常生活中使用最多的工作量。

微信圖片_20201118104900.png

  在Geekbench 5中,,M1再次表現(xiàn)出色,,因為它實際上領(lǐng)先于我們的性能數(shù)據(jù)。即使在以x86兼容模式運行時,,M1與上一代高端CPU的頂級單線程性能相比不相伯仲,,并且大大超過了Mac mini和Macbook的先前版本。

微信圖片_20201118104903.png

  多線程性能取決于設(shè)計的內(nèi)核數(shù)和功耗效率,。M1在這里輸給了2017年的15英寸Macbook Pro,,它使用的Intel i7-7820HQ具有4核和8線程,得分翻倍,。在收集數(shù)據(jù)點時,,我們將添加更多的數(shù)據(jù)點。

  M1 GPU性能:集成王者,,獨立CPU的競爭對手

  從Intel切換到Apple芯片上,,重點主要應(yīng)該放在CPU內(nèi)核上,對此,,我們有充分的理由,,但M1在GPU方面的表示不容忽視。像他們的CPU內(nèi)核一樣,,蘋果已經(jīng)開發(fā)了自己的GPU技術(shù)已有多年了,,隨著向Apple Silicon的轉(zhuǎn)變,這些GPU設(shè)計也首次出現(xiàn)在Mac上,。從性能的角度來看,,這帶來的蓋板邊比蘋果的CPU還要大。

  蘋果公司長期以來一直以要求GPU性能優(yōu)于一般PC OEM廠商而聞名,。盡管許多英特爾合作伙伴都很樂意甚至在部分15英寸筆記本電腦中都配備了具有Intel UHD圖形和其他基準解決方案的系統(tǒng),,但蘋果公司選擇在其15英寸MacBook Pro中交付獨立的GPU。而且,,當他們無法在13英寸型號中安裝獨立GPU時,,他們將Intel的高級Iris GPU配置與更大的GPU和片上eDRAM緩存結(jié)合使用,從而成為這些功能更強大的芯片的唯一常規(guī)客戶,。

  因此,,一段時間以來,蘋果一直希望獲得比英特爾默認提供的更好的GPU性能,。通過切換到自己的芯片,,Apple最終可以通過建立具有他們想要的所有GPU性能的筆記本電腦SoC來賺錢,。

微信圖片_20201118104907.jpg

  同時,與向Apple Silicon過渡的CPU方面不同,,圖形編程的高級性質(zhì)意味著Apple幾乎不依賴于開發(fā)人員,,就可以立即準備通用應(yīng)用程序以利用Apple的GPU??梢钥隙ǖ氖?,原生的CPU代碼仍將產(chǎn)生更好的結(jié)果,因為幾乎沒有人聽說過純粹受GPU限制的工作負載,,但是現(xiàn)有的Metal(甚至OpenGL)代碼現(xiàn)在可以在Apple的GPU上運行,,這意味著它立即使所有游戲和其他受GPU約束的工作負載受益。

  至于M1 SoC的GPU,,毫不奇怪,,它看起來很像A14的GPU。但蘋果對設(shè)計進行了一些調(diào)整,,以適應(yīng)Mac的敏感性(例如,,各種GPU紋理和表面格式),但總的來說,,差異是在API級別上抽象出來的,。

  總體而言,隨著M1達到A14但更大,,Apple已將其4核GPU設(shè)計從該SoC擴展到了M1的8核,。但與CPU時鐘速度相比,我們對GPU時鐘速度的了解甚至更少,。

  因此,,目前尚不清楚蘋果是否真的提高了這些速度;但是如果GPU時鐘沒有提高,,我會感到有些驚訝,。總體而言,,按照智能手機標準,,A14的4核GPU設(shè)計已經(jīng)非常強大,因此8核設(shè)計就更是如此,。M1的集成GPU不僅旨在超越AMD和Intel的集成GPU,,他們甚至還瞄準了獨立GPU。

微信圖片_20201118104910.png

  最后,,應(yīng)該指出的是,,Apple為M1提供了兩種不同的GPU配置。Mac Mini和MacBook Pro的芯片均啟用了所有8個GPU內(nèi)核,。同時,,對于Macbook Air,它取決于SKU:入門級型號具有7核配置,,而更高級別的型號具有8核,。這意味著入門級Air可獲得最弱的GPU(比完整的M1落后約12%)。

  讓我們開始了解GPU性能,,讓我們從GFXBench 5.0開始,。這也是我們筆記本電腦評測的常規(guī)基準之一,因此它為我們提供了一個很好的機會,,將基于M1的Mac Mini與Mac生態(tài)系統(tǒng)內(nèi)外的各種其他CPU / GPU組合進行比較,。

  總體而言,這并不是一個完全公平的測試,,因為Mac Mini是小型臺式機,,而不是筆記本電腦,但是由于M1是筆記本電腦專用芯片,,因此至少可以使我們了解M1在達到最佳狀態(tài)時的性能,。

  總體而言,M1的GPU在這里非常強大,。在正常和高設(shè)置下,,它都遠遠領(lǐng)先于其他集成GPU,甚至是獨立的Radeon RX 560X,。只有到了NVIDIA的GTX 1650更強的GPU時,,M1才漸落下風(fēng)。

  順便說一句,,我還通過Rosetta自由運行了基準測試的x86版本,,以了解性能損失。至少在GFXBenchAztec Ruins中沒有,。GPU的性能與本機二進制文件和二進制轉(zhuǎn)換幾乎完全相同,。

微信圖片_20201118104918.png

  最后,我們以完全愚蠢的合成基準快速瀏覽了更廣闊的領(lǐng)域,,我們有了3DMark Ice Storm Unlimited,。由于Apple Silicon Macs能夠運行iPhone / iPad應(yīng)用程序,因此我們能夠通過運行iOS版本首次在Mac上運行此基準測試,。這是為OpenGL ES 2.0時代建立的非常古老的基準,,但有趣的是它的性能甚至比GFXBench好。Mac Mini的性能恰好足以滑過配備GTX 1650的筆記本電腦,,盡管這不會經(jīng)常發(fā)生,,但它顯示了M1的強大功能。

微信圖片_20201118104921.png

微信圖片_20201118104924.png

  為蘋果新Mac的發(fā)布而更新的另一個GPU基準是BaseMark GPU,。這不是我們的常規(guī)基準測試,,因此我們手頭上沒有其他非Mac筆記本電腦的分數(shù),,但是它使我們可以更進一步地了解M1與其他Mac GPU產(chǎn)品的比較。

  2020年的Mac Mini仍然領(lǐng)先宇2018年基于Intel的Mac Mini,,就此而言,,它也比配備Radeon Pro 560的2017年MacBook Pro至少快50%。當然,,較新的MacBook Pro會做得更好,,但是請記住,這是一個集成的GPU,,整個芯片比MacBook Pro的CPU消耗的功率更少,,因此不必擔心獨立的GPU。

  最后,,將理論付諸實踐,,我們有了《Rise of the Tomb Raider》。該游戲于2016年發(fā)布,,具有適當?shù)腗ac端口和內(nèi)置基準,,使我們能夠在游戲場景中查看M1并將其與其他Windows筆記本電腦進行比較。誠然,,這款游戲的年齡稍大一些,,但其性能要求與M1旨在提供的性能非常匹配。最后,,應(yīng)該指出的是,,這是x86游戲,尚未移植到Arm上,,因此游戲的CPU端通過Rosetta運行,。

  在我們的768p Value設(shè)置下,Mac Mini在這里提供了超過60fps的速度,。它再次大大領(lǐng)先于2018年基于Intel的Mac Mini以及該堆棧中的所有其他集成GPU,。即使是15英寸的MBP及其Radeon Pro 560仍然落后于Mac Mini 25%以上,Ryzen筆記本電腦和Radeon 560X最終要與Mac Mini保持一致,。

  同時,,通過“發(fā)燒友”設(shè)置將事情提高到1080p時,發(fā)現(xiàn)基于M1的Mac Mini仍提供不到40fps的速度,,并且比上述Ryzen + 560X系統(tǒng)高出20%以上,。這確實使Mini遠遠落后于GTX 1650-Rosetta和常規(guī)API效率低下可能起了一定作用-但它表明了擊敗Apple集成GPU所需要的能力。Mac Mini以39.6fps的速度可以在1080p上以良好的圖像質(zhì)量設(shè)置進行播放,,并且相當容易地降低分辨率或圖像質(zhì)量以使其恢復(fù)到60fps以上,。全部在集成GPU上。

  最終,,這些基準測試非常有力地證明了M1的集成GPU將不辜負蘋果公司在高性能GPU方面的聲譽,。蘋果公司為Mac推出的首個Apple內(nèi)置GPU的速度明顯快于我們能夠使用的任何集成GPU,,并且無疑將為筆記本電腦的GPU性能樹立新的高標準。

  根據(jù)蘋果自己的die照片,,很明顯,,他們將M1模具的相當一部分用于GPU和相關(guān)的硬件上,其收益是可以與低端獨立GPU媲美的GPU,。鑒于M1只是未來的基線,蘋果將需要更強大的GPU用于高端筆記本電腦和其余臺式機,,看到基線的GPU時蘋果及其開發(fā)者生態(tài)系統(tǒng)可以做什么將非常有趣即使是最便宜的Mac,,其性能也很高。




本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章,、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者,。如涉及作品內(nèi)容,、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,,以便迅速采取適當措施,,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118,;郵箱:[email protected],。