落花有意隨流水,,流水無情戀落花,。英特爾和蘋果的良好關系,,可以一直追溯到 2005 年,,彼時這兩家巨頭在 Mac、一體機等桌面產品線合作較為融洽,,但 2010 年以后,,英特爾“擠牙膏”似的產品升級策略以及 2020 年蘋果 M1 的全新登場,讓他們逐漸形同陌路,,甚至最終分道揚飆,。
不過前不久英特爾新任 CEO 帕特·基辛格公開表示想追回“前任”,放出豪言要造出一款比 M1 更能打的芯片,,以爭取和蘋果再續(xù)前緣,,結果話音未落就遭蘋果光速打臉:10 月 19 號蘋果炸場發(fā)布會上基于 ARM 架構的 M1 Max 閃耀全場,,完爆各種 X86 架構的處理器,用實力告訴英特爾什么叫“慢擠牙膏一時爽,,追回前任火葬廠”,,更向世界證明比 M1 更強的處理器也還是出于蘋果之手。
而令筆者更為欣喜的是,,M1 Max 竟然還不是如今 ARM 架構處理器最為高光的時刻,,隔壁平頭哥半導體在云棲大會上拿出的倚天處理器,更是完美詮釋了什么叫“大就完了”,。倚天 710 中集成的晶體管比 M1 MAX 還多 30 億,,此外倚天還搭載了最新的 V9 系列 ARM 核心,在云計算領域強到“爆炸”,。
在桌面與云方面接連遭受暴擊,,幾乎讓英特爾的 X86 進入了病危狀態(tài),后續(xù)再擠牙膏就沒法翻盤了,。好在基辛格接手之后,,英特爾已逐漸開展了 IDM2.0 的全面轉型,經(jīng)歷過這個灰色星期三之后,,英特爾會有什么回應也值得我們期待,。不過這都是后話了,我們還是先來看看 M1 Max 到底有多強,。
M1 Max 到底有多強
M1 Max 搭建了一個 10 核心 CPU,,其中包括 8 個大核,2 個小核,,MAX 相較于 M1 初代性能直接提升 70%,;GPU 性能提升了 3 倍;最令人驚艷的指標是統(tǒng)一內存管理技術,,即內存與顯存共用統(tǒng)一管理,;M1 MAX 內存帶寬最高可達 400GB/s,是 M1 芯片的 6 倍,,已經(jīng)達到了新一代游戲主機的水平,。
據(jù)筆者所知,目前唯一一個能在內存帶寬上與 M1 Max 一叫長的是英偉達 Grace 處理器,。通過 NVlink 技術,,Grace 中 CPU 到 GPU 的內存帶寬可達 900GB/s。不過老黃的 Grace 目前還在 PPT 上沒下來,,但是搭建 M1 Max 的 Mac Pro 已經(jīng)開始接受預訂并馬上就要與用戶見面了,,因此可以說 M1 Max 在內存帶寬方面幾乎是現(xiàn)階段地表最強。
而且最關鍵的是 M1 Max 的功耗控制還很好,,幾乎是在沒有功耗,、散熱問題的性能下完成性能成倍的提升,。目前的已而可謂是人是鬼都在秀,只有牙膏堿在挨揍,。
M1 Max 為何這么強
由于目前只有發(fā)布會跑分圖的資料,,而且以蘋果的調性也根本不會把芯片手冊拿出來,想進一步了解 M1 Max 估計還是要等大神把 Linux 移動到 Mac Pro 上去才行,。
CPU 和 GPU 的通信能力加強,,提升概率 100%。我們內存與顯卡進行統(tǒng)一管理,,可以大大提高 CPU 與 GPU 的通信效率,,從而增強圖像處理、3D 建模等任務的處理效率,。CPU 和 GPU 通信速度的重要性可以用 M1 初代的例子來加以說明,,我們知道蘋果 M1 顯存與內存加在一起只有 16G,而 M1 前一代的 Mac Pro 內存是 128G,,光是顯存都與 M1 持平 16G,,不過搭載 M1 的入門版 Mac 在進行圖像處理等任務時,卻要比上一代頂配的 Mac 還要強出近一倍,。而本次發(fā)布的 M1 Max 更是直接將內存帶寬提升到初代 M1 的 6 位,,其性能加強的程度也就可想而知了。正如上文所說英偉達之前發(fā)布的 Grace 處理器也采用了和蘋果比較類似的思路,,相信未來會被英特爾,、AMD 等 X86 廠商借鑒。
譯碼器增強,,提升概率 90%,。目前處理器的流水線一般分為取指、譯碼,、取操作數(shù)等等環(huán)節(jié),,其中譯碼是一個非常重要的環(huán)節(jié)。譯碼器方面 ARM 架構的精簡指令集的確有一定優(yōu)勢,,由于指令都是定長的,,完全可以做出高效的多路譯碼器以提升效率。沒記錯的話之前 M1 應該是四路譯碼,,當時筆者就表示,, M1在譯碼器這方面還有后手,未來還能更秀,,這里筆者大膽預測 M1 Max 的 CPU 應該是能有 6 路指令解碼器,8?op 發(fā)射寬度,,6 路分配,、10 路執(zhí)行端口的指標,。具體如何待最終揭曉。
大小核心的調度升級,。提升概率 70%,。由于 M1 Max 大小核的配比是 4:1,而由于大核比較費電,,而小核又無法應對高性能計算,,因此像 M1 Max 表現(xiàn)這么均衡的處理大概率會用軟、硬結合的高度方案,,比如英特爾在剛剛發(fā)布的 Alder Lake 處理器中搭建的 Thread Director 就是這樣一種軟,、硬結合的核心調度方案,英特爾的做法是在處理器中集成了一個專用的 MCU,,用來監(jiān)控當前處理器內核的運行情況,,能夠監(jiān)測到每個線程的特征,比如它運行什么樣的指令集,、它的性能需求如何等等,。在收集完信息之后,MCU 會將收集到的信息反饋給操作系統(tǒng),,再次操作系統(tǒng)把這些信息與線程調度信息相結合,,判斷是否應該將線程轉移到別的核心上。如果與操作系統(tǒng)結合的好話,,那么一輪調度信息采集工作僅需要 30 微秒就能完成,,而傳統(tǒng)方案調度器可能需要 100 多毫秒才能判斷出結論。由于 Mac OS 與 M1 Max 都是蘋果自己的產品,,因此這個調試方案 Thread Director 更極致,,不過由于英特爾在本次發(fā)布會上沒特別提到調度器方案的提升。
而對這么強的 M1 Max 筆者似乎只能在生態(tài)建設方面給蘋果提出一些建議了,。我們知道英偉達之所以能在 AI 及區(qū)塊鏈方面有著如此出彩的表現(xiàn),,高性能計算框架 CUDA 絕對是居功至偉,正是在 CUDA 的幫助下英偉爾的 GPU 進可以 AI 訓練,、區(qū)塊鏈挖礦,;退可以玩大型游戲,爽得不亦樂乎,。目前蘋果的 M1 Max 最大的短板在于對于游戲的支持一般,,尤其是 3A 級的大作更是很少登陸 M1 系列的平臺。如果未來像《悟空傳》之類的游戲也能首發(fā)在 Mac 系列,,那么 X86 甚至基于 X86 的游戲主機可能都要涼涼,。
M1 Max 影響幾何
成也蕭何,敗也蕭何,,我們知道云平臺最重要的工作是資源進行嚴謹?shù)母綦x,,由于 M1 Max 統(tǒng)一內存管理技術太能打了,,內存與顯存之間的傳輸帶寬太高,因此這也決定了這款處理器很難在虛擬化的云環(huán)境中使用,,所以 M1 Max 短期內帶來的最大沖擊還應該是在于桌面市場,。
但是從長期來看,英偉達收購 ARM 的計劃大概率是要黃了,,我要是庫克是不可能放 ARM 出去的,,就算放猛瑪也不放 ARM,放了 ARM 以后新一代 ARM V9 系列的處理器可能要 gg,,建議黃教主去和 VMware 接觸,,具體詳見《若 ARM 收購不成,英偉達應該轉向 VMware》,。
筆者最大的期待是基于 M1 Max 版的 Linux 趕快遷移出來,,與此同時,平頭哥的倚天有了,,屠龍系列還遠嗎,?