正如我們最近指出的那樣,,最近幾個月來,Arm服務器處理器領域發(fā)生了一些動蕩和變化,。無論發(fā)生了什么,,Ampere Computing都在其路線圖上全速前進,并且為Marvell和被高通收購的Nuvia感到高興,。
雖然,,Marvell并沒有真正公布它的退出,但是去年夏天和秋天,,他們一直在向門口走去,。該公司在Hot Chips會議上披露了96核,384線程的“ Triton” ThunderX3芯片服務器芯片的摘要和速度,,他們在八月對其進行了深入探討,。但九月底,Marvell則開始討論針對客戶的半定制芯片業(yè)務,,該公司表示,,ThunderX3將僅作為半定制部件提供,僅通過直接互動進行銷售,,不會以向公眾公開并向所有買家開放的廣泛SKU堆棧發(fā)布,。換而言之,Marvell完全取消了ThunderX3芯片(盡管所有知識產(chǎn)權都已完成),,而且公司不少的設計團隊已轉到Microsoft,據(jù)傳,,微軟將在設計自己的服務器芯片同時,,會與Ampere Computing合作。
Ampere Computing是由凱雷投資集團(Carlyle Group)資助的重組和振興的Arm服務器CPU?,,它吸收了Applied Micro及其“ Skylark” X-Gene 3項目的知識產(chǎn)權,,并增加了一大堆來自英特爾的芯片設計師和營銷人員——英特爾前總裁Renee James就是該公司的首席執(zhí)行官。他們匯總了Altra Arm系列服務器處理器和未來幾年的路線圖,。
80核的“ Quicksilver” Altra芯片是Ampere Computing的第一個自主研發(fā)的芯片,,它遵循的理念是:為內核提供無線程和絕對確定性的性能,而與此相反,,所有這些時鐘,,功耗縮放和線程化都可能干擾性能的可重復性,而128核的“Mystique” Altra Max處理器今年正在開發(fā)中,。這些芯片都在臺積電的7納米工藝上生產(chǎn),,代號為“ Siryn”的后續(xù)芯片也正在推進中,該芯片將于2022年問世,,并采用臺積電(TSMC)的5納米晶體管制造技術,。
在這種情況下,,我們與Ampere Computing產(chǎn)品高級副總裁Jeff Wittich進行了一番交談。議題涉及了Nuvia,,以及這一切對于數(shù)據(jù)中心和邊緣的Arm服務器可能意味著什么,。
我們只是在這里猜測,也許Nuvia試圖做的事情在客戶端設備上會很好地運行,,但在服務器上可能不是那么好,,因此,高通以14億美元的價格收購了Nuvia,,以構建其Snapdragon處理器,。
“我們談論了很多事實,我們的架構就是要通過大量內核進行擴展,,每個內核都具有良好的性能,,因為如果內核是您的計算單元,那么在云中就很有意義了,?!保琖ittich解釋道,?!拔乙恢闭J為,Nuvia一直在談論的設計要點沒有多大意義,,因為它涉及一些相當大的核心,,這意味著它們將無法擴展以創(chuàng)建高性能云。高通大概可以將其用于其他應用,,在那些領域這可能很有意義,,并且可以證實我們各自的設計要點,例如Apple的M1,,這對客戶來說是一個很好的設計,。兩者對我們來說都是非常互補的:它們可以擁有真正高性能的客戶端設計,,并且可以在云中使用Ampere,。”
現(xiàn)在的問題是,,誰將垂直集成他們的云,,設計自己的CPU和DPU以及其他類型的加速器,誰將從第三方購買零件,,設計系統(tǒng)并將其運送到ODM進行制造,?Amazon Web Services絕對希望控制其許多服務器計算的命運,但作為托管于數(shù)百萬公司的云應用程序,,這些僅適用于內部工作負載或輔助工作,,例如DPU或所需的一小部分基礎Arm服務器具有更好的性價比,,并具有可在其上運行的軟件堆棧。
超大規(guī)模生產(chǎn)者和云構建者可能會設計和外包自己的Arm服務器芯片,,或者此時可能會落后于Ampere Computing,。(Marvell可以做一些非常有趣的事情,并創(chuàng)建一個開源ThunderX3芯片,。但是我們不會受到威脅……)我們認為,,這些本地計算引擎項目中的某些項目與提供購買商品零件的杠桿作用一樣重要。例如Intel CPU和Nvidia GPU,,因為它們?yōu)榱可矶ㄖ频募軜嬏峁┝烁玫男詢r比,。
但是,正如Wittich所指出的那樣,,我們還沒有看到真正的horizontal Arm服務器CPU玩家,,因此我們不能假定它不會發(fā)生,也無法假定hyperscale和云構建者之間的垂直集成–他們在這些層次上設計和構建自己的服務器,。擁有自己的處理器并擁有絕對控制權–是必要的最終狀態(tài),。
Wittich說:“我認為行業(yè)仍然強烈希望可以在整個數(shù)據(jù)中心空間利用CPU?!?“這就是英特爾正在做的事情,,這就是AMD在做的事情。從來沒有哪位Arm玩家真正建造過具有最高性能并獲得吸引力的Arm服務器,,并堅持使用足夠長的時間來贏得勝利,。這就是為什么有時會有這種引力來建立自己的原因。我很難相信horizontal的玩法會帶來很多意義并創(chuàng)造大量價值,,尤其是在使用X86處理器的生態(tài)系統(tǒng)創(chuàng)建中,,而對于Arm處理器而言,這沒有什么價值,。我認為,直到Ampere Computing交付,,堅持并真正被采用之后,,沒人能接受?!?/p>
甲骨文是Altra處理器的第一個大買家,,它將在同名的云中進行部署,另外一個大云將在“未來幾個月內”部署Altra芯片,,并且“其他一些公告正在等待中”,。
據(jù)Wittich稱,在美國和中國,,還有其他Design Win,。在過去的幾個月中,,客戶和基準測試者一直在使用“ Mount Jade”兩路Altra系統(tǒng),此外還有更多的服務器制造商,。例如來自技嘉的單路Mount Snow“服務器,。
Mount Jade系統(tǒng)由臺灣ODM WiWynn制造。Mount Jade機器具有一對頂級Q80-33處理器,,這些處理器具有80個運行于3 GHz的內核并具有散熱設計,。根據(jù)Wittich的說法,這些設備每臺功耗250瓦,,但在運行SPECint_rate等基準測試時,,功率更高達210瓦。
Mount Jade系統(tǒng)總共具有Altra 160內核,,由八個內存控制器和每個插槽最多十六個記憶棒提供數(shù)據(jù),,最多可容納8 TB主內存,并已滿載256 GB DDR4記憶棒,。最大速度為3.2 GHz,。(這臺機器配置32 GB或64 GB記憶棒的可能性更大,每單位容量的記憶棒便宜得多,,并且對于任何給定數(shù)量的內存插槽,,它們都可以將相同的帶寬傳入和傳出CPU。Mount Jade系統(tǒng)具有一個Open Compute 3.0 PCI-Express 4.0 x16插槽,,以及兩個其他PCI-Express 4.0 x16插槽,,這些插槽能夠支持以25 Gb / sec的速度運行CCIX協(xié)議以進行加速器耦合。(我們想知道這些CCIX插槽是否也可以用于NUMA耦合以創(chuàng)建八插槽系統(tǒng),。)該機器還具有六個PCI-Express 4,。其他外圍設備的0 x8插槽。該系統(tǒng)具有一對2,000瓦電源,。
重要的是,,未來的128核Mystique處理器將與當前的80核Quicksilver部件插入到Mount Jade和Mount Snow系統(tǒng)的相同插槽中。未來的Siryn處理器不會出現(xiàn)這種情況,,后者將支持不同的內存和I / O(可能是DDR5內存和PCI-Express 5.0外設),,但Ampere Computing并未這么說–因此需要使用不同的插槽。
還有一件事:128核的Mystique Altra Max處理器正在提供樣品,,并開始銷售,,而超大型和云構建商的早期客戶現(xiàn)在正在使用它們。到今年年中,,它們的數(shù)量應該會達到極限,。
”我認為當人們看到要提供基于Altra的服務的提供商列表時,人們會感到震驚,,“ Wittich說道,。
我們當然希望如此,,并且我們希望其中之一是Microsoft。因此,,Marvell基本上將其封存為ThunderX3,。但這只是一個猜測,也許微軟會在”開放計算項目全球峰會“上說更多,。