《電子技術應用》
您所在的位置:首頁 > 電子元件 > 業(yè)界動態(tài) > ?云計算巨頭迎戰(zhàn)服務器芯片市場

?云計算巨頭迎戰(zhàn)服務器芯片市場

2022-02-14
來源: 半導體行業(yè)觀察
關鍵詞: 云計算 服務器芯片

  服務器芯片市場是芯片制造領域最大,、增長最快和最具競爭力的市場之一,。

  近年來,,隨著向云計算的轉變,,數據中心的需求猛增,,對服務器芯片的需求變得更加迫切,。

  對于不同的云服務廠商來說,,由于所構建的生態(tài)有所不同,,因此對芯片性能需求存在著差異,。在這種情況下,定制的芯片或許能夠讓他們更好地發(fā)揮出生態(tài)的價值,。而就目前的市場情況來看,,市場還沒有給予足夠多的選擇,自研芯片也就成為了一條發(fā)展路徑,。

  人工智能芯片設計自動化后,,引發(fā)了新芯片設計的狂潮。如今,,自研芯片也成為了云服務商的重要布局之一,。

  

  云計算巨頭紛紛入局

  亞馬遜

  亞馬遜可以說是最開始自研服務器芯片的云服務廠商。

  2015年,,亞馬遜花3.5億美元收購了以色列芯片公司Annapurna labs,。屆時起,亞馬遜就在為其云基礎設施設計開發(fā)定制芯片,,于2018年發(fā)布了第一代Amazon Graviton 處理器,,支持該處理器的A1也成了其云服務AWS上第一個基于Arm的實例。第一代Graviton處理器基于Cortex-A72內核,,最大時鐘頻率達到2.3GHz,,節(jié)省45%的成本使其成了很多入門用戶的首選。

  2020年,,亞馬遜發(fā)布了第二代自研處理器Graviton2,,這款處理器基于64位的Arm Neoverse N1內核,核心與Cortex-A76近乎類似,,但加入了不少針對基礎設施工作的強化特性,。Graviton2采用了臺積電的7nm制程工藝,集成了64顆核心,,在CMN-600 Mesh互聯技術的支持下可以做到2TB/s的帶寬,。

  與第一代Graviton相比,,Graviton2提供4倍的計算核心,7倍的計算性能,?;贕raviton2的實例與同等級的X86實例相比,性能要高上40%,,成本卻要低上20%,。不僅如此,Graviton2也成了AWS最省電的處理器,,同樣的能耗下,,Graviton2的性能要比AWS中的其他處理器高上2-3.5倍。

  有數據顯示,,在Graviton2的加持下,,AWS在 2021服務器領軍榜中登上Arm架構服務器處理器榜首,在市場,、價格優(yōu)勢,、性能、可靠性和創(chuàng)新5個評價維度都是第一名,。  

  目前,,Graviton已經廣泛商用。2021年初,,AWS宣布Graviton 2正式落地中國,。

  2021年12月,亞馬遜云科技發(fā)布了最新通用服務器芯片Graviton 3,,該芯片采用5nm工藝,,擁有64個核心和550億晶體管,支持bfloat16,、PCIe 5.0等最新技術,,相較Graviton2 性能提升了25%,在科學計算,、機器學習和媒體編碼工作負載則能夠提供2倍的性能,。此外,在同樣性能下,,Amazon Graviton3與X86實例相比可節(jié)省60%的能耗,。

  事實上,過去二十年里,,處理器提升性能的方法始終圍繞的是提高頻率和增加核心數量,,提高頻率意味著功耗持續(xù)上升,也帶來數據中心散熱等系列需求,不僅讓客戶使用成本上升,,也不符合如今全球綠色減排的大趨勢。因此,,亞馬遜云科技的思路是圍繞客戶對于算力需求的提升和降低功耗的要求,,謹慎地提升處理器頻率,而是增加指令并行,、內存帶寬,,以實現處理器性能提升和能耗降低。

  以由Amazon Graviton3處理器支持的Amazon C7g實例為例,,作為云計算中第一個采用最新DDR5內存的實例,,與基于Graviton2的實例相比,提升50%的內存帶寬,,達到300 GB/s,,使得其在科學計算等內存密集型應用表現大幅提升。

  從Amazon Graviton3公布的參數來看,,無疑在云計算行業(yè)中屬于頂級,。Graviton迭代3代,已在市場競爭中站穩(wěn)腳跟,。根據亞馬遜云科技介紹,,如今已經有超過20個托管服務基于Graviton,且仍在持續(xù)增加中,,并且Graviton3很快會進入到中國市場,。

  AWS 并不是唯一一家自己設計芯片的云計算廠商。谷歌擁有諸如張量處理單元,,微軟也在摸索構建基于Arm的芯片,,用于Azure服務器。

  谷歌

  近些年,,英偉達在數據中心領域持續(xù)發(fā)力,,可圈可點。其GPU執(zhí)行并處理了一些與人工智能相關的服務器大數據中心任務,。面對巨大威脅的英特爾收購了Altera,,將FPGA技術應用在服務器大數據中心領域,做為反擊,。

  與此同時,,谷歌似乎也找到了另外一種解決問題的新方案。谷歌的這個方案不是采用CPU和GPU這樣的通用芯片,,也不是FPGA技術,,而是使用專用芯片,定制的TPU芯片,用于谷歌服務器大數據中心系統(tǒng)自身,。

  谷歌的TPU芯片全稱為Tensor Processing Unit,,也叫張量處理單元。這種芯片非常適合運行tensorflow軟件引擎,,谷歌的深度神經網絡就是依靠tensorflow軟件引擎驅動的,,tensorflow軟件引擎可以通過分析硬件和軟件組成的網絡中的,海量數據來學習如何完成特定的任務,。這款定制的TPU芯片運行神經網絡的效率比其他通用芯片運行神經網絡的效率都高不少,。

  有相關描述稱,谷歌的TPU芯片在機器學習測試中,,超過英特爾至強CPU和英偉達GPU一個數量級,。TPU芯片和其基準測試,都比其他通用芯片快了15倍,,性能提升近30%,。

  2018年,谷歌宣布開放TPU云服務,,允許企業(yè)用戶租用TPU板卡,,用于建立TPU pod的超級計算機網絡。谷歌開放具備人工智能和機器學習能力的TPU云服務,,不僅可以降低企業(yè)用戶對英特爾,、英偉達等通用芯片巨頭的依賴,還可以用更低的成本使用核心計算基礎設施來進行軟硬件的實驗,。

  然而,,谷歌雖然早就開始自研服務器芯片,但其TPU與Argos芯片一個用于張量處理,,一個用于視頻處理,,并非通用計算芯片。2021年谷歌招募了英特爾老將Uri Frank來設計服務器芯片,,很有可能也會選擇拿Arm授權開發(fā)自研核心,。

  微軟

  微軟這邊,其實早在2020年就被曝出要為其云計算服務器開發(fā)定制芯片,。

  近日,,微軟聘請了一位重要的蘋果半導體專家Mike Filippo,進入微軟的云計算部門Azure,,主要從事處理器研發(fā)工作,。

  微軟顯然也在走亞馬遜、谷歌等競爭對手的路線,,準備開發(fā)自己的服務器定制芯片,,為Azure云計算服務提供支持,而蘋果設計師在這方面擁有豐富的經驗。

  據了解,,Filippo在芯片行業(yè)已經工作近26年,。在加入蘋果之前,他在ARM干了10年,,擔任首席CPU架構師,、首席系統(tǒng)架構師和ARM Fellow。他因提升Arm芯片在手機和其他設備中的基礎性能而備受贊譽,,曾負責開發(fā)過Cortex-A76,、Cortex-A72,、Cortex-A57以及即將推出的7nm+和5nm芯片,。在英特爾工作期間,Filippo是24核,、96 線程,、超算和高性能計算SoC的首席架構師。

  對微軟來說,,蘋果M系列芯片的成功,,證明了ARM架構的處理器能夠在實現高性能的情況下同時保持低功耗的優(yōu)勢,這讓微軟極有可能也從ARM芯片入手,。

  微軟最近幾年加大了芯片工程師的招聘力度,,比如從英特爾、AMD,、英偉達等芯片公司挖人,。對于長期合作伙伴英特爾和 AMD 來說,微軟自研服務器芯片可能是一個令人不安的消息,,這兩家公司都為 Azure 服務器提供了芯片,,這一轉變可能會削弱英特爾和AMD的地位。


  本土云廠商的自研之路

  據IDC的《全球及中國公有云服務市場(2020年)跟蹤》報道,,阿里云全球市場份額為7.6%,,僅次于亞馬遜AWS 46.8%、微軟Azure 14.2%,,是全球第三大公有云服務商,;國內市場份額為38.5%,遠高于騰訊云12.7%,、華為云11.1%,,是中國第一的云服務商。

  2018年4月,,阿里收購了中天微系統(tǒng)有限公司,,與達摩院自研芯片業(yè)務整合成為獨立芯片公司平頭哥。2019年7月,平頭哥發(fā)布了RISC-V處理器玄鐵910,,當年推出云端AI推理芯片含光800,。此后兩年,平頭哥并無新款芯片發(fā)布,。

  2021年10月,,阿里云發(fā)布了最新通用服務器芯片倚天710以及自研服務器磐久。

  據介紹,,倚天710采用5納米工藝,,基于ARM最新發(fā)布的ARMv9架構,單芯片容納高達600億晶體管,,128個CPU核心,,主頻最高達到3.2GHz。就數據來看,,倚天710在SPECInt2017基礎測試中,,倚天710跑分達到440分,超過行業(yè)標桿20%,。搭載芯片倚天710的磐久服務器將在今年部署,,均為阿里云自用,無對外銷售計劃,。

  倚天710項目立項于2019年,,平頭哥承擔了芯片設計工作,臺積電是生產代工廠商,。這是阿里造芯計劃里,,截至目前攻克下的最艱難的一役。

  阿里云自研服務器芯片,,結合了諸多長中短期內外形勢考慮,,是阿里云“一云多芯”策略,以及“做深基礎”既定戰(zhàn)略的延伸與落地,。

  隨著上云成為了企業(yè)數字化轉型的必選項,,不同企業(yè)的計算需求也正在變得多樣化。一些云計算客戶既想要英偉達,、ARM芯片的AI推理能力,,也想要X86芯片的安全計算能力,還希望云成本能進一步降低,。

  在過去,,同時滿足這些需求,通常要選擇多云協同,,為ARM集群,、X86集群分別建設存儲與網絡的配套設備,。但這種做法成本高,且浪費資源,,不同類型CPU共存還會帶來多云管理問題,。

  阿里云應對這些問題的策略是“一云多芯”,也就是用一套云操作系統(tǒng)兼容X86,、ARM,、RISC-V的硬件服務器集群,將不同架構CPU的算力標準化,,向下屏蔽硬件差異性,,向上提供一致性服務。

  阿里云智能總裁,、達摩院院長張建鋒表示,,倚天710是阿里云推進“一云多芯”策略的重要一步。倚天710芯片和飛天云操作系統(tǒng)的結合,,使得阿里云能夠將領先的芯片設計技術與云場景的獨特需求相結合,,最終實現性能和能效比的突破,并首次實現了從底層芯片到存儲,、網絡,、數據庫系統(tǒng)的全棧自研。倚天710服務器芯片的發(fā)布,也標志著我國在芯片領域再次邁出了關鍵的一步,。

  阿里云之外,,華為自研服務器芯片的動作更早一些。2019年,,華為就推出了自研的用于服務器的ARM架構的芯片鯤鵬920,。在華為的Taishan服務器和華為云的K系列實例中,都用到了這顆處理器,,這也是業(yè)內首個內置直出100GE網絡能力的通用處理器,。

  華為2020開發(fā)者大會上,華為云與計算BG總裁侯金龍表示,,希望用三年的時間讓90%的應用都可以跑在鯤鵬上,。侯金龍表示,5G時代所有的應用都在走上云化,,手機,、平板等端側基于ARM架構,鯤鵬也是基于ARM架構,,云,、端同構后性能可以提升40%,這是鯤鵬與X86架構相比的天然優(yōu)勢,。據悉,,目前華為鯤鵬處理器主要應用于黨政機關,、事業(yè)單位、大型國企和國有銀行的場景中,。

  華為的云服務業(yè)務發(fā)展迅速,,其中之一的因素就是其在存、算,、存,、管、智方面的自研芯片,。在華為的應用一代,、研發(fā)一代、規(guī)劃一代的路線中,,鯤鵬930芯片原本預計在2021年就會面世,,然而由于供應鏈的限制,如今已然成了未知數,。


  云廠商為何紛紛自研芯片,?

  作為云計算服務提供商,亞馬遜,、谷歌,、微軟、阿里等公司是數據中心芯片的最大買家之一,,他們在芯片上構建服務,,然后將計算能力出租給數百萬客戶。

  過去十多年來,,英特爾在服務器市場方面一直處于領先地位,,其每年推出的至強處理器幾乎已等同于服務器、數據中心的代名詞,。但是,,在英特爾不斷延遲其10納米芯片制造工藝之后,讓其他廠商有機會在數據中心計算市場CPU領域向其發(fā)起挑戰(zhàn),。

  據日本瑞穗證券報告,,英特爾的下一代Sapphire Rapids芯片可能會延遲到2022年第三季度發(fā)布(此前預計在2022年第二季度正式推出)。Sapphire Rapids采用“Intel 7”的7納米制程,,并通過EMIB(嵌入式多芯片互連橋)連接在一起,,與其他封裝技術相比,EMIB提供卓越的吞吐量和延遲,,缺點是成本較高,。盡管英特爾自行處理多數封裝作業(yè),但關鍵原料短缺,,影響生產,。由于Sapphire Rapids是英特爾首次全面采用EMIB技術的Xeon芯片,,預計售價將提高。

  報告還稱,,英特爾第三代Xeon服務器芯片“Ice Lake”的產量今年將增長50%,。同時為了維持市場占有率,英特爾不會調漲Ice Lake的售價,。這種方式將有助于阻止AMD繼續(xù)在數據中心芯片市場攻城掠地,。

  另一邊,由于晶圓代工及封測成本大增,,有消息稱AMD 的EPYC服務器芯片將漲價10%~30%,。AMD 的下一代服務器處理器EPYC 7004系列有兩種版本“Genoa”和“Bergamo”,目前Genoa已經在向客戶提供樣品,,預計在2022年內推出,,Bergamo則預計將會在2023年推出。屆時,,服務器芯片的戰(zhàn)況將更趨白熱化,。

  浪潮系統(tǒng)副總Dolly Wu預測,AMD的第三代EPYC處理器Milan和第四代EPYC的表現將繼續(xù)優(yōu)于英特爾,,協助AMD維持在數據中心的爆炸性成長,。不過,AMD供給吃緊情況比英特爾更嚴重,,或將讓AMD無法更快奪得更多市場,。

  綜合來看,,無論是英特爾芯片的延遲發(fā)布,,還是AMD可能的漲價,種種行為都在某種程度上剝奪著云服務廠商等下游企業(yè)的話語權和自身的發(fā)展節(jié)奏,。

  這也是云服務廠商為什么紛紛開始自研芯片的一方面原因,,云廠商自研服務器芯片可以減輕對第三方供應的依賴;另一方面是自研芯片可以降低成本,,自研芯片能夠讓云服務商在每個業(yè)務流程中做到效率與成本的最優(yōu)化,。此外,自己的芯片更適合他們的某些需求,,與英特爾,、AMD等廠商提供的現成芯片相比,具有成本和性能優(yōu)勢,。當業(yè)務規(guī)模持續(xù)增加,、自研芯片的必要性就愈發(fā)突出。

  亞馬遜云巨頭負責Graviton實例的高級首席工程師Ali Saidi表示,,構建自己的芯片能夠在各種層次上進行更快的創(chuàng)新,,提高安全性和靈活性,,并提供更多價值。

  “自研芯片可以控制項目的開始,、進度和交付的進程,;可以將硬件和軟件并行開發(fā),并使用大規(guī)模的云來進行構建芯片所需的所有模擬,。這意味著創(chuàng)新速度更快,,可以跨越傳統(tǒng)界限?!?Saidi補充道,。

  不過自研芯片并不等于就不采用其他供應商的芯片,而是為用戶提供多樣性的選擇,,給予用戶充分的選擇權,,用戶完全可以根據自身工作負載和業(yè)務需求來選擇合適的計算實例。

  以亞馬遜為例,,目前亞馬遜云科技不僅采用英特爾,、英偉達、AMD的CPU與GPU計算平臺提供不同用途的云端服務,。另一方面,,也不忘追求計算、儲存,、網絡的硬件芯片技術自主,,使其能夠提供更經濟實惠的云端服務。

  阿里云同樣如此,,X86芯片在阿里云的數據中心也是主流,,采用了英特爾、英偉達,、AMD的芯片產品,。平頭哥市場副總裁高慧強調,倚天710并非要替代市場上同類產品,,主要還是為了解決云計算專業(yè)場景下的專業(yè)需求,,為云上企業(yè)提供多樣性選擇。

  張建鋒在接受媒體采訪時也稱,,阿里云業(yè)務有明確邊界,,只承擔硬件設計工作,目的在于讓云計算的底層硬件更符合自身業(yè)務需求,。阿里云還將繼續(xù)與英特爾,、英偉達、AMD,、ARM等合作伙伴保持密切合作,,為客戶提供更多選擇,。

  

  ARM服務器芯片陣營卷土重來?

  至此,,全球頭部的云服務廠商中,,大多數都開發(fā)出或投入了自研芯片的開發(fā),更關鍵的是,,各家都無一例外地都選擇了ARM作為芯片架構,。

  目前服務器芯片架構領域,X86,、ARM,、RISC-V是幾個可選項。其中X86架構是英特爾的領地,,也是目前服務器芯片架構的主流,。全球幾乎90%以上的服務器芯片架構為X86架構。

  ARM架構則屬于ARM公司,,ARM架構此前普遍應用在手機通用芯片領域,,在服務器領域也早有嘗試。過去這些年,,ARM服務器CPU一度被諸多行業(yè)人士看好,,被認為有希望取代X86,或侵蝕部分X86服務器CPU市場,。

  AMD,、高通、博通,、Marvell,、惠普等一大批知名公司相繼參與,想要ARM在服務器領域復制在智能手機領域的成功,。不過,,從技術史上看,ARM 通用服務器之路并不平坦,。惠普,、AMD,、Marvell、博通等美國廠商的ARM架構芯片均未能讓其成為市場主流,,高通于2018年初砍掉內部的服務器芯片部門,,一些小廠在推出幾款ARM服務器CPU之后,就聽不到后續(xù)消息了,。國內方面,,華芯通做了幾年后也關門了,,ARM服務器一度陷入低谷。

  目前,,全球服務器芯片的架構仍然以X86獨大,,ARM與其他架構份額較小。2021年9月,,IDC發(fā)布的《全球服務器季度跟蹤報告》顯示,,X86服務器收入占全球服務器收入的90.3%,非X86(包括ARM,、RISC-V等)服務器收入僅占全球服務器收入的9.7%,。

  微信圖片_20220214104405.jpg

  數據來源:IDC

  X86架構無法撼動地位很大原因是其軟件生態(tài)已經非常龐大和豐富,從軟件到OS都已經非常固定,。不過,,X86服務器芯片誕生于傳統(tǒng)IT階段,并非完全根據云上負載設計,。在云計算場景下,,不能滿足一些專業(yè)場景的專業(yè)需求。

  平頭哥技術戰(zhàn)略副總裁高慧曾在接受采訪時表示,,云計算需要降低計算成本,。基于ARM架構的處理器通常核心更多,、能耗更低,。理論上說,在實現量產的前提下,,基于ARM架構的服務器芯片和X86芯片相比,,制造成本、運營成本都會更低,。

  因此,,在云時代這個固有的格局正在改變,這就為ARM架構芯片提供了時代機會,。不過ARM在服務器領域目前仍處于起步階段,,份額低,軟件生態(tài)也不完善,,但基于ARM架構的服務器芯片通常具有體積小,、能效比強,發(fā)熱量低,,且價格相對低廉的特點,。數據中心是能耗、占地大戶,搭載ARM架構芯片的服務器可以緩解上述問題,。以亞馬遜,、阿里云等為代表的少數有能力實現“自產自銷”的云服務廠商,是有實力和能力去“消化”自己設計的ARM服務器CPU,。

  因此,,在云計算巨頭自研芯片的加持和引領下,ARM服務器的份額正在增加,。

  根據IDC此前發(fā)布的數據顯示:2020年第三季度,,基于Arm的服務器同比增長了430.5%,2020年第四季度同比增長了345%,,盡管基數很小但仍在增長,。當前,Arm架構處理器在服務器市場的應用正處于快速上升時期,,另據Statista預測,,到2028年,Arm架構處理器在數據中心和云的市場份額將從2019年的5%增長到25%,,市場規(guī)模將達到580億美元,,比2019年的14倍還多。

  企業(yè)們都瞄準了數據中心的巨大市場,,結合其技術特性和成熟度,,ARM架構在一些互聯網巨頭公司頗受歡迎,因此基于ARM架構來研發(fā)新的服務器芯片正在成為更多廠商的選擇,,包括字節(jié)跳動在內的不少互聯網公司都表示將開發(fā)ARM服務器CPU,。

  根據TrendForce集邦咨詢研究顯示,近年全球企業(yè)同時面臨著快速變化的市場需求,,以及疫情的高度不確定性,,促使企業(yè)對于云端服務的需求于近兩年持續(xù)增溫,無論是人工智能抑或是新興科技的采用,,云端服務憑借較彈性的成本優(yōu)勢成為多數企業(yè)的優(yōu)先考量,。預計2021年全球服務器出貨成長率將逾5%。

  Arm架構在云端的興起,,迎合了大數據和云計算時代對特定算力的需求,,GPU、AI芯片均受益于此,。除上述提到的云廠商外,,包括富士通、Ampere,、飛騰等廠商也均推出了Arm架構服務器芯片。

  ARM服務器CPU正在“卷土重來”。

 

  寫在最后

  在云服務上,,自研芯片帶來的成本降低是巨大的,。云服務頭部廠商基本定型之后,價格戰(zhàn)就成了拉攏新客戶留住老用戶的必經之路,,Arm服務器芯片帶來的高功效意味著他們可以推出定價更低的實例,。

  能夠看到的是,Arm在服務器芯片領域的存在感已經越來越強,,自研芯片的方案對于云服務廠商擁有難以抗拒的吸引力,。

  一定程度上,以亞馬遜Graviton,、阿里倚天710為代表服務器芯片的成功,,證明Arm架構在云服務市場正逐步蠶食英特爾處理器的市場份額。

  縱觀整個服務器芯片市場,,AMD步步緊逼,,英特爾壓力山大,而Arm陣營也正在虎視眈眈的積蓄著力量,。未來服務器市場的競爭局面將會越來越復雜,,同時也給后來者提供了更多機會。

  



微信圖片_20210517164139.jpg

本站內容除特別聲明的原創(chuàng)文章之外,,轉載內容只為傳遞更多信息,,并不代表本網站贊同其觀點。轉載的所有的文章,、圖片,、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯系確認版權者,。如涉及作品內容,、版權和其它問題,請及時通過電子郵件或電話通知我們,,以便迅速采取適當措施,,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118,;郵箱:aet@chinaaet.com,。