在過去的二十年中,,谷歌比其他任何公司都能證明,,數(shù)據(jù)中心是新的計算機,。這家搜索引擎巨頭曾在2009年通過Urs H?lzle撰寫的論文證明了這種“”warehouse-scale machine“ ”,,現(xiàn)在這個論文的作者之一擔任Google技術(shù)基礎(chǔ)架構(gòu)的高級副總裁,。該文章的另一作者是Luiz André Barroso,,他是Google核心產(chǎn)品的工程副總裁,,在此之前曾是Digital Equipment和Compaq的研究員,。
谷歌的論文及其超大規(guī)模同類產(chǎn)品的興起表明了這種想法的優(yōu)點,,這引起了很多人的關(guān)注,。有趣的是,最近,,英偉達(Nvidia)收購了Mellanox Technology和Cumulus Networks,,以及對Arm Holdings的期望收購都發(fā)現(xiàn)了“數(shù)據(jù)中心就是計算機”漏洞。
在花費了數(shù)十年的時間設(shè)計和完善其宏觀系統(tǒng)之后,,Google便將重心轉(zhuǎn)移到系統(tǒng)的不同部分,,想在摩爾定律的末日下生存下來,,這就需要完成很多創(chuàng)新工作。對我們來說,,將更多的晶體管塞入一塊芯片中會變得更昂貴,,而不是更便宜。
促成這一宣布的重大新聞是,,谷歌已聘請芯片設(shè)計師Uri Frank擔任Googleplex服務(wù)器客戶端設(shè)計工程副總裁,,該芯片設(shè)計師曾在英特爾為客戶計算機開發(fā)過多代片上系統(tǒng)設(shè)備。Google研究員,,現(xiàn)任公司系統(tǒng)基礎(chǔ)架構(gòu)副總裁Amin Vahdat則領(lǐng)導開發(fā)了遍及全球網(wǎng)絡(luò)的人,,該網(wǎng)絡(luò)支撐著Google以及作為其龐大運營核心的數(shù)據(jù)中心級網(wǎng)絡(luò)。日前,,他花了一些時間向thenextplatform解釋了公司為何聘請Frank,,以及為何認為片上系統(tǒng)(SoC)將成為用于未來計算的、提高效率和規(guī)模的工程重點,。
值得一提的是,,Vahdat還是Frank的老板,因此他應(yīng)該是最優(yōu)資格談?wù)撛摬呗缘娜恕?/p>
Google所做的事情有些微妙,,在談?wù)撘呀?jīng)做了什么之前,,他們正在談?wù)撍麄儜?yīng)該做什么,這對公司來說有點不尋常,,Vahdat也承認了很多,。我們指出,通常情況下,,當Google談?wù)摗靶隆笔挛飼r,,它可能已經(jīng)在5年前解決了該問題,并且直到現(xiàn)在才向世人介紹這一時間,。MapReduce就是這種情況,,它產(chǎn)生了Hadoop。然后是BigTable,,產(chǎn)生了Drill,;然后是Spanner,產(chǎn)生了CockroachDB,。谷歌剛剛用它的Borg / Omega容器控制器將“中間人”帶走,,并將其克隆以創(chuàng)建Kubernetes,并將其開源,。
我們認為Google不會在不久的將來開放源代碼服務(wù)器SoC設(shè)計,,但是如果它可以幫助推動其Google Cloud的銷售,那么看到定制或半定制SoC被提供用于本地銷售就不會感到驚訝,。運行Anthos Kubernetes堆棧的數(shù)據(jù)中心或主機托管設(shè)施,,它與您在內(nèi)部獲得的Google內(nèi)容幾乎一樣,。還是想假設(shè)Borg對Google特定的工作負載和基礎(chǔ)架構(gòu)進行了高度調(diào)整。
在招攬Frank的過程中,,谷歌一定已經(jīng)為其提供了一個頗具吸引力的offer,,因為就在幾周前,F(xiàn)rank還是英特爾以色列芯片設(shè)計團隊的眾多高管之一,,而隨著新任首席執(zhí)行官Pat Gelsinger再次回到美國巨頭擔任CEO,,他還被提升了。在擔任核心與客戶開發(fā)部總經(jīng)理之后,,他被提升為公司副總裁,,該部在美國,以色列和印度擁有由2,000多名工程師組成的團隊,。
自大學畢業(yè)以來,,F(xiàn)rank一直在Intel任職。他于2000年獲得以色列MIT的Technion的電氣和電子工程學士學位,,隨后又于2004年獲得了由Intel資助完成的碩士學位,。2011年,F(xiàn)rank被任命為工程技術(shù)總監(jiān),,其團隊超過200位工程師從事存儲器控制器,,PCI-Express控制器,電源管理電路以及片上環(huán)形和網(wǎng)狀結(jié)構(gòu)(on-chip ring 和mesh fabrics)的研究,。2014年2月,,F(xiàn)rank遷至英特爾在俄勒岡州Beaverton的辦公室擔任工程總監(jiān),并管理了負責Apollo Lake PC芯片的300名工程師,,并于2016年被任命為負責核心SoC設(shè)計的工程高級總監(jiān),。在2018年,,F(xiàn)rank被任命為平臺工程部副總裁,,并擔任PC,AI和IoT芯片產(chǎn)品開發(fā)總監(jiān),,
在英特爾,,服務(wù)器SoC設(shè)計始終從客戶端SoC開始,因此Frank可以利用其領(lǐng)導定制服務(wù)器芯片開發(fā)也就不足為奇了,。核心就是核心,,這是英特爾一直以來的思考方式,而這恰恰是Vahdat所說的Google試圖通過“加倍”定制芯片來解決的問題,。服務(wù)器有時會執(zhí)行與客戶端不同的操作,,即使客戶端和服務(wù)器都執(zhí)行這些操作,它們的比率和處理它們所需的帶寬也不同,。我們認為,,也許Google在想的是我們需要一個真正的服務(wù)器核心,,并且需要針對Google本身正在運行的各種工作負載進行調(diào)整的服務(wù)器核心。
但是重要的是不要在這里迷失方向,。
谷歌并未宣布將創(chuàng)建自己的指令集和定制芯片,,就像2015年使用Tensor處理單元(TPU)在其TensorFlow框架上運行機器學習訓練和推理算法一樣,或者在2019年創(chuàng)建了自己的視頻處理單元(VPU),,用于處理媒體服務(wù)器上的視頻轉(zhuǎn)碼一樣,。正如H?lzle多次提醒我們的那樣,谷歌只在絕對必要時才制造定制芯片,,而且它多次獲得半定制CPU并在其中進行了一些針對特定工作負載的調(diào)整,,或者與合作伙伴一起創(chuàng)建了半定制磁盤。驅(qū)動器,,閃存驅(qū)動器,,網(wǎng)絡(luò)接口卡或網(wǎng)絡(luò)交換機。
“我想強調(diào)的一件事,,這將繼續(xù)成為現(xiàn)實,,我們并不想全力以赴,” Vahdat告訴The Next Platform,,“我們正在尋求與合作伙伴和生態(tài)系統(tǒng)盡可能多地合作,,坦率地說,這種情況越來越多,。十年前,,我們在內(nèi)部進行了更多工作,并試圖將其保留在內(nèi)部,,但我們?nèi)栽诶^續(xù)與伙伴合作的趨勢,。我們制造了閃存驅(qū)動器,但從未制造過自己的NAND gates,。但是在某些情況下,,就像我們最初使用Flash一樣,我們實際上必須證明某些東西有價值,,然后其他人才能追隨,。”
Google擁有垂直集成的優(yōu)勢,,它擁有從Linux內(nèi)核一直到應(yīng)用程序和數(shù)據(jù)服務(wù)再到Web瀏覽器的整個軟件堆棧,,這為自定義芯片或更高級別的自定義硬件提供了一些優(yōu)勢,Vahdat承認這一點,。Flash是一個很好的例子,。
如果您要制造一個視頻芯片或閃存設(shè)備以供全世界使用,則它傾向于使用最低的公分母(這會限制特定的實用程序),,或者傾向于使用非常廣泛的功能集,,這會使晶體管不必要地消耗功率,,從而不必要地消耗功率。
Vahdat舉例說,,在倉庫規(guī)模的計算機上編寫數(shù)據(jù)放置或在閃存上進行垃圾收集的方式與使用一臺筆記本電腦的方式大不相同,。TPU和VPU是非常精確的設(shè)備,分別針對TensorFlow和YouTube或環(huán)聊進行了調(diào)整,,瓦達達說,。但是也許您只有在必要時才走那么遠。
Google的工作負載規(guī)模越來越大,,工作負載也越來越多,,此外,公共云業(yè)務(wù)必須支持各種應(yīng)用程序和系統(tǒng)軟件,。在這些情況下,,最好(也是最經(jīng)濟)的方法可能是找到同類最佳的組件,并將它們集成到專門針對工作負載進行了調(diào)整的SoC中,。這就是谷歌的SoC作為新的主板創(chuàng)意出現(xiàn)的地方,。
“系統(tǒng)中的所有組件都集成在主板上,通常集成在PCI-Express總線上,,” Vahdat說,。集成和定制點就是主板。我們現(xiàn)在處于一個平衡應(yīng)用程序需求和效率的位置,,很難知道要在主板上放置多少特定設(shè)備,。而且實際上很難協(xié)調(diào)應(yīng)用程序代碼,以能夠管理所有用完P(guān)CI-Express總線的設(shè)備之間的數(shù)據(jù)移動和存儲,。
在不談?wù)摷毠?jié)的情況下,,我們所談?wù)摰氖窃诨炯墑e上對組件進行創(chuàng)新,并在重要的時刻和地方將它們組合在一起,,針對各個應(yīng)用程序進行自定義(就像我們在存儲,,機器學習和視頻方面所做的一樣),它們都放在新主板上,。
這并不一定意味著將來自不同供應(yīng)商的芯片集成到一個封裝中,,但這可能是Frank和他的團隊將探索的一部分,。這并不意味著使用CXL這樣的協(xié)議將主板擴展到單個機箱之外,,盡管Google顯然會使用CXL以及可能適合將計算和存儲元素鏈接在一起的其他協(xié)議(例如CCIX或Gen-Z。
他的意思是,,如果Google仍要繼續(xù)向其系統(tǒng)中滲透類似于摩爾定律的改進,,則需要專門化。(正如H?lzle 在很多年前向我們指出的那樣,,谷歌將竭盡所能擊敗摩爾定律,,因為這是超大規(guī)模生產(chǎn)者必須要做的事情,,也只有這樣才能繼續(xù)保持運營。)
Vahdat解釋說:“在過去,,當事情以指數(shù)級速度快速增長時,,專門針對單個工作負載是沒有意義的。那時,,在Google,,我們的工作量也減少了。因此,,專門針對其中的幾個就足夠了,。在云世界中,考慮到我們托管的服務(wù)數(shù)量,,我們不再需要一個特定的應(yīng)用程序主導,。因此,這種能夠集成最好IP的模型,,盡可能多地購買它并在有意義的任何地方與其他人合作,,使我們能夠快速地專門針對單個應(yīng)用程序?!?/p>
從某種意義上說,,谷歌真正想做的就是教導芯片制造商以一種他們實際上沒有,而且從沒有過的方式進行合作,。試想一下,,如果您可以采用英特爾,AMD,,IBM和Nvidia的分立技術(shù),,并制造出正確類型的特定計算設(shè)備。這就是Google夢寐以求的事情,,如果Google在各地購買一些IP并將其集成以證明其有效,,那么可能會發(fā)生。也許它將首先在小芯片級別上發(fā)生,。
Vahdat強調(diào)說:“我們只想做盡可能少的事,,專注于我們必須要做的事。這是Google數(shù)十年來始終如一的宗旨,。Google只會建立它所必須的,。”我認為這取決于我們最終要整合的是什么以及特定的用例,。但是同樣,,我們希望盡可能少地做這種理想的領(lǐng)先行業(yè),以便隨著時間的流逝減少這種情況。從長遠來看,,這不是我們想要的業(yè)務(wù),。“