8月8日,,英特爾在美國(guó)總部召開(kāi)了名為“以數(shù)據(jù)為中心(Data-Centric)”的創(chuàng)新峰會(huì),。在會(huì)上,,以英特爾執(zhí)行副總裁,、數(shù)據(jù)中心集團(tuán)總經(jīng)理Navin Shenoy為首的各產(chǎn)品線主要負(fù)責(zé)人介紹了英特爾在大數(shù)據(jù)時(shí)代的發(fā)展愿景和布局,,對(duì)“以數(shù)據(jù)為中心的計(jì)算(Data-Centric Computing)”的潛在市場(chǎng)進(jìn)行了分析,,并且公布了若干英特爾相關(guān)軟硬件產(chǎn)品的發(fā)展路線圖。
本次峰會(huì)披露了很多關(guān)于FPGA的重大動(dòng)態(tài),,其中包括正式宣布了基于英特爾FPGA的智能網(wǎng)卡產(chǎn)品線,,以及其第一款代號(hào)為“Cascade Glacier(冰川瀑布)”的量產(chǎn)版智能網(wǎng)卡。作為這款產(chǎn)品的FPGA研發(fā)團(tuán)隊(duì)的主要成員之一,,筆者從立項(xiàng)之初就參與了它的各項(xiàng)研發(fā)工作,,并負(fù)責(zé)了多個(gè)軟硬件模塊和系統(tǒng)的設(shè)計(jì)與驗(yàn)證任務(wù)。因此對(duì)于這款產(chǎn)品的正式對(duì)外發(fā)布,,我倍感欣喜,,并希望通過(guò)本文進(jìn)一步梳理和分析峰會(huì)的技術(shù)細(xì)節(jié),以及從以下幾個(gè)方面探討FPGA在大數(shù)據(jù)時(shí)代的各種機(jī)遇和挑戰(zhàn):
1.英特爾“泛數(shù)據(jù)中心”業(yè)務(wù)及其潛在市場(chǎng)
2.基于FPGA的智能網(wǎng)卡產(chǎn)品線的正式發(fā)布
3.英特爾人工智能計(jì)算加速器產(chǎn)品系列的相關(guān)布局
4.FPGA開(kāi)發(fā)的痛點(diǎn)與潛在方案
英特爾“泛數(shù)據(jù)中心”業(yè)務(wù)
近年來(lái),,英特爾一直積極的尋求業(yè)務(wù)轉(zhuǎn)型,,即從一家以個(gè)人計(jì)算機(jī)和CPU為主的企業(yè),轉(zhuǎn)向以數(shù)據(jù)為中心并圍繞其發(fā)展全棧式解決方案的公司,。為了實(shí)現(xiàn)這一目標(biāo),,這幾年英特爾先后收購(gòu)了FPGA大廠Altera(167.5億美金),自動(dòng)駕駛大廠Mobileye(153億美金),,人工智能芯片初創(chuàng)公司Nervana,、機(jī)器視覺(jué)公司Movidus等眾多公司擴(kuò)展其產(chǎn)品線,并同時(shí)招攬了兩位芯片設(shè)計(jì)大神Jim Keller和 Raja Koduri分別擔(dān)任半導(dǎo)體工程總負(fù)責(zé)人和芯片總架構(gòu)師,,負(fù)責(zé)統(tǒng)領(lǐng)英特爾各類(lèi)芯片(特別是高端數(shù)據(jù)中心芯片)的整體架構(gòu)和路線圖規(guī)劃,。另外,,英特爾旗下的風(fēng)投部門(mén)僅在2017年就投資了包括地平線在內(nèi)的十余家AI初創(chuàng)企業(yè),各領(lǐng)域總投資額超過(guò)五億美元,。
推動(dòng)這場(chǎng)變革的主要力量,,就是目前方興未艾的大數(shù)據(jù)浪潮。目前,,全世界現(xiàn)有的超過(guò)90%的數(shù)據(jù)都是在過(guò)去的兩年內(nèi)產(chǎn)生的,。隨著人工智能、自動(dòng)駕駛,、5G,、云計(jì)算等各種技術(shù)的不斷發(fā)展,各類(lèi)數(shù)據(jù)將會(huì)基于源源不斷的產(chǎn)生,,預(yù)計(jì)到2025年時(shí),數(shù)據(jù)總量將比現(xiàn)在增長(zhǎng)10倍,。由于上述技術(shù)的發(fā)展都基于對(duì)大數(shù)據(jù)的研究和分析,,因此有人形象的將數(shù)據(jù)比作未來(lái)人工智能時(shí)代的石油。
隨著數(shù)據(jù)量的增長(zhǎng)和技術(shù)的發(fā)展,,對(duì)數(shù)據(jù)進(jìn)行處理的能力也有了長(zhǎng)足的進(jìn)步,。特別是隨著摩爾定律的延續(xù),從2012年至2017年,,處理數(shù)據(jù)所需的計(jì)算和存儲(chǔ)成本分別下降了56%和77%,;同時(shí),處理數(shù)據(jù)的性能相較2006年則提升了41倍,,如圖1所示,。然而即便如此,現(xiàn)如今只有不到1%的數(shù)據(jù)被有效的進(jìn)行了處理,、分析和利用,。由此可見(jiàn),如何高效的以數(shù)據(jù)為中心進(jìn)行現(xiàn)有系統(tǒng)的優(yōu)化設(shè)計(jì),、升級(jí)和創(chuàng)新,,擁有著巨大的市場(chǎng)潛力和前景。
圖1:摩爾定律的延續(xù)帶來(lái)的數(shù)據(jù)處理性能的增長(zhǎng)
在本次峰會(huì)上,,英特爾對(duì)其2022年的大數(shù)據(jù)相關(guān)的潛在市場(chǎng)規(guī)模(Total Addressable Market – TAM)做了自己的預(yù)測(cè),,如下圖所示:
圖2:2022年英特爾大數(shù)據(jù)相關(guān)的潛在市場(chǎng)規(guī)模
英特爾的各類(lèi)以數(shù)據(jù)為中心的業(yè)務(wù)部門(mén)主要包括四個(gè)子業(yè)務(wù)群:第一,傳統(tǒng)的數(shù)據(jù)中心業(yè)務(wù),,包括Xeon處理器,、網(wǎng)絡(luò)、連接等,;第二,,非易失性存儲(chǔ)業(yè)務(wù),;第三,物聯(lián)網(wǎng)和自動(dòng)駕駛業(yè)務(wù),,包括各類(lèi)人工智能相關(guān)的業(yè)務(wù)部門(mén),;第四,F(xiàn)PGA業(yè)務(wù),。我在本文中將將其統(tǒng)一稱(chēng)作“泛數(shù)據(jù)中心”集團(tuán),。至2022年,泛數(shù)據(jù)中心集團(tuán)的潛在市場(chǎng)規(guī)模將超過(guò)2000億美元,,并由此成為英特爾歷史上最大的市場(chǎng)機(jī)遇,。其中,各個(gè)子業(yè)務(wù)群的市場(chǎng)規(guī)模分別為,,傳統(tǒng)數(shù)據(jù)中心業(yè)務(wù)超過(guò)900億美元,、非易失性存儲(chǔ)業(yè)務(wù)750億美元,物聯(lián)網(wǎng)和自動(dòng)駕駛業(yè)務(wù)330億美元,,F(xiàn)PGA相關(guān)的業(yè)務(wù)也超過(guò)80億美元,。
為此,英特爾提出了“全棧式”的數(shù)據(jù)中心系統(tǒng)解決方案路線圖,,并由此打造以數(shù)據(jù)為中心的基礎(chǔ)架構(gòu),,如下圖所示。
圖3:英特爾全棧式數(shù)據(jù)中心解決方案
可以看到,,這個(gè)路線圖主要由“三駕馬車(chē)”進(jìn)行驅(qū)動(dòng),,分別是傳輸、存儲(chǔ)和計(jì)算,。值得注意的是,,圖中在傳輸和計(jì)算的部分都明確標(biāo)出了FPGA的存在。下文將進(jìn)一步分析FPGA在這兩個(gè)領(lǐng)域中所面臨的主要機(jī)遇和挑戰(zhàn),。
使用FPGA智能網(wǎng)
卡加速數(shù)據(jù)中心網(wǎng)絡(luò)
?。?)數(shù)據(jù)中心網(wǎng)絡(luò)市場(chǎng)高速增長(zhǎng)
在2022年,F(xiàn)PGA的數(shù)據(jù)中心相關(guān)業(yè)務(wù)的潛在市場(chǎng)規(guī)模將達(dá)到80億美元,,較現(xiàn)在增長(zhǎng)將超過(guò)30億美元,。就英特爾FPGA業(yè)務(wù)部(原Altera)而言,其數(shù)據(jù)中心相關(guān)業(yè)務(wù)的年同比增長(zhǎng)率在今年一季度達(dá)到了140%,,與高端FPGA器件相關(guān)的增幅達(dá)50%,,而整體業(yè)務(wù)也有超過(guò)兩位數(shù)的增長(zhǎng),見(jiàn)下圖所示,。
圖4:英特爾可編程業(yè)務(wù)部年增長(zhǎng)率
FPGA的一個(gè)最主要的應(yīng)用領(lǐng)域就是對(duì)各類(lèi)網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行并行化處理,。這里的網(wǎng)絡(luò),既包括傳統(tǒng)的有線通信網(wǎng)絡(luò),也包括正在興起的5G無(wú)線網(wǎng)絡(luò),,以及在數(shù)據(jù)中心里的各類(lèi)網(wǎng)絡(luò)連接,。
(2)FPGA智能網(wǎng)卡產(chǎn)品線發(fā)布
前文中提到,,作為本次峰會(huì)的一大亮點(diǎn),,英特爾發(fā)布了全新的基于FPGA的智能網(wǎng)卡產(chǎn)品線,以及其中的首款量產(chǎn)級(jí)產(chǎn)品,,代號(hào)為“Cascade Glacier(冰川瀑布)”,。由此進(jìn)一步擴(kuò)充了英特爾的以太網(wǎng)硬件產(chǎn)品線,形成了傳統(tǒng)網(wǎng)卡(ASIC)+智能網(wǎng)卡(FPGA)+網(wǎng)絡(luò)功能加速卡(FPGA)的完整產(chǎn)品組合,,如下圖所示,。
圖5:英特爾數(shù)據(jù)中心以太網(wǎng)硬件產(chǎn)品線
這類(lèi)智能網(wǎng)卡的產(chǎn)生背景是為了應(yīng)對(duì)數(shù)據(jù)中心網(wǎng)絡(luò)流量的爆炸性增長(zhǎng)。從下圖可以看到,,全球數(shù)據(jù)中心的網(wǎng)絡(luò)流量將從2016年的6.8Z字節(jié)(1ZB等于10的12次方GB)暴增至2021年的20.6Z字節(jié),,年復(fù)合增長(zhǎng)率約為25%。同時(shí)值得注意的是,,這其中大部分的網(wǎng)絡(luò)流量都是在數(shù)據(jù)中心內(nèi)部的,,因此如何優(yōu)化處理這類(lèi)網(wǎng)絡(luò)流量就成了亟需解決的課題。另外,,在目前的通信及云服務(wù)提供商的數(shù)據(jù)中心里,部分CPU核心被用來(lái)實(shí)現(xiàn)必須的存儲(chǔ)和網(wǎng)絡(luò)功能,,如針對(duì)虛擬化交換的OVS(Open Virtual Switch),,以及針對(duì)I/O虛擬化的Virtio等等,這樣使得寶貴的CPU資源被非用戶(hù)任務(wù)占用,,造成可用CPU資源的壓縮和緊張,。為解決這些問(wèn)題,Cascade Glacier智能網(wǎng)卡由此產(chǎn)生,。
圖6:全球數(shù)據(jù)中心網(wǎng)絡(luò)流量增長(zhǎng)率
如圖7所示,,Cascade Glacier基于英特爾Arria10系列FPGA,能為云數(shù)據(jù)中心的網(wǎng)絡(luò)流量提供2x25GbE的數(shù)據(jù)處理加速,。
圖7a:FPGA智能網(wǎng)卡Cascade Glacier
與傳統(tǒng)網(wǎng)卡以及現(xiàn)有的其他智能網(wǎng)卡相比,,它提供了業(yè)界唯一的對(duì)Virtio協(xié)議的硬件支持和加速,使得云數(shù)據(jù)中心里的虛擬機(jī)可以進(jìn)行無(wú)縫的動(dòng)態(tài)遷移,,而不需要安裝額外的驅(qū)動(dòng),,極大的擴(kuò)展了數(shù)據(jù)中心的部署靈活性。另外,,它將原本在CPU上實(shí)現(xiàn)的OVS功能完全卸載到FPGA上實(shí)現(xiàn),,釋放了寶貴的CPU資源。另外,它還提供了FPGA靈活的可編程以及低功耗的特點(diǎn),,方便在數(shù)據(jù)中心中大規(guī)模部署,,以及對(duì)常用網(wǎng)絡(luò)功能進(jìn)行定制化加速。作為英特爾獨(dú)立開(kāi)發(fā)的量產(chǎn)級(jí)智能網(wǎng)卡產(chǎn)品,,Cascade Glacier會(huì)與英特爾”泛數(shù)據(jù)中心“架構(gòu)中的其他組成部分,,如Xeon CPU、存儲(chǔ)器,、AI協(xié)處理器和加速器等,,進(jìn)行軟硬件深度整合,從而提供完整的端到端的系統(tǒng)解決方案,。目前,,Cascade Glacier已經(jīng)進(jìn)入了最后的批量裝配階段,并預(yù)計(jì)將于2019年一季度正式出貨,。
圖7b:使用智能網(wǎng)卡進(jìn)行CPU功能卸載
Cascade Glacier可以算是英特爾針對(duì)云數(shù)據(jù)中心而設(shè)計(jì)開(kāi)發(fā)的第一代基于FPGA的智能網(wǎng)卡量產(chǎn)產(chǎn)品,,很好的解決了行業(yè)痛點(diǎn),因此已經(jīng)吸引了很多大型云服務(wù)提供商的關(guān)注,。相信在不久的將來(lái),,會(huì)有更多關(guān)于這款產(chǎn)品的詳細(xì)信息和部署情況被正式公布,屆時(shí)我會(huì)更深入的介紹關(guān)于Cascade Glacier的更多性能特點(diǎn),。