自Xilinx在1984年創(chuàng)造出FPGA以來,,這種可編程邏輯器件憑借性能,、上市時間,、成本、穩(wěn)定性和長期維護方面的優(yōu)勢,,在通信,、醫(yī)療,、工控和安防等領域占有一席之地,在過去幾年也有極高的增長率,。而進入了最近兩年,,由于云計算、高性能計算和人工智能的繁榮,,擁有先天優(yōu)勢的FPGA的關(guān)注度更是到達了前所未有的高度,。本文從基礎出發(fā)談及FPGA的過去、現(xiàn)在與未來,。
我們知道,,相對于專業(yè)的ASIC,F(xiàn)PGA有上市時間和成本上的優(yōu)勢,。另外,,在大多數(shù)情況下,F(xiàn)PGA執(zhí)行某些功能較之CPU上的軟件操作更高效,。這就是為什么我們認為它不但會運用在數(shù)據(jù)中心的服務器,、交換器、存儲層的各個角落,,并且具有加速整個工作流程的功能,。
然而我們不能過分樂觀,尤其是在2015年12月,,Intel以167億美元收購了FPGA生產(chǎn)商Altera之后。
在2014年年底,,當時還處于獨立的Altera公司高層盯上了基于CPU+FPGA的數(shù)據(jù)中心并行計算的發(fā)展前景——這個當時價值大約10億美元的市場,。而并非數(shù)據(jù)中心里約2.5億美元的CPU-GPU市場和直接應用CPU處理器的90億美元市場。
Altera做出這個決定的原因在于他們認為這個組合較之另外兩個方案,,有編程的簡便性和能效優(yōu)勢,。人們對CPU非常熟悉,并發(fā)現(xiàn)尋找C程序員也不會太難,。因此對大部分開發(fā)者來說,,在執(zhí)行運算任務的時候,持續(xù)使用這種方案不需要冒太大的風險,,但是能源效率相對比較低,,尤其是在密集的計算和固有的并行工作負載的情況底下。
至于CPU+GPU的方案,,程序員并不是很熟悉,,但是擁有很高的效率。
根據(jù)Altera的估計,,使用OpenCL對混合CPU-FPGA系統(tǒng)進行編程比使用Nvidia的CUDA環(huán)境對于程序員來說更容易(某些方面肯定是有爭議的),,但用HDL來硬編程FPGA是相當困難的,,因此需要OpenCL或者通過其他抽象層來將CPU中的負載轉(zhuǎn)移到FPGA上。
Intel收購Altera改變FPGA格局
這個十億美元的數(shù)據(jù)中心市場被Altera,、Xilinx和其他FPGA供應商瓜分,。在Intel于2015年6月收購了Altera之后,這個市場變得更加復雜,。
在收購之前的2014年,,Altera的19億美元收入中,有16%來自于與數(shù)據(jù)中心相關(guān)的計算,、網(wǎng)絡和存儲業(yè)務,,其總值達到3.04億美元。那些在這個領域深耕十幾二十年的通信和無線設備系統(tǒng)制造商想要有更高的能源效率,,更低的成本和更高的擴展性,,這些都是FPGA所擅長的領域。另外有一點需要提一下,,那就是在執(zhí)行這些功能的時候,,使用FPGA并不需要像使用CPU那樣需要操作系統(tǒng)和相應的軟件。這部分的營收占了Altera營收的44%,,總額為8.35億美元,。
Altera另外的22%收入,即4.18億美元,,來自工業(yè)控制,、軍事設備和汽車制造等領域。他們面對相同的困境,,因此選擇FPGA來處理他們的一些工作負載,。
其實早在2014年,英特爾看中了價值1150億美元的各種類型的芯片潛在市場,。當中可編輯邏輯設備(以FPGA為主)約占4%,,ASIC占18%,其余為ASSP的大雜燴,。
在可編輯邏輯設備的領域中,,英特爾預估Altera占有48億美元市場中的39%,Xilinx占有49%,,剩下供應商則占據(jù)剩下的12%,。
當時英特爾沒有收購Altera的原因是因為FPGA業(yè)務的增長速度幾乎與其數(shù)據(jù)中心集團(為服務器,存儲和交換機制造商提供芯片,,芯片組和主板)的速度一樣快,。
再者,英特爾沒有這樣做也是因為摩爾定律逐漸緩慢下來的腳步,,給FPGA帶來了日益增長的競爭威脅,。
實際上,,如果應用的話,在數(shù)據(jù)中心里不止安裝一個FPGA,、GPU或DSP加速器,,但不需要安裝多個Xeon CPU。由于英特爾不能繼續(xù)為Xeons提供更多的核心和加速器,,所以他們得出了將FPGA當做加速器的結(jié)論,。
除非FPGA能在數(shù)據(jù)中心創(chuàng)造5億美元的收益,或者幾年后創(chuàng)造10億美元或更多的收入,。不然英特爾寧愿犧牲兩至三倍的Xeon收入,,也不會把Xeon的收入拱手相讓。
深度學習加持,,F(xiàn)PGA前景可人
根據(jù)英特爾的預測,,他們計劃從現(xiàn)在到2023年以接近直線增長率來提升FPGA的業(yè)務。對此我們總是抱有懷疑的態(tài)度,。但FPGA業(yè)務隨著時間的推移或多或少地在增長(比15年前增長約2.5倍),。
英特爾還預計,F(xiàn)PGA的營收在2014年到2023年之間將會再翻一倍,。按照英特爾預測,,從2014年到2023年間其復合年增長率為7%,其收入應該略低于預測的89億美元,。有趣的是,,由于英特爾的預測并沒有把來自數(shù)據(jù)計算中心(服務器,交換和網(wǎng)絡)的FPGA收入份額納入計劃中,,這將會發(fā)生很大變化,。
如果Altera和Xilinx的市場份額沒有發(fā)生改變,且假設Altera的收入在網(wǎng)絡,,計算和存儲的部分保持不變,那么Altera這一部分的業(yè)務收入到2023年將會達到5.6億美元左右,。我們認為Intel這樣的數(shù)據(jù)低估了數(shù)據(jù)中心在提供更有效和靈活計算所面對的壓力,。不給過我們認為FPGA的前景遠遠優(yōu)于這個預測。也就是說,,許多FPGA技術(shù)的支持者一直期待FPGA在數(shù)據(jù)中心中獲得計算合法化的那天很快到來,。
諷刺的是,英特爾本身作為FPGA的編程專家,,硬件描述語言的使用者,,以及知名的ASIC制造商,竟成為推動FPGA成為加速器優(yōu)先選擇的主要參與者,。這樣的加速器既能作為獨立的離散計算元件,,又可以作為混合 CPU-FPGA器件,。
這也是為什么從2016年以來,我們看到所有關(guān)于Altera的新聞都是昭示FPGA將會有的大規(guī)模增的增長,。所以至少在短期,,他們除了為其他的FPGA制造商作嫁衣裳,幾乎別無他法,。
這次收購不僅是FPGA發(fā)展的里程碑,,也是英特爾對FPGA巨大的潛力的承認。FPGA作為未來強大的計算加速器,,不但影響主要企業(yè)的決策和市場趨勢,,而且加速企業(yè)中的工作負載,促進超大規(guī)模數(shù)據(jù)中心的內(nèi)部搜索,,以及提高高性能計算模擬的地位,。
在跨越2017年之際,F(xiàn)PGA在應用程序中等級中新增了機器學習和深度學習,,這給FPGA產(chǎn)業(yè)敲下了又一重錘,。
為什么大家都青睞FPGA
首先,編程FPGA的軟件棧已經(jīng)演進了,,尤其是在Altera的幫助下,,F(xiàn)PGA增加了對OpenCL開發(fā)環(huán)境的支持。但不是每個人都是OpenCL的狂熱粉絲,。
先有Nvidia為其Tesla GPU加速器創(chuàng)建了自己的CUDA并行編程環(huán)境,。再有SRC計算機公司不但早在2002年就為國防和智能領域提供混合CPU-FPGA系統(tǒng),到了2016年年中,,進一步將自己研發(fā)的Carte編程環(huán)境進入了商業(yè)市場,,這個編程環(huán)境可以使C和Fortran程序自動轉(zhuǎn)換為FPGA的硬件描述語言(HDL)。
另一個推動FPGA被采用的因素是隨著芯片制造技術(shù)難以持續(xù)縮進,,多核CPU性能的提高越來越艱難,。 雖然CPU的性能獲得了大跳躍,但主要用于擴展CPU的性能吞吐量,,而不是單個CPU內(nèi)核的個體性能,。(我們知道架構(gòu)增強是有難度的)。但是FPGA和GPU加速器的每瓦性能都有了令人信服的改進,。
根據(jù)微軟的運行測試,,在執(zhí)行深度學習算法的時候,CPU-FPGA和CPU-GPU混合計算在的每瓦性能也不相伯仲,。GPU在運行中更熱和有類似的每瓦性能表現(xiàn),,但是同時他們也帶來了更強的工作能力。
提高了每瓦性能解析了為什么世界上最強大的超級計算機在20世紀90年代后期轉(zhuǎn)移到并行集群,,并且解析了為什么現(xiàn)在他們轉(zhuǎn)向了混合機器,,而不是英特爾的下一個以 CPU-GPU為混合主力的Xeon Phi的處理器“Knights Landing (簡稱KNL),。
在Altera FPGA協(xié)處理器和Xeon Phi處理器Knights Landing的幫助下,英特爾不但可以保持自己的在高端的競爭優(yōu)勢,。并且在與Nvidia ,、IBM和 Mellanox組成的Open power聯(lián)盟競爭中繼續(xù)領先。
英特爾堅信超大規(guī)模計算,,云端和HPC市場的工作負載會快速成長,。為促進其計算業(yè)務繼續(xù)蓬勃發(fā)展。這情況下只能成為FPGA的賣家,,否則別人就會搶去這唯一的出路,。
但英特爾并不是這樣跟大家說。他們說:“我們不認為這是一種防守戰(zhàn)或者其他,,”英特爾的CEO Brian Krzanich在Altera收購消息后的新聞發(fā)布會上說,。
“我們認為物聯(lián)網(wǎng)和數(shù)據(jù)中心都是龐大的。這些也是我們的客戶想要構(gòu)建的產(chǎn)品,。我們30%的云端工作負載將在這些產(chǎn)品上,,這是基于我們對如何看待趨勢變化以及市場發(fā)展的預測。
這是用來證明這些工作負載能以一種或另一種方式轉(zhuǎn)移到硅中,。我們認為最好的做法是使用有業(yè)界最佳性能和成本優(yōu)勢的Xeon處理器和FPGA組合,。這將給工業(yè)領域帶來更好的產(chǎn)品和性能。而在IoT中,,這將擴展到潛在市場對抗ASIC和ASSP;而在數(shù)據(jù)中心中,,則會將workload轉(zhuǎn)移到硅,推動云的快速增長,。
Krzanich解釋道:“你可以把FPGA想象成一堆gate,,且能夠隨時編程。根據(jù)他們的想法,,其算法會隨著時間的推移和學習變得更聰明,。FPGA可以用作多個領域的加速器,可以在進行加密的同時進行面部搜索,,而且能在基本上在微秒內(nèi)重新編程FPGA,。這比大規(guī)模的單個定制部件的成本低得多且具備更高的靈活性?!?/p>
英特爾看到了更大的機會
Intel首席執(zhí)行官Brian Krzanich在收購完成后宣布,到2020年,,將有高達三分之一的云端服務提供商使用混合的CPU-FPGA服務器節(jié)點,,這是一個令人震驚的消息。這也給從2014年底就開始瞄準的數(shù)據(jù)中心的Altera帶來大約10億美元的FPGA的機會,。這數(shù)目大概是Nvidia目前流行的Tesla計算引擎營收的三倍,。
在2014年初,,英特爾展示了一個相同封裝的Xeon-FPGA芯片原型,并且打算在2017年推出這個芯片,。這是基于當時數(shù)據(jù)中心集團GM Diane Bryant提出的一個帶有FPGA電路的Xeon設想不久之后推出的,。
在宣布Altera交易的電話會議上,Krzanich沒有說明退出這款Xeon-FPGA設備的時間,,但是他表示英特爾將創(chuàng)建一個面向物聯(lián)網(wǎng)市場的單die混合Atom-FPGA設備,。英特爾正在考究在混合過渡階段,是否需要為Atom和Altera FPGA做單一封裝混合,。
在2016年的初太平洋頂峰證券的電話會議中,,英特爾的云端基礎設施集團總經(jīng)理Jason Waxman與研究分析師討論關(guān)于英特爾數(shù)據(jù)中心業(yè)務時表示,F(xiàn)PGA已經(jīng)成為了熱門話題,。
首先,,雖然他沒有指名道姓哪家廠商或者任何設備的規(guī)格,但是Waxman確定英特爾已經(jīng)為某些客戶提供了Xeon加FPGA的混合計算引擎樣品,。
在會議期間,,Waxman更是暢談了驅(qū)動英特爾收購Altera和插足可編程計算設備的原因。 英特爾顯然希望讓FPGA成為主流,,即使這可能會在數(shù)據(jù)中心中蠶食Xeon的某些業(yè)務,。 (我們認為,因為英特爾認為這種自相殘殺是不可避免的,,控制它的最好方法是使FPGA成為Xeon陣容的一部分,。)
Waxman說:“我認為這項收購可能涉及許多事情,而且其中一些已經(jīng)超越數(shù)據(jù)中心集團的范圍,?!?/p>
首先,一個潛在的核心業(yè)務往往是由制造領先優(yōu)勢驅(qū)動,。在這方面我們能很好的掌控,,而且這樣做還有良好的協(xié)同作用。
再者,,還有物聯(lián)網(wǎng)“集團”對此也有很強的興趣,。
據(jù)我們所知,某些大規(guī)模工作負載的擴展(如機器學習,,某些網(wǎng)絡功能)吸引了越來越多的人關(guān)注,。我們才意識到我們或者可以在性能方面取得一些突破,這將是一個把FPGA從數(shù)據(jù)中心應用程序中移植到更多適合的,、廣泛發(fā)展領域的良好機會,。
但是在數(shù)據(jù)中心集團里的協(xié)作,F(xiàn)PGA不過是給CPU做個伴,幫助解決云端服務提供商和其他類型的大規(guī)模應用程序的問題,。
英特爾認為對FPGA加速有優(yōu)先和大量需求的關(guān)鍵應用包括機器學習,,搜索引擎索引,加密和數(shù)據(jù)壓縮,。正如Waxman指出,,這些往往是很有針對性的,且沒有統(tǒng)一的使用案例,。這就是Krzanich斬釘截鐵說三分之一的云端服務提供商將在五年內(nèi)使用FPGA加速的依據(jù),。
跨越FPGA的障礙
雖然每個人都抱怨編程FPGA有多難,但英特爾并不為此退縮,。雖然沒有透露太多相關(guān)計劃的情況下,,Waxman提出了一些方法讓FPGA更容易被運用和理解。
Waxman說:“我們所擁有的是獨一無二的,,這是其他人不能給的,。那就是我們能夠了解這些工作負載和能夠推動加速的能力。
“我們看到一條促進機器學習,,加速存儲加密,,加速網(wǎng)絡功能的捷徑”,Waxman強調(diào),。這是基于我們對這些工作負載的深入了解,,所以才讓我們看到了這樣的機會。
但現(xiàn)在FPGA還需要面對一些困難,,因為現(xiàn)在人們是寫RTL的,。我們是一家寫RTL的公司,所以我們可以解決這個問題,。首先我們使它運作,,然后我們可以降低進入的門檻。第三步是真正的規(guī)模經(jīng)濟學,,而這全部是靠集成和制造的實力,。
為了解決這些障礙,我們提供了一系列的方法,。
X86+FPGA?
對于那些英特爾打算用FPGA來代替Xeons的猜測,,Waxman表示這是一派胡言。
Waxman表示,,對于那些對高速率和重復性有強烈需求的算法,,具有先天優(yōu)勢的FPGA就是其最好的選擇。而那些對延遲有極高需求的數(shù)據(jù)操作和轉(zhuǎn)換,,F(xiàn)PGA也是候選人,。
考慮到Altera已經(jīng)在一個SoC上集成了ARM處理器和FPGA,,這很自然地會想到英特爾會試圖用X86內(nèi)核全面替換ARM內(nèi)核來做類似的設備。但它看起來不像這會發(fā)生,。
首先,在2016年第二季度英特爾財務聲明會上,,Krzanich承諾,,英特爾將加強對目前使用Altera的ARM-FPGA芯片客戶的支持。
Waxman進一步澄清:“我們的觀點是會以某種形式把FPGA集成到Xeon里,。我們已經(jīng)公開宣布將會打造第一代使用這種單一封裝的設備,,但是我們將根據(jù)進展情況調(diào)整方向,甚至可能會在同一個die上實現(xiàn),。我們將根據(jù)客戶的反饋了解什么是正確的組合,。
順便說一下,我仍然期待看到?jīng)]有集成的系統(tǒng),,保持他們會做系統(tǒng)級的協(xié)同,。我們不會將Xeon與FPGA以多種方式組合集成,反之我們會在市場上找到正確的目標和平衡,?!?/p>
編程問題首當其沖
雖然Altera的工具集利用OpenCL編程模型獲得應用程序代碼,并將其轉(zhuǎn)換為RTL(FPGA的原生語言),,但是有趣的是,,英特爾并不認為FPGA在數(shù)據(jù)中心的未來成功是基于OpenCL與RTL工具集成的改進或更廣泛地采用OpenCL。
Waxman也強調(diào)地說:“這并不是以OpenCL為基礎的,?!彪m然我們確實把OpenCL看作是進一步擴大FPGA應用范圍的一個途徑,但目前FPGA的初始云端部署可能由更具能力的公司完成,,但他們并沒有要求我們提供OpenCL,。Waxman補充說。
Waxman在不能“自由”地談論的情況下,,暗示英特爾有計劃使FPGA更容易編程,。他表示Intel將會為程序員提供RTL庫,方便他們調(diào)用在FPGA上部署的例程,,并推動在其上執(zhí)行應用程序的gate的形成,,來實現(xiàn)應用程序例程的gate,而不是讓他們自己創(chuàng)建例程,。這有一定的意義,,與Convey(現(xiàn)在是美光科技的一個部門)幾年前用FPGA加速系統(tǒng)處理的方案一樣。
Waxman說:“我認為有一個連續(xù)的加速,。在一開始,,你可能不知道你正在試圖加速什么,,只是做了一些嘗試,因此在這個階段加速,,你想要的是一個更通用的目的,。當你開始真正地想要加速的時候,你會想要更高效的,,更低的功耗和更少的空間,,這時你就會把焦點移到FPGA上?!?/p>
Waxman還引用了Microsoft在其“Catapult”系統(tǒng)上使用FPGA加速的方案來說明,。
該系統(tǒng)采用其Open Cloud Server并添加FPGA夾層卡作為加速器。我們在3月份研究了這個項目,,將這些加速器應用在Google上執(zhí)行相同的圖像識別訓練算法,,得出的結(jié)果顯示,25瓦的FPGA器件相對于使用Nvidia Tesla K20 GPU加速器(235瓦特)的服務器,,提高了更好的性能/瓦特,。
正如我們所說,我們對于微軟和Google發(fā)布的性能數(shù)據(jù)毫無疑問,。但是對分立的GPU或FPGA執(zhí)行應用性能和對自身的熱配置文件進行測量都是不公平的,。你必須在服務器節(jié)點級別上看到這一點。
如果意識到這點,,得到FPGA輔助的Microsoft服務器在系統(tǒng)級只稍稍領先于用Tesla K20s的Google服務器,。(這些只是我們基于每秒每瓦特圖像處理性能的估計)。在這個對比中,,Microsoft應該不考慮成本,。而且坦白說,不同于什么都配備的Tesla GPU,,微軟開放云端服務器并沒有使用Juice或Cooling,。真正的評測怎么都會使用GPU夾層卡,同時還需要考慮熱量,,性能和價格等因素,。
但是Waxman討論的重點仍然是那個?!霸谀硞€時候,,你真的很想要那個能給你驚喜,并且能做到更低功耗的方案,。而這就是我們的FPGA方案所擅長的方面,。”
云端業(yè)務
最后要考慮的是英特爾的云端業(yè)務,。這些客戶現(xiàn)在占據(jù)了他們數(shù)據(jù)中心集團收入的25%,。
整體來看,,他們的購買量每年增長約25%。預計從2016年開始,,未來幾年整體數(shù)據(jù)中心集團業(yè)務都將增長15%,。讓我們做一些計算。
如果英特爾的計劃如期實施,,他的數(shù)據(jù)中心集團2016年收益將會達到166億美元,。云端服務提供商(其中包括在The Next Platform上使用我們的語言的云端構(gòu)建者和超大規(guī)模計算者)占大約41億美元,其余歸屬于英特爾數(shù)據(jù)中心,,銷售數(shù)據(jù)大約為125億美元。因此,,英特爾數(shù)據(jù)中心的業(yè)務增長在12%左右(除云端外),,是云端速率的一半。英特爾需要以任何方式來滿足云端的增長和明顯的FPGA需求,,即使它只占用Xeon容量的一點點,。對于英特爾來說是這個的選擇比讓GPU加速持續(xù)增長的方案要好。
編程方面可能是阻礙FPGA被廣泛采用的一個主因(不像其他加速器,,具有豐富的開發(fā)生態(tài)系統(tǒng),,如Nvidia GPU的CUDA)。這就驅(qū)動程序員去基于C語言去做擴展設計,,或使用OpenCL,,而不是用過去困擾FPGA開發(fā)的低級模型。但即使在應用的過程中有這么多里程碑,,F(xiàn)PGA仍然不被主流青睞,。我們將會探索解決編程問題的方法和機會。
雖然我們已經(jīng)與這個相對較小的生態(tài)系統(tǒng)中的許多供應商(包括Altera和Xilinx,,兩個主要供應商)進行了交流,,但按照FPGA長期研究員Russell Tessier所說,F(xiàn)PGA在更廣闊的市場上大展拳腳的日子還在前面,,新的發(fā)展意味著更廣泛的采用,。
他在馬薩諸塞大學(他還在Altera工作,并且Mentor Graphics收購的虛擬機工程的創(chuàng)始人)研究了FPGA二十多年,,他認為FPGA從科學項目到企業(yè)應用的形勢正式緩變化,。他認為其中的關(guān)鍵是來自于設計工具的改進,設計人員不斷提高他們設計高水平,。除此與外,,工具vendor可以更好地引導芯片發(fā)展。他補充說,,設備內(nèi)的大量邏輯量意味著用戶能夠?qū)崿F(xiàn)更多的功能,,這使得FPGA對更多領域更廣泛的吸引力,。
Tessier說:“在過去幾年里,F(xiàn)PGA的一個明顯趨勢就是這些設備更容易“程序化”,。
Xilinx目前鼓勵使用其Vivado產(chǎn)品的時候,,用C語言進行設計。Altera還有一個已經(jīng)開發(fā)的OpenCL環(huán)境,。關(guān)鍵是兩家公司都在試圖創(chuàng)建一個環(huán)境,,讓用戶可以使用更熟悉的編程(如C和OpenCL),而不必是使用RTL設計專家所擅長的Verilog或VHDL,。雖然在過去幾年里取得不錯的成績,,但這仍然處于推進的階段,不過這將有助于把更多的事情地移入主流,。
其中一個對FPGA真正有利的因素就是如果將其和芯片搭配使用,,建立一個快速的內(nèi)部互聯(lián),它能解決memory和數(shù)據(jù)移動中的限制,。這種優(yōu)勢就是吸引Intel收購Altera的主要誘因,。另外,如果像英特爾和IBM這樣的大公司能夠積極推動FPGA的軟件生態(tài)系統(tǒng)的建設,,其應用市場將會迅速擴張,。FPGA的主流化(至少現(xiàn)在沒有GPU那么重要,)可能會更快地出現(xiàn),。
Tessier解釋:“標準核心處理器集成的增加肯定是關(guān)鍵所在,。過去的障礙是語言和工具,隨著這些障礙越來越少,,為芯片供應商新的合作機會打開了一扇門,。由于這些和其他“主流化”趨勢出現(xiàn),不斷做出的改變的FPGA的應用領域?qū)⒗^續(xù)增長,。例如,,金融服務商店是第一個使用FPGA進行財務趨勢和股票選擇分析的用戶,但使用案例正在擴大?,F(xiàn)在有更強的設備可以解決更大的問題,。
更廣泛的應用領域
除此之外,F(xiàn)PGA通過的其他新領域發(fā)現(xiàn)新用途,,包括DNA測序,,安全性,加密和一些關(guān)鍵的機器學習任務,。
當然,,我們希望FPGA變得強大,并“進入”世界上最大的云端和超大規(guī)模數(shù)據(jù)中心,,Xilnix數(shù)據(jù)中心部門副總裁Hamant Dhulla對此表示強烈贊同,。他在2016年初,,他告訴The Next Platform, “異構(gòu)計算已經(jīng)不再是一種趨勢,,而是現(xiàn)實”,,也就是在那個時候,微軟推出了使用FPGA的Catapult案例(現(xiàn)在就很多或以后會很多),,英特爾收購了Altera以及看到了更多FPGA將廣泛應用在數(shù)據(jù)中心的聲明,。
從機器學習,高性能計算,,數(shù)據(jù)分析等領域,,F(xiàn)PGA在更多樣化的應用領域中嶄露頭角。這些都與FPGA上嵌入了越來越多可用的on-chip存儲器有關(guān),,這些都是FPGA制造商和潛在終端用戶所期待的,。 Dhulla表示,市場潛力足夠大,,讓Xilinx能夠調(diào)整其業(yè)務的方式。 過去幾年,,存儲和網(wǎng)絡主導了FPGA用戶群,。但未來五年內(nèi),計算端的需求將遠遠超過存儲和網(wǎng)絡,,并都將沿著穩(wěn)定的增長線繼續(xù)發(fā)展,。
在FPGA其他的熱門領域(包括機器學習),它們的更像是一個帶有GPU 的“協(xié)作”加速器,。毫無疑問,,對于許多機器學習工作負載的訓練部分,GPU是主要的,。因此為這里需要很多計算能力,,就像HPC一樣,其中power envelope tradeoff值得的,。但是這些客戶購買了數(shù)十或數(shù)百個GPU,,而不是數(shù)十萬個,龐大的加速器數(shù)目正使用在機器學習pipeline的推理部分,,這就是市場所在,。
正如我們指出的,Nvidia正在使用兩個獨立的GPU(用M4來訓練,,更低功耗的M4插入來削減服務器)來抵消這一點,,但Dhulla認為FPGA仍然能夠通過采用PCIe方法降低功耗,也可以嵌入超大規(guī)模數(shù)據(jù)中心,。
他們的SDAccel編程環(huán)境通過提供對C,,C ++和OpenCL的高級接口,,使其更實用,但是推動超大規(guī)模和HPC采用的真正途徑是通過最終用戶示例,。
當涉及到這些早期的用戶,,就像為下一代的FPGA的應用搭建了舞臺,Dhulla指向像Edico Genome這樣的公司,。Xilinx目前還與其他領域的客戶合作,,包括石油和天然氣和金融方面的歷史計算方面。早期客戶將Xilinx 的FPGA應用在機器學習,,圖像識別和分析以及安全性方面,,這可以看作他們計算加速業(yè)務發(fā)展的第一步。
盡管雙精度性能和總體價格不佳,,F(xiàn)PGA的真正的大規(guī)模應用機會在于云端,。因為FPGA可以提供GPU所不能提供的優(yōu)勢。如果FPGA供應商能夠說服其最終用戶,,他們的加速器可以提供相當大的性能提升(在某些情況下他們會這樣做)給關(guān)鍵的工作負載,。提供一個通過帶有其他加速器(例如CUDA)的complexity-wise的編程環(huán)境推進OpenCL開發(fā),通過在云端中提供FPGA來解決價格問題,。這可能是一個新的希望,。
當然,這種希望來源于將FPGA部署到有超密集服務器云端架構(gòu)內(nèi),,而不是在單機的銷售上,。這種模式已經(jīng)在FPGA的金融服務中發(fā)生。
正如他們GPU加速器“伙伴”圍繞深度學習進行拉動,,以便迅速得到更多的用戶,, FPGA設備在探索一個通過解決神經(jīng)網(wǎng)絡和深度學習的問題的方式找尋入侵市場的真正的機會。
新的應用程序主機意味著新的市場,,隨著云端應用的推廣消除了一些管理開銷,,它可能意味著更廣泛的采用。FPGA供應商努力推動它在一些關(guān)鍵的機器學習,,神經(jīng)網(wǎng)絡和搜索方面的應用,。FPGA在諸如自然語言處理,醫(yī)學成像,,深度數(shù)據(jù)檢測等領域中的超大規(guī)模上下文中變得越來越普遍,。
在過去一年里,F(xiàn)PGA的多種應用得到曝光,,特別是在深度學習和神經(jīng)網(wǎng)絡,,以及圖像識別和自然語言處理等領域。例如,微軟使用FPGA在1,,632個節(jié)點上提供2倍的搜索服務,,并采用創(chuàng)新的高吞吐量網(wǎng)絡來支持Altera FPGA驅(qū)動的工作。中國的搜索引擎巨頭百度(也是許多深度學習和神經(jīng)網(wǎng)絡任務GPU用戶)正在用FPGA執(zhí)行存儲控制,,其每天的數(shù)據(jù)吞吐量在100TB到1PB之間,。
使用FPGA的大規(guī)模數(shù)據(jù)中心和其他領域的應用正在吸引人們對FPGA的單精度浮點性能的更多關(guān)注。
雖然一些案例使用(包括百度示例),,將GPU作為計算加速器和FPGA用在存儲端,,但Altera,Xilnix,,Nallatech和IBM的研究人員在OpenPower聯(lián)盟展示了FPGA在云端深度學習的光明前景,。
可以說現(xiàn)在屬于FPGA的一個黃金時代。