《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 可編程邏輯 > 業(yè)界動態(tài) > AI芯片有救了 看FPGA化身救世主

AI芯片有救了 看FPGA化身救世主

2018-09-03
關(guān)鍵詞: 英特爾 紫光 芯片 FPGA

  “AI芯片”這個新鮮的概念在過去一年間逐漸走過了普及的階段,,越來越被大眾所熟知,。在行業(yè)走過野蠻生長,,開始加速落地,、加速整合的過程中,,也有更多的AI芯片公司也開始走出屬于自己的差異化路線,。

  記者在此前AI芯片系列報道第一季之后,,再次出發(fā),,進一步對AI芯片全產(chǎn)業(yè)鏈上下近百間核心企業(yè)進行差異化的深度追蹤報道。此為智東西AI芯片產(chǎn)業(yè)系列報道第二季之一,。

  隨著大數(shù)據(jù)發(fā)展和算力的提升,,AI芯片正迎來新一輪的爆發(fā)期。

  近兩年來,,越來越多以FPGA切入AI芯片的玩家涌現(xiàn)出來,,包括國內(nèi)AI芯片創(chuàng)企深鑒科技、百度XPU,、微軟Project Brainwave,、深思考醫(yī)療影像專用AI芯片等等。

  盡管ASIC在性能功耗上往往有更好的表現(xiàn),,不過我們發(fā)現(xiàn),,在一片紅海的AI芯片市場中,F(xiàn)PGA憑借自己獨特的優(yōu)勢占有了一席之地,。甚至有媒體報道稱,,F(xiàn)PGA是AI芯片的終極未來。

  這一觀點是否準確我們暫且不論,,但它的確在AI芯片領(lǐng)域引起了不少波瀾,,也不禁讓我們想要問一句,“AI芯片新救星,?FPGA真的這么神嗎,?”

  一、FPGA屆的肯德基跟麥當勞:賽靈思vs英特爾Altera

  FPGA(Field-Programmable Gate Array)即現(xiàn)場可編程門陣列,,其靈活性介于CPU,、GPU等通用處理器和專用集成電路ASIC之間,在硬件固定的前提下,,允許使用者靈活使用軟件進行編程,。它的開發(fā)周期比ASIC短,不過相對于批量出貨ASIC,,單個FPGA的成本會更高,。

  由于FPGA容錯空間相對更大,以前FPGA常被用作ASIC芯片流片前的硬件驗證方法,。

  目前,,F(xiàn)PGA芯片的主要四家生產(chǎn)廠家都在美國:Xilinx(賽靈思)、Altera(阿爾特拉),、Lattice(萊迪思)和Microsemi(美高森美),。它們一共占了98%以上的市場份額,其中,,絕大多數(shù)市場被賽靈思和Altera瓜分,,賽靈思約占49%,,Altera約占39%。

  近三年,,F(xiàn)PGA行業(yè)完成了多項并購,。2015年6月,英特爾宣布以167億美元收購Altera(阿爾特拉),。2016年上半年,,紫光在公開市場收購萊迪思6.07%的股權(quán),同年11月萊迪思被Canyon Bridge以13億美元收購,,但此案一直沒有獲得美國監(jiān)管單位同意,。

  這些并購案并未影響到FPGA在AI芯片市場的整體格局。幾乎二分天下的賽靈思和英特爾確立了相似的FPGA戰(zhàn)略布局,,均將重心放在了數(shù)據(jù)中心市場,,并都致力于讓FPGA編程更簡單。

  1,、FPGA的創(chuàng)造者——賽靈思

  說到FPGA,,絕對避不開的公司就是賽靈思,因為這項芯片技術(shù)就是賽靈思開創(chuàng)的,。從2011年起,賽靈思提出全可編程(All Programmale)理念,,將FPGA技術(shù)從傳統(tǒng)的通訊,、航空、國防等領(lǐng)域拓展到了AI和云計算領(lǐng)域的應(yīng)用,。

  去年12月,,記者曾對賽靈思全球銷售和市場部亞太及日本地區(qū)高級總監(jiān)周海天進行深度專訪( 對話賽靈思:33年老牌芯片廠如何在AI浪潮里新興業(yè)務(wù)年增46% ),周海天告訴智東西,,16nm產(chǎn)品是賽靈思眾多產(chǎn)品線中最受AI應(yīng)用廠商歡迎的產(chǎn)品,,其尖端技術(shù)能將更多可編程應(yīng)用邏輯元件集成在芯片上,滿足AI對強大計算能力的需求,。

  作為FPGA行業(yè)長期的霸主,,賽靈思擁有超過2萬家下游客戶,其中亞馬遜AWS,、以及中國的BAT云服務(wù)巨頭都是它的客戶,。

  今年3月,賽靈思新CEO Victor Peng上任之后不久,,就宣布了賽靈思在AI時代的三大戰(zhàn)略布局:數(shù)據(jù)中心優(yōu)先,、加速八大主流市場發(fā)展、以及重磅推出全新一代AI芯片架構(gòu)ACAP,。

  首款代號為“珠穆朗瑪峰(Everest)”的ACAP AI芯片新品將采用臺積電7nm工藝打造,,今年內(nèi)實現(xiàn)流片,,2019年向客戶交付發(fā)貨。( 首發(fā),!賽靈思推顛覆性AI芯片 正面宣戰(zhàn)英偉達英特爾 )

  而在終端AI方面,,賽靈思則在今年收購了國內(nèi)三大AI芯片獨角獸之一的深鑒科技,主攻終端人工智能,。深鑒科技是國內(nèi)少數(shù)以FPGA切入AI芯片,、并取得不錯成果的代表性玩家之一。( 突發(fā),!AI芯片獨角獸深鑒科技被美國賽靈思收購 )

  此外,,賽靈思FPGA也長期深耕在車用領(lǐng)域,適用于處理越來越復(fù)雜的先進駕駛輔助系統(tǒng)(ADAS)和自動駕駛,。

  某AI芯片創(chuàng)業(yè)公司CEO透露,,相較其他進入自動駕駛車市場的AI芯片公司,只有賽靈思有車規(guī)級的 FPGA,,L1-L3層找不到比賽靈思性價比更高的平臺,, 因此賽靈思至少在5年內(nèi)有較好的市場契機。

  2,、英特爾收購Altera

  另一個FPGA行業(yè)不得不提的大事就是英特爾收購Altera,。為了增強其在AI芯片領(lǐng)域的競爭力,2015年,,英特爾以167億美元天價收購Altera,,這也是迄今為止英特爾史上最大手筆的收購。英特爾隨即設(shè)立研發(fā)FPGA芯片的可編碼部門(PSG),。

  FPGA是英特爾的AI芯片布局之一,,但英特爾最重要的AI芯片項目還是難產(chǎn)多年的Nervana神經(jīng)網(wǎng)絡(luò)處理器項目。

  英特爾采用雙管齊下的FPGA戰(zhàn)略:一方面打造CPU-FPGA混合器件,,讓FPGA與處理器協(xié)同工作,;另一方面基于Arria FPGA或Stratix FPGA打造可編程加速卡(PAC/programmable acceleration card)。

  基于FPGA技術(shù),,英特爾已經(jīng)構(gòu)建了一個完善的NFV生態(tài),,覆蓋軟硬件廠商、系統(tǒng)集成商,、電信運營商,、OTT廠商等相關(guān)企業(yè)。

  此外,,英特爾還為OME廠商提供一個面向包含F(xiàn)PGA的英特爾至強可擴展處理器的英特爾加速堆棧,,進而為客戶提供完整的軟硬件一體的FPGA解決方案。

  英特爾在7月收購芯片公司eASIC后將其并入PSG部門,,并隨后透露這一收購案主要是為了滿足解決客戶痛點,,滿足FPGA客戶端的降低成本和能耗需求,,并提供可降低16nm、10nm,、7nm制程的FPGA產(chǎn)品成本的規(guī)?;夹g(shù)。

  目前加速卡還是FPGA進入硬件領(lǐng)域的主要形態(tài)之一,,不過英特爾已經(jīng)在進行其他方向,、其他形態(tài)的探索,并在積極推進和其他數(shù)據(jù)中心OEM廠商在FPGA方面的合作,。

  二,、FPGA AI芯片市場的主要玩家

  近兩年來,F(xiàn)PGA在數(shù)據(jù)中心的應(yīng)用日益廣泛,。目前,,F(xiàn)PGA服務(wù)器已在全球七大超級云計算數(shù)據(jù)中心IBM、Facebook,、微軟Azure,、AWS、百度云,、阿里云,、騰訊云得到部署。由于ASIC路線風險高,,目前僅有谷歌批量部署TPU,。

  1、最會玩FPGA的微軟AI:BrainWave項目

  微軟Azure與FPGA的淵源可以追溯到八年前,,當時的Bing(必應(yīng))搜索引擎無論是搜索結(jié)果還是相應(yīng)速度都比不過谷歌搜索。為了滿足Bing的需求,,2010年底,,一位微軟研究員提出了能在FPGA上運行Bing機器學習算法的硬件設(shè)計得到了微軟的認可。

  如今,,F(xiàn)PGA在加速數(shù)據(jù)處理方面的出色表現(xiàn)使它在微軟Bing,、Azure云計算服務(wù)和Office 365中均得到部署。

  今年3月26日,,微軟Bing官方微博宣布通過英特爾Arria FPGA和Stratix FPGA芯片打造出Project Brainwave深度學習加速平臺,。該平臺將DNN處理單元整合入FPGA,支持微軟Cognitive Toolkit,、谷歌Tensorflow等流行深度學習框架的軟件棧,,能夠執(zhí)行Bing智能搜尋功能所需的大規(guī)模機器閱讀理解任務(wù)。

  在5月微軟Build 2018大會上,,微軟AI芯片Brainwave開放了云端試用版,,開發(fā)者現(xiàn)在可以接入微軟Azure云,,試用由Project Brainwave芯片計算平臺提供的AI服務(wù)。微軟稱其延遲比谷歌TPU低5倍,,正面對標谷歌,。Project Brainwave可以看作微軟基于英特爾FPGA芯片打造的低延遲AI芯片。

  總的來說,,微軟基于FPGA打造的AI芯片是目前業(yè)內(nèi)最認可的FPGA方案之一,。

  2、百度XPU

  相比微軟對英特爾FPGA的專一,,百度對FPGA生產(chǎn)廠商的態(tài)度更為開放,。從2011年起,百度已就開始將FPGA應(yīng)用到搜索,、圖像,、語音等多個核心業(yè)務(wù),它的數(shù)據(jù)中心,、云計算平臺和自動駕駛項目都部署了大量的FPGA,。

  在去年加州Hot Chips大會上,百度發(fā)布和賽靈思合作完成的基于FPGA的256核云計算加速芯片XPU,?;贔PGA加速器擅長處理計算任務(wù)的特點,XPU兼具GPU的通用性和FPGA高效率,、低能耗的特點,,旨在處理多樣化的計算任務(wù),對百度深度學習平臺PaddlePaddle優(yōu)化和加速,,并實現(xiàn)性能和效率的平衡,。

  百度和英特爾已有超過十年的合作歷史,近兩年雙方在AI領(lǐng)域的合作加強,。

  在今年的百度AI開發(fā)者大會上,,英特爾人工智能事業(yè)部副總裁兼人工智能架構(gòu)總經(jīng)理Gadi Singer透露,百度正在開發(fā)基于英特爾最新FPGA技術(shù)的異構(gòu)計算平臺,,這項技術(shù)將靈活加速百度云上的工作負載,。

  3、深鑒科技

  深鑒科技是國內(nèi)一家年輕卻履歷亮眼的AI芯片公司,,前年成立,,去年年初估值超過10億,今年7月18日被全球第一大FPGA廠商賽靈思收購,,其科研成果也在國際AI頂級會議屢獲大獎,。

  FPGA開發(fā)難度大、周期長(一般需要3-6個月)的高門檻曾將許多公司拒之門外,深鑒從這一痛點嗅到商機,。從2016年成立以來,,深鑒科技一直基于賽靈思FPGA技術(shù)平臺開發(fā)機器學習解決方案。經(jīng)深鑒科技優(yōu)化的神經(jīng)網(wǎng)絡(luò)剪枝技術(shù)運行在賽靈思FPGA器件上,,可實現(xiàn)更優(yōu)的性能和能效,。

  該公司提出深度學習處理單元DPU(Deep Learning Processing Unit)系列,為不愿直接使用FPGA的廠商提供了一個帶接口的黑盒子,。廠商只需把自己的模型訓(xùn)練好,,將模型和數(shù)據(jù)從接口導(dǎo)入,就能直接獲得需要的輸出,。深鑒負責其中的壓縮和編譯,,生成指令可在FPGA上運行。

  ▲DPU 系列:用于嵌入端的亞里士多德板(上)和用于大數(shù)據(jù)端的笛卡爾板(下)

  不過在后期,,深鑒科技也開始涉足ASIC AI芯片的設(shè)計與流片,,曾經(jīng)發(fā)布“聽濤”、“觀?!眱煽預(yù)I芯片并宣布2018年流片,,不過暫時沒有看到相關(guān)產(chǎn)品信息。

  4,、騰訊云,、華為云、阿里云

  近年來,,賽靈思和英特爾在中國云服務(wù)市場可謂是動作頻頻,,和華為云、阿里云,、騰訊云等國內(nèi)頂尖的云計算服務(wù)提供商分別展開合作,。

  去年年初,騰訊云發(fā)布國內(nèi)首款高性能異構(gòu)計算基礎(chǔ)設(shè)施——FPGA云服務(wù)器,,隨后推出基于賽靈思VU9P FPGA卡的FX3實例和基于Intel Stratix10 FPGA卡的FI3實例,。

  華為云也在今年年初聯(lián)合賽靈思FPGA宣布在歐洲首次推出華為云FPGA加速云服務(wù)器(FACS)平臺,該平臺搭載了賽靈思高性能 Virtex UltraScale+ VU9P FPGA,,為用戶提供高性能的FPGA加速云服務(wù)。華為云還推出FPGA加速云服務(wù)器FP1 DPDK實例和推出了FP1 OpenCL實例,。

  今年5月,,阿里云發(fā)布新一代FPGA計算實例F3,采用其自研高性能FPGA加速卡,,搭載賽靈思16nm Virtex UltraScale+器件VU9P,,提供16個VU9P實力規(guī)格,首創(chuàng)統(tǒng)一FPGA SHELL架構(gòu)和FPGA虛擬化支持方案,,使阿里云客戶能加速機器學習,、數(shù)據(jù)分析,、基因組學和視頻處理等多種工作負載。

  5,、其他玩家

  目前,,國內(nèi)能夠生產(chǎn)FPGA的公司包括紫光國芯、智多晶和AgateLogic等,。而國內(nèi)深思考人工智能,、瑞為智能、深維科技,、高云半導(dǎo)體,、安路科技、京微雅格等公司,,都曾宣布具有基于FPGA的AI芯片開發(fā)能力,。

  紫光國芯是國內(nèi)上市公司中唯一能夠量產(chǎn)FPGA的廠商,其FPGA,、ASIC和特種微處理器常年為軍方穩(wěn)定供貨,。該公司在2016年9月正式推出國內(nèi)首款內(nèi)嵌高速接口(serdes)的千萬門級高性能FPGA芯片——Pango PGT180H。

  深思考人工智能公司在今年3月的GTIC 2018全球AI芯片創(chuàng)新峰會上發(fā)布全球首款基于FPGA醫(yī)療影像專用AI芯片——M-DPU,,該芯片在100秒內(nèi)可以分類90000個細胞,,同時具備先進醫(yī)學影像算法加速核心和深度學習加速核心。

  深思考CEO楊志明告訴智東西,,F(xiàn)PGA的研發(fā)周期比ASIC快很多,,適于算法還在不斷演進智慧醫(yī)療影像領(lǐng)域。深思考的DPU不是通用DPU,,而是面向特定應(yīng)用領(lǐng)域的DPU,,在AI領(lǐng)域的最大優(yōu)勢是DPU與特定領(lǐng)域算法的深度整合,形成面向特定場景的一站式整體解決方案,。

  瑞為智能是國內(nèi)最早使用FPGA實現(xiàn)技術(shù)路徑的AI芯片公司之一,,該公司在2015年就做了基于FPGA的AI芯片,滿足前端攝像機對高算力和低功耗的需求,,并在2016年實現(xiàn)規(guī)模商用,。其AI芯片能使攝像機的圖像處理達到每秒25幀,從而提取清晰的人臉圖像供云端識別分析,。

  除了創(chuàng)企外,,國內(nèi)研究機構(gòu)如北京大學、清華大學,、中國科學院等在基于FPGA的AI芯片領(lǐng)域都有深入研究,。比如,北京大學曾聯(lián)合商湯科技提出一種基于 FPGA 的快速 Winograd 算法,可大幅降低算法復(fù)雜度,,改善 FPGA 上的 CNN 性能,。

  三、FPGA在AI芯片行業(yè)的發(fā)展趨勢

  目前FPGA在AI芯片行業(yè)呈現(xiàn)出幾種不同的發(fā)展趨勢,,一個是在FPGA的基礎(chǔ)上推出優(yōu)化架構(gòu),,一個是最大化程度挖掘FPGA的使用疆域,還有一個是將FPGA作為跳板,,逐步轉(zhuǎn)向?qū)S枚ㄖ菩酒珹SIC,。

  1、基于FPGA優(yōu)化架構(gòu)

  基于FPGA進行優(yōu)化架構(gòu)的發(fā)展路線以賽靈思為代表,。面對價格貴,、開發(fā)難度大的問題,今年3月,,賽靈思發(fā)布歷時4年,、投入超過10億美元打造的新一代AI芯片架構(gòu)ACAP,直接宣戰(zhàn)英偉達,、英特爾處理器,,對此智東西曾做深入報道( 首發(fā)!賽靈思推顛覆性AI芯片 正面宣戰(zhàn)英偉達英特爾 ),。

  2,、長期最大化使用FPGA

  微軟則是長期最大化程度挖掘FPGA使用邊界的典型玩家。從八年前起,,微軟就執(zhí)著于將FPGA作為其核心AI計算平臺,。從使用裝滿FPGA的專用服務(wù)器集群,到用專用網(wǎng)絡(luò)連接的FPGA加速卡集群,,再到將共享數(shù)據(jù)中心網(wǎng)絡(luò)的大規(guī)模FPGA云服務(wù),,微軟一直在嘗試FPGA部署的各種可能,尋找將FPGA優(yōu)勢發(fā)揮的最優(yōu)路徑,。

  3,、FPGA的終點是ASIC?

  目前,,業(yè)內(nèi)的主流觀點是:隨著AI算法的進一步成熟固化,,AI芯片最終會走向ASIC——也就是較為固定的芯片架構(gòu)。

  不過,,賽靈思CEO Victor Peng持有不同觀點,,他告訴智東西,AI算法迭代,、應(yīng)用創(chuàng)新的速度還將持續(xù)很長一段時間,甚至會維持10-20年之久,因此一款靈活,、可應(yīng)變的計算平臺將成為創(chuàng)新的重中之重,。

  而且,未來最終并不會是一款A(yù)I芯片架構(gòu)統(tǒng)一天下的局面,,我們越來越需要能夠適應(yīng)眾多AI應(yīng)用,、適應(yīng)不斷變化的AI算法的新型芯片架構(gòu)出現(xiàn)。

  與此同時,,英特爾可編程解決方案事業(yè)部亞太區(qū)市場拓展經(jīng)理劉斌也認為,,F(xiàn)PGA在所有市場領(lǐng)域里都會占有一定的市場份額,從原生市場環(huán)境而言,,F(xiàn)PGA和ASIC都有一個競爭合作的共生環(huán)境,。

  “專用的ASIC其實還是非常有競爭力的,”劉斌表示,,“不過FPGA是在所有的垂直市場都會有一定的份額,,這種靈活性和普適性是FPGA最主要的價值?!?/p>

  某AI芯片創(chuàng)業(yè)公司CEO告訴智東西,,至少在在深度學習算法穩(wěn)定前,F(xiàn)PGA都有其生存空間,。因為很多公司都發(fā)現(xiàn),,剛做完傳統(tǒng)算法硬化,過了半年,,內(nèi)部算法團隊又把算法換了,。

  深思考CEO楊志明則認為,F(xiàn)PGA與ASIC融合是AI計算的未來,。單純的ASIC芯片無法完全替代FPGA,,也不具備FPGA的靈活性。就如同ASIC到現(xiàn)在都無法在傳統(tǒng)領(lǐng)域完全替代FPGA一樣,,在AI領(lǐng)域,,F(xiàn)PGA與ASIC也會分而治之。智慧工業(yè)機器人,、智慧通信,、智慧醫(yī)療、智慧裝備等領(lǐng)域都是除FPGA以外的其他AI芯片難以介入的應(yīng)用領(lǐng)域,。

  結(jié)語:深度學習加持,,F(xiàn)PGA前景可期

  最近一年,AI芯片踏入紅海,,除了賽靈思,、英特爾等傳統(tǒng)芯片巨頭外,,國內(nèi)外眾多AI芯片創(chuàng)企也紛紛加入戰(zhàn)場。FPGA的可編程性使軟件和終端應(yīng)用公司能夠根據(jù)算法靈活修改解決方案,,這讓它在AI芯片市場愈發(fā)有存在感,。

  當下AI仍處于早期階段,AI算法正從訓(xùn)練環(huán)節(jié)走向推理環(huán)節(jié),,這個過程需要對訓(xùn)練后的模型進行壓縮,,在基本不損失模型精度的情況下將模型壓縮到原來的幾十分之一。在這一階段,,AI是向著有利于FPGA發(fā)展的方向進行優(yōu)化和升級的,。

  FPGA或許只是小眾的芯片,但在AI市場上,,它的普適性和靈活性都使其有適合發(fā)揮其優(yōu)勢的應(yīng)用場景,。在各類AI芯片之間沒有拉開絕對差距之前,每一種技術(shù)路線都有其發(fā)揮更多價值的空間,。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點,。轉(zhuǎn)載的所有的文章,、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者,。如涉及作品內(nèi)容、版權(quán)和其它問題,,請及時通過電子郵件或電話通知我們,,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失,。聯(lián)系電話:010-82306118,;郵箱:[email protected]