《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 可編程邏輯 > AET原創(chuàng) > 異構(gòu)看好FPGA 加速云要為AI高算力加速

異構(gòu)看好FPGA 加速云要為AI高算力加速

2018-04-23
作者:王潔
來(lái)源:電子技術(shù)應(yīng)用

算起來(lái),,人工智能(AI)概念已經(jīng)提出60多年了,,而最近兩年,得益于智能終端的普及帶來(lái)的數(shù)據(jù)爆發(fā)式增長(zhǎng),,以及深度學(xué)習(xí),、神經(jīng)網(wǎng)絡(luò)算法的發(fā)展,,AI市場(chǎng)受到了空前的關(guān)注,但AI要得以快速普及,,還缺少高算力的推動(dòng),,需要提供更好的硬件加速條件。

2018年4月17日,,業(yè)界領(lǐng)先的異構(gòu)加速和業(yè)務(wù)卸載方案提供商杭州加速云信息技術(shù)有限公司在京舉辦了科技峰會(huì)及新產(chǎn)品發(fā)布會(huì),,隆重發(fā)布了四大創(chuàng)新產(chǎn)品(兩個(gè)系列硬件加速產(chǎn)品(SC-OPS, SC-VPX)、兩個(gè)IP庫(kù) (FDNN, FBLAS))及三大解決方案(深度學(xué)習(xí)解決方案,、高性能計(jì)算及數(shù)字信號(hào)處理解決方案,、邊緣計(jì)算解決方案)。

搶先布局異構(gòu)計(jì)算

杭州加速云信息技術(shù)有限公司創(chuàng)始人兼CEO鄔剛是學(xué)習(xí)通信出身,,最早跟隨中國(guó)程控電話(huà)交換機(jī)之父鄔江興院士進(jìn)入通信行業(yè),。兩年之后,他加入了華為負(fù)責(zé)芯片設(shè)計(jì),。2007年開(kāi)始創(chuàng)業(yè),,創(chuàng)辦過(guò)3家公司,對(duì)CPU總線,、多核處理器的發(fā)展有著清晰的理解,。經(jīng)過(guò)多年的積累和對(duì)未來(lái)市場(chǎng)的預(yù)估,2015年9月,,鄔剛先生創(chuàng)辦了加速云,。

加速云 CEO 鄔剛.jpg

杭州加速云信息技術(shù)有限公司創(chuàng)始人兼CEO 鄔剛

加速云的解決方案可以廣泛應(yīng)用于深度學(xué)習(xí)、人工智能,、金融,、機(jī)器視覺(jué)等領(lǐng)域,。目前已與阿里、騰訊,、科大訊飛等多家企業(yè)開(kāi)展深入合作,。

“加速云是從技術(shù)上推導(dǎo)出來(lái)的一家公司,起源于2014年我們家迎來(lái)第一個(gè)小朋友,,在陪產(chǎn)過(guò)程中形成的一個(gè)想法,。” 鄔剛先生提及創(chuàng)辦加速云的心路歷程,,“在2014年,,按照英特爾的發(fā)展,下一步一定是異構(gòu),,我們當(dāng)時(shí)認(rèn)為異構(gòu),,要么用GPU,要么用FPGA,。英特爾在GPU上有一次失敗嘗試,加上GPU自身功耗太高等問(wèn)題,,F(xiàn)PGA會(huì)是異構(gòu)計(jì)算的一個(gè)理想選擇,。”

事實(shí)上,,在加速云誕生之初已經(jīng)擁有強(qiáng)大的技術(shù)儲(chǔ)備,。基于FPGA來(lái)做異構(gòu)計(jì)算是鄔剛先生2014年4月就想出來(lái)的計(jì)劃,,直等到2014年10月英特爾在IDF大會(huì)上宣布x86+FPGA處理器,,他認(rèn)為這個(gè)機(jī)會(huì)點(diǎn)來(lái)了,11月份正式開(kāi)始研究,,到2015年4月,,研發(fā)出了第一代原型機(jī),2015年9月開(kāi)始量產(chǎn),,加速云公司隨之注冊(cè),。

在深度學(xué)習(xí)中,做好算法只完成了1/3,,在這個(gè)團(tuán)隊(duì)里面,,既需要很強(qiáng)的實(shí)現(xiàn)算法的能力,還要有非常強(qiáng)的工程化能力,,這種工程化的能力,,包括接口和實(shí)現(xiàn)量產(chǎn)的能力?!拔覀冎雷龀鲆粋€(gè)東西很容易,,但是做好還是挺難的,。我們有一個(gè)非常小的板卡,迭代了四代,,每一次迭代都要花百萬(wàn)人民幣,,因?yàn)橛布度牒艽螅看蔚锌赡苤桓牧艘稽c(diǎn),,我們發(fā)現(xiàn)未來(lái)可能存在的一些風(fēng)險(xiǎn)問(wèn)題,,就把它改掉,這是我們團(tuán)隊(duì)特別的地方,。我們是一個(gè)工程化能力非常強(qiáng)的團(tuán)隊(duì),,整體技術(shù)行不行是我們最重要的考量?!?鄔剛先生介紹,。

基于FPGA的異構(gòu)計(jì)算是趨勢(shì)

目前處于AI大爆發(fā)時(shí)期,異構(gòu)計(jì)算的選擇主要在FPGA和GPU之間,。盡管目前異構(gòu)計(jì)算使用最多的是利用GPU來(lái)加速,,F(xiàn)PGA作為一種高性能、低功耗的可編程芯片,,在處理海量數(shù)據(jù)時(shí),,F(xiàn)PGA計(jì)算效率更高,優(yōu)勢(shì)更為突出,,尤其在大量服務(wù)器部署時(shí),,隱形的運(yùn)營(yíng)成本會(huì)得到顯著降低。

此外,,低延遲,、確定性延遲,也是FPGA天然的優(yōu)勢(shì),。

鄔剛表示:“人工智能已經(jīng)進(jìn)入我們的生活,,但是未來(lái)發(fā)展還存在瓶頸,需要硬件技術(shù)和算法方面的突破,。異構(gòu)計(jì)算是計(jì)算架構(gòu)的未來(lái)趨勢(shì),,而FPGA 是實(shí)現(xiàn)異構(gòu)計(jì)算的完美選擇。加速云創(chuàng)新的異構(gòu)計(jì)算加速平臺(tái)解決方案,,具有高性能,、高效率、低延時(shí)特性以及可編程性和遠(yuǎn)程可重構(gòu)能力,,非常適合云上的彈性業(yè)務(wù)的需求,。我們希望能夠通過(guò)我們的技術(shù),幫助更多的企業(yè)實(shí)現(xiàn)深度學(xué)習(xí),,在大數(shù)據(jù)時(shí)代贏得先機(jī),?!?/p>

全球最高性能FPGA加速卡

SC-OPS是加速云推出的全球首張Intel Stratix 10 FPGA加速卡,采用Intel最新14nm工藝的Stratix10 GX2800 FPGA器件,,單板支持12個(gè)200維雙精度線性方程求解,,運(yùn)算時(shí)間為466us,為x86系統(tǒng)60~120倍性能,;單卡可以實(shí)現(xiàn)4500幀/S以上圖像分類(lèi)(采用AlexNet卷積神經(jīng)網(wǎng)絡(luò)模型,,int16)。

SC-OPS.jpg

SC-OPS可以廣泛應(yīng)用于數(shù)據(jù)中心,、云計(jì)算,、機(jī)器視覺(jué)、深度學(xué)習(xí),、高性能計(jì)算,、仿真、金融等領(lǐng)域,。

全球最高集成度VPX業(yè)務(wù)卡

SC-VPX是全球計(jì)算密度最高的VPX刀片加速平臺(tái),,采用Intel Stratix 10 GX2800器件,兼容GX1650,,構(gòu)造業(yè)界先進(jìn),、靈活、高效的信號(hào)處理和深度學(xué)習(xí)架構(gòu),,主要定位高校研究所等單位的雷達(dá)、通信,、深度學(xué)習(xí)相關(guān)領(lǐng)域的產(chǎn)品原型快速搭建和算法開(kāi)發(fā)與應(yīng)用,。

SC-VPX.jpg

6U整機(jī)可以支持92T/50T FLOPS單精度浮點(diǎn)處理能力,整機(jī)可以通過(guò)交換板互聯(lián)構(gòu)筑更大的系統(tǒng),;支持OpenCL,、Verilog開(kāi)發(fā),支持高性能計(jì)算庫(kù),。

RTL級(jí)深度學(xué)習(xí)加速庫(kù)

深度學(xué)習(xí)加速庫(kù)FDNN是國(guó)內(nèi)首個(gè)支持通用卷積神經(jīng)網(wǎng)絡(luò)的FPGA加速庫(kù),,基于RTL級(jí)代碼,可以提供很高的性能和靈活配置特性,。

參數(shù)可配置的深度學(xué)習(xí)基礎(chǔ)庫(kù):卷積,、池化、全連接,、非線性函數(shù),;兼容CAFFE/TensorFlow模型數(shù)據(jù);常見(jiàn)各種模型:VGG16, Lenet, YOLO, SSD, ResNet,。

FDNN.jpg

RTL級(jí)高性能數(shù)學(xué)加速庫(kù)

高性能計(jì)算加速庫(kù)FBLAS是業(yè)界更高性能的RTL級(jí)數(shù)學(xué)加速庫(kù),。參數(shù)可配的OpenBlas庫(kù)Level2/3:矩陣乘,、矩陣分解、矩陣求逆,,線性方程求解,、微分方程求解,三角函數(shù),、非線性求解,、超越函數(shù),傅里葉變換,。

FBLAS.jpg

FDNN是專(zhuān)門(mén)為深度學(xué)習(xí)設(shè)計(jì)的,,F(xiàn)BLAS更多是偏向于數(shù)字信號(hào)處理和高性能計(jì)算。

三大解決方案

?深度學(xué)習(xí)加速解決方案-加速云推出一整套基于FPGA的深度學(xué)習(xí)加速方案,,包括SC-OPM/SC-OPF/SC-OPS加速卡及FDNN加速庫(kù),,滿(mǎn)足客戶(hù)對(duì)深度學(xué)習(xí)高性能、靈活性加速要求,。為了方便客戶(hù)使用高層語(yǔ)言開(kāi)發(fā),,加速云提供基于FPGA完整的OpenCL異構(gòu)開(kāi)發(fā)環(huán)境,快速實(shí)現(xiàn)用戶(hù)自定義的深度學(xué)習(xí)加速方案,。同時(shí)加速云也提供快速深度神經(jīng)網(wǎng)絡(luò)定制加速服務(wù),。

?數(shù)字信號(hào)處理解決方案-針對(duì)雷達(dá)、通信等數(shù)字信號(hào)處理系統(tǒng)的要求,,結(jié)合Intel最新14nm工藝的 Stratix10 FPGA系列,,加速云提供了一套完整的硬件和軟件相結(jié)合的解決方案,實(shí)現(xiàn)了高性能矩陣運(yùn)算(矩陣乘,、轉(zhuǎn)置,、求逆、QR分解)和超高速FFT(傅立葉變換),。為了方便客戶(hù)使用高層語(yǔ)言開(kāi)發(fā),,加速云提供基于FPGA完整的OpenCL異構(gòu)開(kāi)發(fā)環(huán)境,快速實(shí)現(xiàn)用戶(hù)自定義的信號(hào)處理加速方案,。

?邊緣計(jì)算解決方案-加速云智能工控解決方案采用高性能Intel Arria10 GX660器件, 具有模塊化設(shè)計(jì),,強(qiáng)實(shí)時(shí)特性和高性能的算法IP加速、完整的OpenCL異構(gòu)開(kāi)發(fā)環(huán)境,,可以實(shí)現(xiàn)新一代高性能邊緣計(jì)算網(wǎng)關(guān),,應(yīng)用于各種工業(yè)環(huán)境。

加速云最核心的競(jìng)爭(zhēng)力在于其IP方面,,除了用于數(shù)字信號(hào)處理和高性能計(jì)算的數(shù)學(xué)庫(kù)FBLAS,,以及用于深度學(xué)習(xí)的FDNN庫(kù),還具有很多接口類(lèi)的IP(高速通信接口,、視頻接口),、協(xié)議類(lèi)IP(壓縮,、解壓縮、加解密),,研發(fā)團(tuán)隊(duì)在FPGA方面有著十多年的經(jīng)驗(yàn),,積累了很多相關(guān)的IP。

憑借自身在FPGA上的技術(shù)優(yōu)勢(shì),,加速云獲得合作伙伴的大力支持,,可以率先拿到英特爾第一批流片的內(nèi)部測(cè)試芯片,對(duì)加速云保持技術(shù)領(lǐng)先非常重要,。

北京站是加速云“加速新科技,,驅(qū)動(dòng)智未來(lái)” 科技峰會(huì)的首站,接下來(lái)加速云將在上海,、成都,、西安三大城市分享其最新成果。過(guò)去兩年,,加速云平均每年都有獲得一次融資,,據(jù)悉,第三輪融資正在達(dá)成,。

   

 


此內(nèi)容為AET網(wǎng)站原創(chuàng),,未經(jīng)授權(quán)禁止轉(zhuǎn)載。