百度發(fā)布XPU：AI云計(jì)算加速芯片（基于FPGA，256核心） -AET-電子技術(shù)應(yīng)用

百度發(fā)布XPU：AI云計(jì)算加速芯片（基于FPGA，256核心）

日期： 2017-08-24

關(guān)鍵詞： 百度 FPGA XPU Xilinx

△ 百度解釋了FPGA上AI和數(shù)據(jù)分析工作負(fù)載的情況

在加州Hot Chips大會上，百度發(fā)布XPU，這是一款256核、基于FPGA的云計(jì)算加速芯片。合作伙伴是賽思靈（Xilinx）。百度也在這次的大會上，透露了關(guān)于這款芯片的更多架構(gòu)方面的細(xì)節(jié)。

過去幾年，百度在深度學(xué)習(xí)領(lǐng)域，尤其是基于GPU的深度學(xué)習(xí)領(lǐng)域取得了不錯的進(jìn)展。而且，百度也在開發(fā)被稱作XPU的新處理器。

百度研究員歐陽劍表示，百度設(shè)計(jì)的芯片架構(gòu)突出多樣性，著重于計(jì)算密集型、基于規(guī)則的任務(wù)，同時確保效率、性能和靈活性的最大化。今天，他在Hot Chips大會上與來自FPGA廠商Xilinx的人士一同發(fā)布了XPU。

△ 百度去年宣布采用Xilinx Kintex UltraScale FPGA加速數(shù)據(jù)中心的額機(jī)器學(xué)習(xí)應(yīng)用

XPU的目標(biāo)是在性能和效率之間實(shí)現(xiàn)平衡，并處理多樣化的計(jì)算任務(wù)。FPGA加速器本身很擅長處理某些計(jì)算任務(wù)，但隨著許多小內(nèi)核交織在一起，多樣性程度將會上升。

歐陽劍表示：“FPGA是高效的，可以專注于特定計(jì)算任務(wù)，但缺乏可編程能力。傳統(tǒng)CPU擅長通用計(jì)算任務(wù)，尤其是基于規(guī)則的計(jì)算任務(wù)，同時非常靈活。GPU瞄準(zhǔn)了并行計(jì)算，因此有很強(qiáng)大的性能。XPU則關(guān)注計(jì)算密集型、基于規(guī)則的多樣化計(jì)算任務(wù)，希望提高效率和性能，并帶來類似CPU的靈活性。”

目前XPU有所欠缺的仍是可編程能力，而這也是涉及FPGA時普遍存在的問題。到目前為止，XPU尚未提供編譯器。不過歐陽劍表示，該團(tuán)隊(duì)將會很快開發(fā)一款編譯器。

歐陽劍還表示

為了支持矩陣、卷積，以及其他大大小小的內(nèi)核，我們需要一個配備高帶寬低延時內(nèi)存，以及高帶寬I/O接口的大型數(shù)學(xué)陣列。FPGA中XPU的DSP單元提供了并行處理能力，片外DDR4和HBM接口優(yōu)化了數(shù)據(jù)傳輸，而片上SRAM則提供了必要的存儲特性。

在Micro Benchmark測試中，對于計(jì)算密集型、常規(guī)內(nèi)存訪問的計(jì)算任務(wù)，XPU的效率與x86內(nèi)核類似。對于數(shù)據(jù)同步的計(jì)算任務(wù)，XPU的可擴(kuò)展性應(yīng)當(dāng)可以進(jìn)一步優(yōu)化。而對于沒有數(shù)據(jù)同步的計(jì)算任務(wù)，XPU的可擴(kuò)展性與核心數(shù)量呈線性關(guān)系。

這就是問題所在。如前所述，XPU仍然沒有配備編譯器。這款處理器在FPGA上實(shí)現(xiàn)，通過訂制的邏輯電路提供指令。這些小核心類似于CPU，開發(fā)者只能使用匯編語言，而所有的執(zhí)行都由主機(jī)來控制。整個流程包括拆分計(jì)算任務(wù)，編寫XPU代碼，調(diào)用專用的邏輯函數(shù)，從而在Linux平臺上進(jìn)行編譯和運(yùn)行。

△ XPU具有256個內(nèi)核，集成了一個共享內(nèi)存用于數(shù)據(jù)同步。所有內(nèi)核都運(yùn)行在600MHz。

歐陽劍稱：“在百度，我們使用FPGA已有多年時間。我們的數(shù)據(jù)中心、云計(jì)算平臺和自動駕駛項(xiàng)目中有大量FPGA。我們非常了解FPGA的優(yōu)缺點(diǎn)，以及如何優(yōu)化。憑借XPU的大型核心，我們專注于多樣化的計(jì)算任務(wù)。”

去年有媒體報(bào)道了基于百度深度學(xué)習(xí)SDA的SQL加速器。當(dāng)時的數(shù)據(jù)流基于SA架構(gòu)。根據(jù)歐陽劍的描述，這也是XPU內(nèi)存帶寬和延時優(yōu)勢的核心。

歐陽劍同時展示了今年完成的一些benchmark測試，但信息非常粗略。不過，這只是百度第一次公開展示XPU。

如果XPU被證明可以用于AI、數(shù)據(jù)分析、云計(jì)算和無人駕駛，那么百度可能需要用ASIC技術(shù)去開發(fā)XPU。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：[email protected]。

百度發(fā)布XPU：AI云計(jì)算加速芯片（基于FPGA，256核心）

日期： 2017-08-24

相關(guān)內(nèi)容