DeepSeek開源周第二日：開源首個用于MoE模型訓(xùn)練通信庫-AET-電子技術(shù)應(yīng)用

DeepSeek開源周第二日：開源首個用于MoE模型訓(xùn)練通信庫

日期： 2025-02-25

來源：C114通信網(wǎng)

關(guān)鍵詞： Deepseek 開源周 DeepEP MoE

今天是DeepSeek 開源周第二日，一早，DeepSeek如約就放出了開源代碼庫DeepEP王炸。

據(jù)了解，DeepEP是首個用于 MoE 模型訓(xùn)練和推理的開源 EP 通信庫，它填補(bǔ)了MoE模型專用通信工具的空白，為大規(guī)模分布式AI訓(xùn)練和實時推理場景提供了更高效的底層支持。

在這里，簡單介紹一下DeepEP的技術(shù)性能特點：

1、高效通信架構(gòu)

支持優(yōu)化的全對全通信模式，實現(xiàn)節(jié)點內(nèi)和節(jié)點間的NVLink與RDMA互聯(lián)，提升數(shù)據(jù)傳輸效率

2、多精度與調(diào)度優(yōu)化

原生支持FP8低精度運算調(diào)度，降低計算資源消耗。

3、重性能內(nèi)核

據(jù)介紹，高吞吐量內(nèi)核可適用于訓(xùn)練和推理預(yù)填充場景，最大化數(shù)據(jù)處理能力；

4、低延遲內(nèi)核

它針對推理解碼場景設(shè)計，采用純RDMA通信和自適應(yīng)路由技術(shù)，減少延遲。

5、資源控制與重疊機(jī)制

通過靈活的GPU資源控制策略，實現(xiàn)計算與通信過程的高效重疊，避免資源閑置。

6、深度優(yōu)化場景

針對NVLink到RDMA的非對稱帶寬轉(zhuǎn)發(fā)場景進(jìn)行專項優(yōu)化，提升異構(gòu)網(wǎng)絡(luò)下的傳輸性能；

此外，它還支持SM（Streaming Multiprocessors）數(shù)量動態(tài)控制，平衡不同任務(wù)（如訓(xùn)練與推理）的吞吐量需求。

Magazine.Subscription.jpg

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：[email protected]。

DeepSeek開源周第二日：開源首個用于MoE模型訓(xùn)練通信庫

日期： 2025-02-25

來源：C114通信網(wǎng)

相關(guān)內(nèi)容