《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 業(yè)界動態(tài) > 中國移動今年將開展GSE中試

中國移動今年將開展GSE中試

給智算網絡更多選擇
2024-05-11
來源:C114通信網

大模型需要大算力,大算力需要大集群,,大集群需要大網絡,!

業(yè)界對此沒有疑問,但選擇什么樣的機間互聯(lián)技術,,卻有著不同的技術實現(xiàn)路徑,。

是先入為主的InfiniBand,還是當前呼聲很高的UEC,;其實,,我們有更多的選擇。在近日舉行的“中國移動算力網絡大會”上,,中國移動副總經理高同慶宣布,,對標國際主流的IB和UEC方案,形成中國自主的技術體系--全調度以太網GSE),,今年將開展GSE中試,,加速GSE關鍵技術和產業(yè)成熟,為標準開放的新型智算互聯(lián)貢獻中國方案,。

有了IB和UEC,,我們?yōu)槭裁催€需要GSE?GSE將會給產業(yè)界帶來價值,?從理念到技術再到產品和應用的落地,,GSE還需要邁過哪些門檻?

我們?yōu)槭裁葱枰狦SE

在回答這個問題之前,,先讓看看算力形態(tài)的變化,。業(yè)界現(xiàn)在將算力分為通算、超算與智算,,其中智算作為AI能力的主要載體,,到2025年可能會占據(jù)新增算力的85%左右,。也就是說智算將逐漸成為AI市場主流,作為智算的載體,,智算中心的重要性就不言而喻了,。

智算中心與傳統(tǒng)數(shù)據(jù)中心存在很大不同,不僅體現(xiàn)在卡型,、性能,、功耗、算力密度等方面,,主要由GPU服務器聯(lián)網構成的智算中心需要完全不同的網絡架構,。當大模型訓練時,并行計算節(jié)點越多,,通信效率越重要,,智算網絡性能成為集群算力提升的關鍵??偨Y下來,,智算中心網絡要求很特殊,需要高帶寬,、零丟包,、超低時延、高可用性,,月級零故障,。

簡言之,我們需要新的網絡架構,??陀^來看,,英偉達主導的InfiniBand因其自身特性,,是當前市場主流選擇,但InfiniBand在產業(yè)開發(fā)性,、部署成本方面非常不友好,。還有很重要的一點,在云譎波詭的地緣政治環(huán)境下,,產品與解決方案的可持續(xù)獲得性也是個問題,。

InfiniBand不行,我們可以選另外一條技術演進路徑,,從底層革新傳統(tǒng)以太網機制,,同時又最大限度的利用以太網產業(yè)的開放性和成熟性。亂拳打死老師傅,,這的確是個好主意,!

從以太網這條技術路徑來看,,主要有兩個流派。一種是采用大量的私有協(xié)議,,自己做深度優(yōu)化,,性能的確是很強,國內有些云服務商走的是這條路,;一種是用開源社區(qū)思路,,“眾人拾柴火焰高”,比如國內主導的GSE,,是美國主導的UEC,,都是這個思路。

1.jpg

但需要強調的是,,UEC和GSE的先后關系,。很多人先入為主的認為,我國在智算領域落后于美國,,GSE是在拾UEC牙慧,!但事實剛好與之相反。在2023年5月份,,中國移動聯(lián)合10余家中國企業(yè)率先發(fā)布全調度以太網技術架構(GSE)白皮書,,這標志著GSE技術的確立。幾個月之后,,包括英特爾,、AMD、HPE,、Arista,、Broadcom、思科,、Meta和微軟等主導成立的超級以太網聯(lián)盟(UEC)才成立,。

GSE能夠給行業(yè)帶來什么?我覺得最重要的有兩點:

第一,,給了智算中心服務器互聯(lián)更多選擇,。在云譎波詭的地緣政治環(huán)境下,可選擇性,、可獲取性比性能,、成本本身更為重要。況且,,GSE也在快速的走向成熟,,形成標準開放的技術體系!

第二,給了中國AI產業(yè)路徑更多選擇,。在先進算力芯片受限的前提下,,我們只能通過別的方式來彌補,“以網強算”是個必然路徑,。但網絡芯片存在代際差距,,網絡可能成為我國AI發(fā)展的“新卡點”。我們單純的從這個公式來看:集群有效算力={GPU單卡算力*總卡數(shù)*線性加速比*有效運行時],,前面這幾個變量我們都受限,,更需要做好GSE這篇文章。

GSE應該怎么去落地,?

首先,,我們要有自信。AI特別是AGI就是未來的方向,,在這點上,,是沒有任何疑問的。在AGI落地的技術路徑上,,“以網強算”是個必然選擇,。

我們有全球最好的網絡基礎設施,有全球最好的移動通信網絡基礎設施,,有全球技術最為領先的400G光傳送網,。當然,我們也完全可以有最優(yōu)的智算中心網絡,,或者智算中心機間互聯(lián)技術生態(tài),。在挑戰(zhàn)或者取代IB的這條道路上,UEC可以做到的,,GSE為什么不能做到呢,?

其次,產業(yè)鏈形成合力,。孫凝暉院士說的好,,國內智能計算生態(tài)孱弱,更為嚴重的是國內企業(yè)之間山頭林立,,其實在機間互聯(lián)技術選擇上也一樣,。比如在今年的云網智聯(lián)大會上,,就有類似的聲音出來,,認為GSE是中國移動主導的,是個個體行為,,UEC才是主流,。

從全球來看,特別是從用戶的CAPEX來看,UEC的確是遠遠超過GSE,;但國內企業(yè)在UEC中到底有沒有,,有多少話語權,這都是疑問,。對于GSE而言,,的確是中國移動倡導成立的,但GSE發(fā)展離不開開放性,,GSE推進計劃現(xiàn)在已經有40多家成員,,既要最大限度兼容以太網生態(tài),更要最大限度包容產業(yè)生態(tài),。

還是要小步快跑,。智算中心的發(fā)展和演進,和傳統(tǒng)的CT行業(yè)是不同的,,標準是個很有意思的問題,,是在發(fā)展中不斷地凝聚共識、優(yōu)化技術路徑,;小步快跑才能形成可持續(xù)的社區(qū)繁榮生態(tài),。從GSE的發(fā)展歷程來看,也的確在朝著這個方向前行,。特別是在上個月,,《新型智算中心以太網物理層安全(PHYSec)架構白皮書》的發(fā)布,說明了GSE產業(yè)鏈的努力,。

最后,,當然也是最重要的,要用“誠意”和“信心”去培育,、催熟產業(yè)鏈,。所以,在今年的中國移動算力網絡大會上,,當高總宣布要開展GSE“中試”時,,產業(yè)鏈還是很受鼓舞的??赡苡行┳x者對于“中試”不是很清楚,,翻譯過來的意思就是“現(xiàn)網試商用”!這也凸顯了中國移動在推動民族智算和AI產業(yè)發(fā)展中的央企擔當,。當然,,我們也相信中國移動具備這樣的能力,無論是從傳送網100G到400G的躍遷,,還是從移動網從3G到5G的嬗變,,或亦是承載網從PTN到SPN的沿革,,中國移動都已經證明了自己。GSE,,我們相信同樣如此,!


Magazine.Subscription.jpg

本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,,并不代表本網站贊同其觀點,。轉載的所有的文章、圖片,、音/視頻文件等資料的版權歸版權所有權人所有,。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容,、版權和其它問題,,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,,避免給雙方造成不必要的經濟損失,。聯(lián)系電話:010-82306118;郵箱:[email protected],。