除了正式發(fā)布升級版的Instinct MI325X GPU加速卡,,AMD還宣布了全新的下一代Instinct MI350系列的首款產(chǎn)品“Instinct MI355X”,,并披露了部分規(guī)格、性能數(shù)據(jù),。
MI355X將在2025年下半年上市,,也就是還有差不多一年時間,。
MI350系列將首次升級為臺積電3nm工藝,首次采用CDNA 4架構(gòu),,首次引入FP6,、FP4浮點數(shù)據(jù)類型,搭配內(nèi)存還是HBM3E但是容量高達(dá)288GB,。
具體功耗沒有披露,,但是MI325X已經(jīng)最高達(dá)1000W,AMD也透露MI355X會順應(yīng)行業(yè)趨勢(NVIDIA B200 1000W,、GB200 1700W),,因此必然會顯著超過1000W。
FP6,、FP4都屬于浮點數(shù)據(jù)格式,,分別代表6位、4位精度,也就是只需6位,、4位就能表達(dá)一個數(shù)字,,相比于FP16、F8精度大大降低,,但是數(shù)據(jù)處理量也大大減少,,適合大模型的量化,特別是大語言模型和混合專家模型,。
如果你不需要太高的精度,,更想要速度,F(xiàn)P6,、FP4就非常適合,。
MI355X上的FP6,、FP4浮點性能都是9.2 PFlops(每秒9200萬億次運算),,同時還將FP16、FP8性能都提升了80%,,分別達(dá)到2.3 PFlops,、4.6 PFlops。
NVIDIA Blackwell GPU同樣引入了FP6,、FP4精度,,但是性能更高,分別達(dá)20 PFlops,、40 PFlops,。
單卡多達(dá)288GB HBM3E內(nèi)存確實是無可匹敵,同時帶寬高達(dá)8TB/s,。
對比MI325X分別多出1/8,、1/3,而相比目前已上市的MI300X都增加了足足50%,。
對比競品,,Blackwell B200也只有192GB HBM3E,但帶寬同樣做到了8TB/s,。
MI355X同樣支持單平臺八卡,,這樣就有總計2.3TB HBME內(nèi)存、64TB/s帶寬,,性能更是高達(dá)FP16 18.5 PFlops,、FP8 37 PFlops、FP6/FP4 74 PFlops,。
它也將在明年下半年供貨,。
Instinct系列的性能進(jìn)步幅度無疑是飛躍性的,一代一個新模樣,跨代對比更是驚人,。
MI355X對比MI300X,,F(xiàn)P16性能達(dá)到了7.4倍之多,HBM容量也有1.5倍,,所能處理的模型參數(shù)規(guī)模,,也從7140億增加到4.2萬億,足足6倍之多,。
展望未來,,2026年將推出再下一代的Instinct MI400系列,基于再下一代的CDNA架構(gòu)(CDNA 5?),,規(guī)格和性能必將再次邁上一個大大的臺階,。