3月12日消息,,據(jù)路透社引述2名知情人士的話報道稱,,Meta正在測試第一顆自主研發(fā)的用于訓(xùn)練AI系統(tǒng)的RISC-V構(gòu)架芯片,,這款定制化設(shè)計的芯片將符合Meta自身的運算需求,,并降低對于英偉達(dá)(NVIDIA)等AI芯片大廠的依賴,。
據(jù)了解,,Meta這款自研AI芯片的測試,,是在芯片完成設(shè)計定案(即所謂tape-out)后展開的,。一次tape-out成本可達(dá)數(shù)千萬美元,,大約需要3~6個月完成,且無法保證測試必定成功,。萬一失敗,,Meta需要找出芯片設(shè)計問題并重新tape-out步驟。
Meta 之前曾在一次小規(guī)模測試部署中,,推出一款自研的AI推理芯片,,但由于表現(xiàn)不佳而取消,轉(zhuǎn)而在2022年下單采購數(shù)十億美元的英偉達(dá)GPU,。自此之后,,Meta 成為NVIDIA一大客戶,累積大量GPU用于訓(xùn)練模型,包括用于內(nèi)容推薦與廣告系統(tǒng),、以及大型語言模型Llama,,同時也為每天使用Meta旗下社交媒體平臺體超過30億用戶執(zhí)行推理工作。但是這也使得Meta在采購英偉達(dá)GPU上耗費了大量的資金,。因此,,Meta還是希望通過自研AI芯片來降低成本。
一名知情人士表示,,不同于Meta此前推出的MTIA系列AI推理芯片,,Meta 最新曝光的這款自研的AI芯片,是專門為AI訓(xùn)練任務(wù)所設(shè)計,,預(yù)期還將整合HBM3或HBM3E內(nèi)存,。由于是定制化設(shè)計,因此這款芯片的尺寸,、功耗及性能可以實現(xiàn)最優(yōu)化,,有望比用于同樣AI工作負(fù)載的GPU更高效。預(yù)計其每瓦性能表現(xiàn)可以與英偉達(dá)最新的GPU(如H200,、B200,,甚至是下一代B300等)競爭。
另一知情人士則稱,,Meta這款自研的AI芯片將交由臺積電代工,。
對此傳聞,Meta與臺積電均拒絕發(fā)表任何評論,。
值得注意的是,,自研芯片是Meta長期計劃的一部分,目的是降低AI基礎(chǔ)設(shè)施所帶來的成本,。實際上,,Meta 預(yù)估2025年總支出介于1,140~1,190億美元之間,其中資本支出上看650億美元,,主要用于AI基礎(chǔ)設(shè)施建設(shè),,其中就包括自研AI芯片。
2023年,,Meta就曾推出了首款自研AI芯片MTIA(MTIA v1),,采用的是臺積電7nm制程。而在2024年推出的第二代MTIA同樣是交由臺積電代工,,不過制程工藝升級到了5nm,,配備更多處理核心,片內(nèi)存儲(on-chip memory)也翻倍到了256MB(MTIA v1 僅有128MB),,off-chip LPDDR5也提高到了128GB(MTIA v1 為 64GB),,主頻也從800MHz上升到了1.35GHz,當(dāng)然功耗也增加到了90W(MTIA v1 為 25W)。需要指出的是,,這兩代MTIA芯片都主要用于推理應(yīng)用,。
△MTIA v2
Meta當(dāng)時曾透露,第二代MTIA已投入16個數(shù)據(jù)中心區(qū)域使用,,主要用于決定Facebook與Instagram動態(tài)消息顯示的內(nèi)容推薦系統(tǒng),。Meta也承認(rèn),第二代MTIA不會取代目前用于訓(xùn)練模型的GPU,,而是補充運算資源,。
Meta首席產(chǎn)品官Chris Cox在上周舉行的摩根士丹利科技、媒體和電信大會表示,,“我們正在研究如何訓(xùn)練推薦系統(tǒng),,最終考慮如何對生成式AI進(jìn)行訓(xùn)練和推理”。他形容Meta的芯片開發(fā)任務(wù)目前處于“從走路到爬行再到奔跑”的階段,,內(nèi)部認(rèn)為用于內(nèi)容推薦系統(tǒng)的第一代推理芯片是一大成功,。Meta希望2026年開始在AI訓(xùn)練階段使用自研芯片。
顯然,,這也意味著此次曝光的Meta自研的AI訓(xùn)練芯片如果獲得成功的話,,可能將會在2026年進(jìn)入大規(guī)模部署。