《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 英特爾披露5nm中國特供版AI芯片細(xì)節(jié)

英特爾披露5nm中國特供版AI芯片細(xì)節(jié)

性能或暴降92%,,最快6月推出
2024-04-15
來源:鈦媒體

關(guān)于英特爾Gaudi 3的“中國特供版AI 芯片有了新進(jìn)展,。

鈦媒體App 4月15日消息,芯片巨頭英特爾(Intel)日前在官網(wǎng)發(fā)布一份24頁的“Gaudi 3 AI加速器白皮書”中披露,,英特爾將推出Gaudi 3在中國發(fā)售的兩款“特供版”AI 芯片產(chǎn)品,。

具體包括兩種硬件形態(tài)加速卡:一款型號為HL-328的OAM兼容夾層卡(Mezzanine Card),預(yù)計將于今年6月24日推出,;另一款是型號為HL-388的PCle加速卡,,預(yù)計將于今年9月24日推出。而基于內(nèi)核數(shù)量,、工作頻率,、TDP等參數(shù)估算,,相比Gaudi 3國際版,“中國特供版”HL-328芯片性能或降低約92%左右,。

2.jpg

早前4月9日舉行的美國Intel Vision 2024會議上,,英特爾發(fā)布新一代Gaudi 3 AI 加速芯片,采用臺積電5nm工藝,,帶來4倍(400%)的BF16 AI計算能力提升,。同時,相比英偉達(dá)H100 GPU,,英特爾Gaudi 3 AI芯片的模型訓(xùn)練速度提升40%,,推理速度提升50%,平均性能提高 50%,,能效平均提高40%,,但成本卻僅為H100的一小部分。

對于Gaudi 3中國特供版消息,,鈦媒體App已向英特爾美國總部發(fā)送郵件詢問更多詳細(xì)信息,,但截至發(fā)稿前,英特爾方面并未回復(fù),。

據(jù)悉,,過去一段時間,美國政府不斷升級對華半導(dǎo)體,、AI 芯片等領(lǐng)域的出口管制,。

2022年8月9日,美國總統(tǒng)拜登簽署總額高達(dá)2800億美元的《芯片和科學(xué)法案》(以下簡稱“芯片法案”),,通過527億美元的巨額產(chǎn)業(yè)補(bǔ)貼和遏制競爭的條款,,推動芯片制造“回流”美國本土。該法案禁止獲得補(bǔ)貼的美國及其盟友伙伴的企業(yè)10年內(nèi)在中國和其他關(guān)切的國家新建或擴(kuò)大先進(jìn)制程芯片廠,。

2022年10月7日,、2023年10月17日,美國商務(wù)部工業(yè)和安全局(BIS)連續(xù)兩次發(fā)布對中國的先進(jìn)半導(dǎo)體和計算設(shè)備的出口管制,,旨在阻止中國進(jìn)口 AI 半導(dǎo)體產(chǎn)品,。同時,英偉達(dá),、AMD,、英特爾的多款GPU和 AI 芯片產(chǎn)品已不能再出口到中國,就連高端游戲顯卡RTX 4090都受到了限制,。

2023年12月,,美國商務(wù)部BIS宣布啟動對成熟制程節(jié)點的半導(dǎo)體供應(yīng)鏈展開調(diào)查,劍指中國芯片半導(dǎo)體產(chǎn)業(yè)。

2024年3月29日,,BIS更新出口限制措施,,其中包括美國對中國出口的 AI 半導(dǎo)體產(chǎn)品將采取“逐案審查”(case-by-case review)政策規(guī)則,包括技術(shù)級別,、客戶身份,、合規(guī)計劃等信息全面查驗,以及部分 AI PC 芯片或納入到出口管制措施當(dāng)中,,更大范圍限制英偉達(dá),、AMD等先進(jìn) AI 芯片和半導(dǎo)體設(shè)備向中國銷售,4月4日全面生效,。

4月11日,,美國商務(wù)部在“聯(lián)合公報”(Federal Register)上更新了最新的實體清單(Entity List),將6家中國企業(yè)列入“實體清單”,,其中包括英偉達(dá)在中國的最大 AI 芯片經(jīng)銷商思騰合力(天津)科技有限公司(SITONHOLY (Tianjin) Co., Ltd.),。

事實上,在美國BIS第一輪出口管制下,,早在2023年7月,,英特爾就曾發(fā)布基于7nm制程的“中國特供版”AI芯片Gaudi2。相比國際版Gaudi2,,面向中國市場推出的加速卡在性能上差別不大,,而集成以太網(wǎng)RDMA端口數(shù)量從24個端口減到21個,以符合美國芯片出口管制規(guī)定,。

然而,,鈦媒體App了解到,英特爾Gaudi 2中國特供版僅銷售幾十張OAM產(chǎn)品,。自去年BIS 1017新規(guī)更新后,,由于英特爾Gaudi 2“中國特供版”產(chǎn)品性能高于出口管制措施,最終導(dǎo)致其產(chǎn)品再也沒能繼續(xù)銷往中國市場,。

基于此,,去年12月前后,英特爾曾嘗試研發(fā)Gaudi 2 HL-225B變體,,內(nèi)部稱Gaudi 2C AI芯片,,希望重新獲得銷往中國大陸的許可,但最后卻等到今年3月BIS公布更新出口限制措施,。

4月10日發(fā)布Gaudi 3之后,英特爾重新研發(fā)特供版產(chǎn)品,,希望讓5nm Gaudi 3 AI芯片未來全力爭奪中國市場,,旨在為 AI 和云客戶提供英偉達(dá)產(chǎn)品的“替代選擇”。

具體硬件規(guī)格方面,中國特供版的Gaudi 3 與原版相比,,具有相同的96MB SRAM片上內(nèi)存,, 128GB HBM2e高帶寬內(nèi)存,帶寬為 3.7TB/s,,擁有PCIe 5.0 x16 接口和解碼標(biāo)準(zhǔn),。但是,由于美國對于AI芯片的出口管制規(guī)則限制,,使得這類高性能AI的綜合運算性能(TPP)需要低于4800才能出口到中國,, 這意味中國特供版的Gaudi 3 的16bit性能不能超過150 TFLOPS。

相比Gaudi 3 國際版達(dá)到的1835 TFLOPS(FP16/BF16),,中國特供版Gaudi 3 需要大幅削減內(nèi)核數(shù)量和工作頻率,,最終可能需要其AI性能降低約92%,才能符合美國的出口管制要求,。

同時,,由于中國特供版Gaudi 3產(chǎn)品的AI性能降低,這也將使得其TDP(熱設(shè)計功耗)大幅降低,,預(yù)計OAM卡和PCIe卡的TDP均為450瓦,,而原版PCIe卡(HL-338)的TDP高達(dá)600瓦,原版OAM卡(HL-325L,、HL-335)的TDP更是高達(dá)900瓦,。

整體來說,英特爾專為中國市場推出的“特供版”Gaudi 3兩款產(chǎn)品的 AI 性能,,或?qū)⑴c英偉達(dá)“中國特供版”AI 加速卡H20水平相當(dāng),,后者比H100的整體性能降低80%左右,達(dá)148 TFLOPS的FP16/BF16性能,,略低于出口管制的150 TFLOPS的限制,。

目前,英偉達(dá)H20 AI芯片已經(jīng)向中國大陸客戶送樣,,但國內(nèi)百度,、阿里等 AI 龍頭對其反響平平。有行業(yè)人士對鈦媒體App表示,,主要原因是H20性能太低,、價格太高,企業(yè)購買意愿降低了,。

美國商務(wù)部長雷蒙多(Gina Raimondo)早前在一場公開論壇中表示,,美國絕不能讓中國得到這些最尖端的芯片,絕不能讓中國芯片技術(shù)趕超美國,。美國政府不允許英偉達(dá)向中國出售“最復(fù)雜,、處理能力最高”的 AI 芯片,,以防中國有能力訓(xùn)練前沿 AI 模型。

此外,,有消息稱,,美國政府還正在制定一份禁止接收關(guān)鍵工具的中國先進(jìn)芯片制造工廠名單,以便美國企業(yè)更容易阻止技術(shù)流入中國,,這份名單可能會在未來幾個月內(nèi)公布,。同時,美國正向包括荷蘭,、日本,、德國和韓國在內(nèi)的盟友施壓加碼,要求它們進(jìn)一步收緊對中國獲得半導(dǎo)體技術(shù)的限制措施,。

針對于美方行動,,外交部發(fā)言人毛寧在4月11日表示,“我們堅決反對美方濫用實體清單等出口管制工具遏制打壓中國企業(yè),,敦促美方停止將經(jīng)貿(mào)科技問題政治化,、工具化、武器化,。中方將采取必要措施堅決維護(hù)中國企業(yè)的合法權(quán)益,。”


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章,、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容,、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118,;郵箱:[email protected],。