《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 電子元件 > 業(yè)界動態(tài) > 斷供風(fēng)波后,,國產(chǎn)GPU補位難在哪,?

斷供風(fēng)波后,國產(chǎn)GPU補位難在哪,?

2022-10-26
來源:自主可控新鮮事
關(guān)鍵詞: GPU 英偉達 AMD

英偉達AMD的高端通用GPU禁運事件再次揪緊了中國半導(dǎo)體行業(yè)的神經(jīng),,國內(nèi)超算,、東數(shù)西算、云計算,、自動駕駛等行業(yè)已明顯感到“寒意”,。但正如硬幣的兩面,這一禁令無疑也為國產(chǎn)GPU廠商創(chuàng)造了新的補位機會。

但從GPU市場來看,,仍上演著巨大的“落差”情節(jié),。在集成GPU市場,英特爾,、英偉達、AMD三分天下,;獨立GPU領(lǐng)域,,基本是英偉達和AMD的天下,前者市場份額甚至超出2/3,;在GPGPU領(lǐng)域,,英偉達更是一騎絕塵。當(dāng)英特爾,、英偉達,、AMD通過并購或整合,在GPU+CPU+DPU時代全面布局并掌控話語權(quán)的當(dāng)下,,國內(nèi)GPU廠商仍需奮起直追,。 

要在GPU領(lǐng)域形成突圍之勢,國產(chǎn)GPU的性能,、生態(tài),、應(yīng)用等均是一環(huán)接一環(huán)的考驗。要在性能層面率先通關(guān),,IP的力量不容小覷,。在生態(tài)層面,是借助CUDA占位還是自建生態(tài),,仍是個兩難的選擇,。

風(fēng)起云涌

GPU的重要性從其市場規(guī)模可見一斑,。

在多重因素交織影響下,,GPU已然完成華麗“蛻變”,從最早用于2D/3D圖形的計算和處理,,到近年來憑借并行處理和通用計算的優(yōu)勢成為數(shù)據(jù)中心,、5G、AIoT,、自動駕駛領(lǐng)域的關(guān)鍵算力的基礎(chǔ)設(shè)施,,GPU市場亦迎來了高速大發(fā)展。

據(jù)Gartner預(yù)測,,截至2023年,,AIoT、5G應(yīng)用等將快速拉升全球商用GPU市場,規(guī)模有望達到250億美元,,包括PC在內(nèi)的民用GPU市場也將提升至150億美元,。

在這一風(fēng)雷激蕩的市場,不僅成就了英偉達,、AMD等的高歌猛進,,也為無數(shù)的新進入者提供了逐鹿的舞臺。受市場需求以及政策,、資本的推動,,GPU在國內(nèi)受到瘋狂追捧,國內(nèi)GPU初創(chuàng)企業(yè)如雨后春筍冒出,,融資紀(jì)錄不斷刷出新高,,多方出擊,呈現(xiàn)“星星之火,,可以燎原”之勢,。

要指出的是,GPU隨著技術(shù)的進階以及應(yīng)用的拓展,,體系也日益龐雜,,按接入類型可分為集成GPU和獨立GPU,以應(yīng)用來區(qū)分則有PC GPU,、移動GPU和服務(wù)器GPU三類,;按功能劃分,可分為側(cè)重圖形圖像的渲染GPU和側(cè)重通用計算的GPGPU,。

國內(nèi)初創(chuàng)GPU公司結(jié)合自己的優(yōu)勢和階段性定位,,分別采取了不同的切入路線,有的以GPGPU為重,,有的直指渲染GPU,,也有先期立足GPGPU而后切入渲染GPU或并行推進的,涉及壁仞,、沐曦,、登臨、天數(shù)智芯,、摩爾線程,、勵算、深流微,、瀚博,、芯瞳、格蘭菲等等,。

作為此次禁運事件的主角,,英偉達的A100,、H100均是數(shù)據(jù)中心加速卡,A100擁有540億晶體管,,采用臺積電7nm工藝制程,,支持FP16、FP32和FP64浮點運算,。而H100作為英偉達最新一代數(shù)據(jù)中心GPU,,集成了800億晶體管,最高1.8萬個CUDA核心,,采用臺積電定制的4nm工藝,,已全面投產(chǎn),合作伙伴50多款基于H100的服務(wù)器將在年底前上市,。

雖然國內(nèi)還有一年的緩沖期可以繼續(xù)備貨英偉達的產(chǎn)品(如果可以通過報備和審核),但一年以后很可能還將面臨無法拿到最先進產(chǎn)品的可能,,不同應(yīng)用端對此的感受或“冷暖自知”,。

應(yīng)用掣肘

“相對于超算、互聯(lián)網(wǎng)等應(yīng)用場景來說,,正在飛速發(fā)展的自動駕駛汽車領(lǐng)域才是這次訓(xùn)練卡禁售風(fēng)波的最大受害者,。”集微咨詢直接斷言,。

因超算中的核心算力還是以CPU為主,,且可以用協(xié)處理器來配合核心CPU來進行工作,GPGPU的影響在短期內(nèi)不會對超算應(yīng)用產(chǎn)生太大的影響,。

此外,,雖然互聯(lián)網(wǎng)應(yīng)用的智能推薦、圖像識別等算法也需要大量訓(xùn)練,,但慶幸的是我國互聯(lián)網(wǎng)產(chǎn)業(yè)已經(jīng)經(jīng)歷了蓬勃發(fā)展時期,,目前處于穩(wěn)定期,算法迭代和應(yīng)用落地相對比較成熟,,目前互聯(lián)網(wǎng)巨頭手中訓(xùn)練資源相對比較平衡,,而且各家也都針對自己的業(yè)務(wù)需求特點開始自研訓(xùn)練芯片,英偉達訓(xùn)練卡的禁售看似對互聯(lián)網(wǎng)產(chǎn)業(yè)影響大,,但實際情況比想象得要好一些,。

相較之下,自動駕駛端體會的“寒意”或更為明顯,。

雖然英偉達沒有直接禁售自動駕駛芯片,,但自動駕駛算法的訓(xùn)練還是無法繞開云端GPGPU的。國內(nèi)智能汽車或自動駕駛汽車的產(chǎn)品迭代快速,,新車發(fā)布周期在縮短,,硬件堆疊也在不斷增加,,攝像頭視覺傳感器、雷達等硬件模塊的單車配置在快速上升,,高級別自動駕駛等級的迭代與滲透也在快速發(fā)展,。從而導(dǎo)致自動駕駛算法迭代也要跟上步伐,算法的迭代必然以訓(xùn)練為前提,,訓(xùn)練量的增加必定會反饋在對訓(xùn)練卡性能和需求的提升,。

更值得注意的是,自動駕駛信息涉及到的數(shù)據(jù),,大多涉及保密級較高的內(nèi)容,,這部分內(nèi)容大概率是無法依靠租賃云服務(wù)商的訓(xùn)練服務(wù)器來解決的。

IP難關(guān)

國內(nèi)GPU初創(chuàng)企業(yè)而言,,長期,、持續(xù)的利潤支撐才是GPU跨代發(fā)展的強勁驅(qū)動力,在英偉達,、ADM等巨頭構(gòu)筑的高壁壘面前,,瞄準(zhǔn)目標(biāo)應(yīng)用大量的驗證及出貨是國產(chǎn)GPU必然要越過的難關(guān)。

而GPU作為高性能高復(fù)雜度的大芯片,,想在短期內(nèi)快速推出相關(guān)產(chǎn)品,,必然依賴外部IP。而且,,近段時間以來,,國內(nèi)GPU廠商以接二連三的點亮和商用來探索發(fā)展之道。但除卻生態(tài),、落地挑戰(zhàn)之外,,據(jù)一位業(yè)內(nèi)人士分析,國內(nèi)GPU核心基礎(chǔ)技術(shù)的投入還是不太夠,,雖然目前研發(fā)GPU的公司很多,,但絕大部分是license IP模式,而且同質(zhì)化較為明顯,。

提及GPU IP,,主要有數(shù)字和模擬兩大IP,每一大IP體系有不同的分類,。從模擬IP來看,,分為三部分,一是PCIe,;二是Memory,,涉及DDR5/4、LPDDR5/4等,;三是重要的顯示IP,,即Displayport和 HDMI,。從數(shù)字IP來看,涉及最核心的GPU IP,,還有基于RISC-V或Arm的微控制器IP,;以及Video編解碼如H.264等IP。要注意的是,,在GPGPU層面,,核心IP大都為廠商自研,也有廠商采用Imagination等訓(xùn)練或推理的IP,,且GPGPU不需顯示IP,。

從理論上來說,自研IP越多,,GPU的差異化更明顯,,但相對而言資金、人員,、時間上的成本投入也更高,。一家從事GPGPU研發(fā)的企業(yè)代表告知,GPU IP自研需要36-48個月以及200個工程師,,而采用外購IP的方式,可以減少12-18個月開發(fā)周期,。

微信圖片_20221026094232.jpg

不得不說,,因設(shè)計GPU IP的問題非常復(fù)雜,許多最優(yōu)的解決方案已經(jīng)獲得專利保護,,使得GPU 核心IP市場成為少數(shù)玩家的陣地,。

在PC和服務(wù)器GPU領(lǐng)域,核心的GPU IP廠商主要是Imagination,、芯原,、格蘭菲;在移動GPU領(lǐng)域,,主要有Arm Mali,、Imagination PowerVR系列,芯原在前幾年收購美國嵌入式GPU設(shè)計商圖芯之后亦有不少授權(quán)用戶,,以及高通的Adreno,。高通Adreno從AMD買入,且不對外銷售,。作為GPU的老牌巨頭,,英偉達、AMD均有自己的強大GPU IP,,英特爾也購買了AMD的GPU IP要在獨立GPU市場卷土重來,。

整體而言,,國內(nèi)GPGPU企業(yè)與國際大廠技術(shù)差距約3年,渲染GPU與國際大廠差距約10年左右,。要想彌補這一差距,,不止要在生態(tài)層面發(fā)力,提升國內(nèi)核心IP能力顯然是必然要做的功課,。

對此業(yè)內(nèi)人士也指出,,從GPU IP 供應(yīng)商來看,國內(nèi)本土研發(fā)存在投入不足,、競爭力偏弱,、市場窄、技術(shù)研發(fā)的后續(xù)力不明朗等問題,。國內(nèi)想發(fā)展GPU,,是要想辦法讓GPU技術(shù)鏈條各個環(huán)節(jié)上,真金白銀投入技術(shù)研發(fā)的公司生存并慢慢滾動發(fā)展,。

值得關(guān)注的是,,盡管火熱的Chiplet開啟了 IP的新型復(fù)用模式,也為IP 廠商的經(jīng)營模式帶來全新變革,,國內(nèi)GPU IP廠商芯原等也在加速實現(xiàn)以Chiplet形式的IP芯片化,。但我們認為,這除對商業(yè)模式帶來挑戰(zhàn)之外,,還要解決設(shè)計,、die到die接口挑戰(zhàn)、封裝和制造等層面的難關(guān),,難以實現(xiàn)彎道超車,。

生態(tài)之憂

盡管A100和H100的禁售成為國內(nèi)GPGPU發(fā)展的新催化劑,可以說造就了難得的機會窗口,,但要成功“補位”,,除了性能差距之外,生態(tài)過關(guān)顯得尤為迫切,。 

“很多客戶用英偉達的訓(xùn)練加速卡已用得非常順手了,,一方面是其性能優(yōu)異,通用性強,,另一方面則是生態(tài),,CUDA的運算平臺適合各類模型,客戶基于此可高效訓(xùn)練或改進自己的算法,?!奔⒆稍儽硎荆皣鴥?nèi)在芯片設(shè)計上的能力與頭部品牌還存在不小的差距,,再考慮到軟件和生態(tài)層面,,差距就又會進一步拉大,。”

正如一家GPGPU廠商代表所言,,GPGPU的生態(tài)非常復(fù)雜,,要求一路打通到應(yīng)用層,提供面向所有應(yīng)用的全面支持,,甚至要自主開發(fā)以支持一個新的應(yīng)用領(lǐng)域,。

盡管禁運有一年的緩沖期,但一年以后呢,?很可能還將面臨無法拿到最先進產(chǎn)品的可能,。雖然英偉達也放話說可提供一些相對低端的性能不及A100的產(chǎn)品讓客戶通過堆疊等來實現(xiàn)相應(yīng)的算力,但這仍將大幅影響訓(xùn)練的成本和效率,。

因而,,雖然國內(nèi)在GPGPU領(lǐng)域?qū)崿F(xiàn)了一些國產(chǎn)替代,但在性能上要達到A100水平,,短期內(nèi)還不現(xiàn)實,。此外,更大的阻力來自生態(tài),,雖然眾多國產(chǎn)GPGPU公司芯片都支持兼容CUDA,,但兼容度和兼容水平無法量化,各家的產(chǎn)品水平標(biāo)準(zhǔn)也不統(tǒng)一,,這必定會增加算法工程師的使用和學(xué)習(xí)成本,。

兼容是捷徑,但不是終點,,從長遠來說一定要建立自己的生態(tài),。國內(nèi)GPGPU廠商還應(yīng)風(fēng)物長宜放眼量,。

無疑,,美對我國芯片行業(yè)的全面圍剿將形成一道新的半導(dǎo)體“鐵幕”,也將不斷加速國產(chǎn)芯片自主化的進程,,但要從弱到強,,從低端到高端,顯然是一場以數(shù)年為計的長征之路,。



更多信息可以來這里獲取==>>電子技術(shù)應(yīng)用-AET<<

二維碼.png

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點,。轉(zhuǎn)載的所有的文章,、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者,。如涉及作品內(nèi)容,、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118,;郵箱:[email protected],。