人工智能/機(jī)器學(xué)習(xí),、高性能計(jì)算,、數(shù)據(jù)中心等應(yīng)用市場興起,催生高帶寬內(nèi)存HBM(High Bandwidth Memory)并推動(dòng)著其向前走更新迭代,。如今,,HBM來到第四代,盡管固態(tài)存儲(chǔ)協(xié)會(huì)(JEDEC)尚未發(fā)布推出HBM3的相關(guān)規(guī)范,,產(chǎn)業(yè)鏈各廠商已早早布局。
內(nèi)存/IP廠商布局HBM3
10月20日,,SK海力士宣布業(yè)界首次成功開發(fā)現(xiàn)有最佳規(guī)格的HBM3 DRAM,。這是SK海力士去年7月開始批量生產(chǎn)HBM2E DRAM后,時(shí)隔僅1年零3個(gè)月開發(fā)了HBM3,。
據(jù)了解,,SK海力士研發(fā)的HBM3可每秒處理819GB的數(shù)據(jù),相當(dāng)于可在一秒內(nèi)傳輸163部全高清(Full-HD)電影(每部5GB),,與上一代HBM2E相比,,速度提高了約78%;內(nèi)置ECC校檢(On Die-Error Correction Code),,可自身修復(fù)DRAM單元的數(shù)據(jù)的錯(cuò)誤,,產(chǎn)品可靠性大幅提高。
圖片來源:SK海力士官網(wǎng)
SK海力士HBM3將以16GB和24GB兩種容量上市,。據(jù)悉,,24GB是目前業(yè)界最大的容量,為了實(shí)現(xiàn)24GB,,SK海力士技術(shù)團(tuán)隊(duì)將單品DRAM芯片的高度磨削到約30微米(μm, 10-6m),,相當(dāng)于A4紙厚度的1/3,然后使用TSV技術(shù)(Through Silicon Via,,硅通孔技術(shù))垂直連接12個(gè)芯片,。
隨著SK海力士成功開發(fā)HBM3,HBM開始挺進(jìn)3.0時(shí)代,,IP廠商亦已先行布局HBM3,。
10月7日,Synopsys宣布推出業(yè)界首個(gè)完整的HBM3 IP解決方案,,包括用于2.5D多芯片封裝系統(tǒng)的控制器,、PHY和驗(yàn)證IP。據(jù)了解,,Synopsys的DesignWare HBM3控制器與PHY IP基于經(jīng)芯片驗(yàn)證過的HBM2E IP打造,,而HBM3 PHY IP基于5nm制程打造,,每個(gè)引腳的速率可達(dá)7200 Mbps,內(nèi)存帶寬最高可提升至921GB/s,。
值得一提的是,,在Synopsys的新聞稿中,SK海力士,、三星電子,、美光等內(nèi)存廠商均表示將致力于開發(fā)HBM3內(nèi)存。
除了Synopsys,,今年8月美國內(nèi)存IP核供應(yīng)商Rambus宣布推出其支持HBM3的內(nèi)存接口子系統(tǒng),,內(nèi)含完全集成的PHY和數(shù)字控制器,數(shù)據(jù)傳輸速率達(dá)8.4 Gbps,,可提供超過1TB/s的帶寬,,是HBM2E內(nèi)存子系統(tǒng)的兩倍以上。Rambus預(yù)計(jì),,其HBM3內(nèi)存將于2022年末或2023年初流片,,實(shí)際應(yīng)用于數(shù)據(jù)中心、AI,、HPC等領(lǐng)域,。
而更早些時(shí)候,中國臺(tái)灣地區(qū)的創(chuàng)意電子于6月發(fā)布基于臺(tái)積電CoWoS技術(shù)的AI/HPC/網(wǎng)絡(luò)平臺(tái),,搭載7.2Gbps HBM3控制器,。
三星電子另辟蹊徑?
三星電子雖然目前尚未發(fā)布HBM3,,但從披露的信息來看,,其在HBM方面亦正持續(xù)發(fā)力。
今年2月,,三星電子發(fā)布其集成AI處理器新一代芯片HBM-PIM(processing-in-memory),,可提供最高達(dá)1.2 TFLOPS的嵌入式計(jì)算能力,從而使內(nèi)存芯片本身能夠執(zhí)行通常由CPU,、GPU,、ASIC或FPGA處理的工作。在這款HBM-PIM芯片中,,三星電子利用PIM技術(shù),,將AI處理器搭載于HBM2 Aquabolt中,可提升兩倍性能,,同時(shí)將功耗降低70%以上,。
據(jù)介紹,HBM-PIM芯片將AI引擎引入每個(gè)存儲(chǔ)庫,,從而將處理操作轉(zhuǎn)移到HBM本身,。這種新型內(nèi)存的設(shè)計(jì)是為了減輕內(nèi)存與一般處理器之間轉(zhuǎn)移數(shù)據(jù)的負(fù)擔(dān),,因?yàn)閷?shí)際應(yīng)用中,這種負(fù)擔(dān)無論在功耗還是時(shí)間上,,往往比真正的計(jì)算操作消耗更大,。三星還表示,使用這種新內(nèi)存不需要任何軟件或硬件變化(包括內(nèi)存控制器),,從而可以被市場更快地采用,。
對(duì)于HBM而言,三星電子的HBM-PIM提供了另一種方式,,不過按照三星電子在Synopsys的新聞稿中所表達(dá)的態(tài)度,,三星電子也將繼續(xù)推進(jìn)開發(fā)HBM3。
此外,,三星電子5月宣布開發(fā)出能將邏輯芯片(Logic Chip)和4顆HBM封裝在一起的新一代2.5D封裝技術(shù)“I-Cube4”,,該技術(shù)可用于高性能計(jì)算(HPC)、AI,、5G,、云,、數(shù)據(jù)中心等各種領(lǐng)域,。據(jù)悉,三星目前也正在開發(fā)更先進(jìn),、更復(fù)雜的I-Cube6,,可同時(shí)封裝6顆HBM以及更復(fù)雜的2.5D/3D混合封裝技術(shù)。
從GPU到CPU全面擁抱,?
在內(nèi)存/IP廠商在HBM領(lǐng)域的升級(jí)競賽持續(xù)進(jìn)行的同時(shí),,HBM正在得到更多應(yīng)用,主要廠商包括如AMD,、英偉達(dá),、英特爾等。
AMD和英偉達(dá)兩大顯卡廠商曾多次在其產(chǎn)品上采用HBM,。據(jù)了解,,AMD當(dāng)初攜手SK海力士研發(fā)HBM,并在其Fury顯卡采用全球首款HBM,;2017年AMD旗下Vega顯卡使用HBM 2,;2019年AMD Radeon VII顯卡搭載的亦為HBM2。
英偉達(dá)方面,,其2016年發(fā)布的首個(gè)采用帕斯卡架構(gòu)的顯卡Tesla P100就搭載了HBM2,,包括后面的Tesla V100也采用了HBM2;2017年初,,英偉達(dá)發(fā)布的Quadro系列專業(yè)卡中的旗艦GP100亦采用了HBM2,;2020年5月,,英偉達(dá)推出的Tesla A100計(jì)算卡也搭載了容量40GB HBM2;今年6月,,英偉達(dá)升級(jí)了A100 PCIe GPU加速器,,配備80GB HBM2e顯存。
而英特爾更是將在其兩款新品中用到HBM,。
今年8月,,英特爾在其架構(gòu)日上介紹基于Xe HPC微架構(gòu)的全新數(shù)據(jù)中心GPU架構(gòu)Ponte Vecchio。Ponte Vecchio芯片由幾個(gè)以單元顯示的復(fù)雜設(shè)計(jì)構(gòu)成,,包括計(jì)算單元,、Rambo單元、Xe鏈路單元以及包含高速HBM內(nèi)存的基礎(chǔ)單元,?;A(chǔ)單元是所有復(fù)雜的I/O和高帶寬組件與SoC基礎(chǔ)設(shè)施——PCIe Gen5、HBM2e內(nèi)存,、連接不同單元MDFI鏈路和EMIB橋接,。
英特爾也將HBM用在其下一代服務(wù)器CPU Sapphire Rapids上。據(jù)英特爾介紹,,在內(nèi)存方面,,Sapphire Rapids除了支持DDR5和英特爾@傲騰?內(nèi)存技術(shù),還提供了一個(gè)產(chǎn)品版本,,該版本在封裝中集成了HBM技術(shù),,可在HPC、AI,、機(jī)器學(xué)習(xí)和內(nèi)存數(shù)據(jù)分析工作負(fù)載中普遍存在的密集并行計(jì)算中實(shí)現(xiàn)高性能,。
近期外媒消息稱,一名工程師曝光了英特爾Sapphire Rapids的照片,,曝光的照片顯示,,Sapphire Rapids封裝了四顆CCD核心,每顆核心旁均配備兩片長方形的HBM內(nèi)存芯片,。爆料者表示這可能是HBM2E,,每顆處理器核心將具備兩條1024位內(nèi)存總線。
值得一提的是,,今年7月外媒消息稱,,AMD正在研發(fā)代號(hào)為Genoa的下一代EPYC霄龍服務(wù)器處理器,采用Zen 4架構(gòu),。這一處理器將首次配備HBM內(nèi)存,,目的是與英特爾下一代服務(wù)器CPU Sapphire Rapids競爭。
若消息屬實(shí),,那英特爾和AMD均將在CPU上采用HBM,,這也意味著HBM的應(yīng)用不再局限于顯卡,,其在服務(wù)器領(lǐng)域的應(yīng)用將有望更加廣泛。
未來仍有很長的路要走
HBM主要是通過TSV技術(shù)進(jìn)行芯片堆疊,,以增加吞吐量并克服單一封裝內(nèi)帶寬的限制,,將數(shù)個(gè)DRAM裸片像摩天大廈中的樓層一樣垂直堆疊,裸片之間用TVS技術(shù)連接,。
憑借TSV方式,,HBM大幅提高了容量和數(shù)據(jù)傳輸速率,與傳統(tǒng)內(nèi)存技術(shù)相比,,HBM具有更高帶寬,、更多I/O數(shù)量、更低功耗,、更小尺寸,,可應(yīng)用于高性能計(jì)算(HPC)、超級(jí)計(jì)算機(jī),、大型數(shù)據(jù)中心,、人工智能/深度學(xué)習(xí)、云計(jì)算等領(lǐng)域,。
回顧HBM性能的歷史演進(jìn),,第一代HBM數(shù)據(jù)傳輸速率大概可達(dá)1Gbps;2016年推出的第二代產(chǎn)品HBM2,,最高數(shù)據(jù)傳輸速率可達(dá)2Gbps,;2018年,,第三代產(chǎn)品HBM2E的最高數(shù)據(jù)傳輸速率已經(jīng)可達(dá)3.6Gbps,。如今,SK海力士已研發(fā)出第四代產(chǎn)品HBM3,,此后HBM3預(yù)計(jì)仍將持續(xù)發(fā)力,,在數(shù)據(jù)傳輸速率上有更大的提升。
從性能來看,,HBM無疑是非常出色的,,其在數(shù)據(jù)傳輸?shù)乃俾省捯约懊芏壬隙加兄薮蟮膬?yōu)勢,。不過,,目前HBM仍主要應(yīng)用于數(shù)據(jù)中心等應(yīng)用領(lǐng)域,主要在于服務(wù)器市場,,其最大的限制條件在于成本,,對(duì)成本比較敏感的應(yīng)用領(lǐng)域如消費(fèi)級(jí)市場而言,HBM的使用門檻仍較高,。據(jù)了解,,HBM所采用2.5封裝/3D堆疊技術(shù)是其成本偏高的重要原因,。
盡管HBM已更迭到第四代,但正如Rambus IP核產(chǎn)品營銷高級(jí)總監(jiān)Frank Ferro此前在接受采訪時(shí)所言,,HBM現(xiàn)在依舊處于相對(duì)早期的階段,,其未來還有很長的一段路要走。而可預(yù)見的是,,隨著越來越多的廠商在人工智能/機(jī)器學(xué)習(xí)等領(lǐng)域不斷發(fā)力,,內(nèi)存產(chǎn)品設(shè)計(jì)的復(fù)雜性正在快速上升,并對(duì)帶寬提出了更高的要求,,不斷上升的寬帶需求將持續(xù)驅(qū)動(dòng)HBM發(fā)展,。
2021年,芯片產(chǎn)能緊缺席卷全球,,半導(dǎo)體產(chǎn)業(yè)迎來結(jié)構(gòu)性轉(zhuǎn)變,,存儲(chǔ)行業(yè)亦面臨著巨大的機(jī)遇和挑戰(zhàn)。面對(duì)發(fā)展良機(jī)與各種不確定性因素,,國內(nèi)外存儲(chǔ)企業(yè)該如何把握機(jī)遇實(shí)現(xiàn)突圍,?存儲(chǔ)技術(shù)演進(jìn)又將迎來哪些新趨勢?