每次有新聞提到PC市場銷量下滑,可愛的讀者們往往會調(diào)侃兩家公司——“Intel,,你又擠牙膏了,,SNB還能戰(zhàn)三年”,還有一個想努力擠牙膏但新牙膏上市延期,、只能先上PPT的AMD。五年多前的SNB處理器+4GB DDR3內(nèi)存的確還能再戰(zhàn),但是公平地說,,計算機性能實際上一直在不斷增長,2011年的TOP500冠軍是日本京/K計算機,,性能只有8.2PFLOPS(千萬億次),,內(nèi)存容量141TB,2016上半年的TOP500冠軍是中國的太湖之光,浮點性能93PFLOPS,,內(nèi)存容量1.31PB,,差不多都是5年前的10倍。
未來幾年將實現(xiàn)百億億次計算,,對處理器及內(nèi)存的要求都很高
五年前的高性能計算剛剛達到1億億次,,今年太湖之光剛剛實現(xiàn)了10億億次,2020年之前的目標是實現(xiàn)百億億次,,也就是exaFLOPS級別,,包括中國、美國,、日本和歐盟在內(nèi),,百億億次計算是世界各國都在爭奪的下一個制高點,它不僅對主處理器/協(xié)處理器提出了極高的要求,,支撐起如此龐大運算規(guī)模也需要在網(wǎng)絡(luò)連接,、高速內(nèi)存等子系統(tǒng)上實現(xiàn)突破。
處理器方面陸續(xù)將會有Intel下一代Xeon處理器,、IBM Power 9及AMD Zen,,加速卡也有NVIDIA Volta、AMD Navi等,,下一代內(nèi)存技術(shù)則會有DDR5,、HBM、HMC等,,它們還會根據(jù)不同應(yīng)用范圍衍生出多個版本,。今天我們來聊聊未來的集中內(nèi)存(也包括顯存)技術(shù)的走向及特點。
HBM的出現(xiàn)代表著3D堆棧的新一代內(nèi)存技術(shù)日趨實用化
從Haswell-E處理器開始,,內(nèi)存就開始從DDR3向DDR4升級,,經(jīng)過2年多時間的磨合,到了今年DDR4內(nèi)存也可以說是白菜價了,。2015年AMD推出了Fiji核心的Fury系列顯卡,,它使用的是HBM顯存,與之前的GDDR5顯存不同,,HBM可以說是普通人接觸到的第一款3D堆棧內(nèi)存,,它代表著未來,而DDR內(nèi)存則是主流代表,,下一步是DDR5內(nèi)存,,再加上美光、Intel主導(dǎo)的HMC內(nèi)存,,這三者以及它們的衍生品可以說是2020年之前內(nèi)存/顯存技術(shù)角逐天下的主角了,。
內(nèi)存/顯存技術(shù)路線圖
預(yù)測DDR、HBM及HMC三強爭霸的結(jié)局還太早了,要想分出勝負我們還得掂量掂量這三者在性能,、功耗及成本上的表現(xiàn),。
DDR5/HBM/HMC內(nèi)存及顯存規(guī)范簡介
DDR5:內(nèi)存正統(tǒng)續(xù)作,顯存/移動內(nèi)存之基礎(chǔ)
2014年隨著Hasewll-E處理器及X99主板的問世,,DDR4內(nèi)存首次進入桌面市場,,不過X99平臺是面向發(fā)燒級玩家的,到了2015年Intel又推出了Skylake處理器,,這才算是走入主流市場,。經(jīng)過這兩年的發(fā)展,DDR4內(nèi)存已經(jīng)從王謝堂前燕飛入尋常百姓家了,,性價比完全不輸DDR3內(nèi)存,。
對于DDR4內(nèi)存,我們之前在三位一體升級換代,,Haswell-E,、X99及DDR4前瞻一文中已經(jīng)詳細解析過它與DDR3內(nèi)存的不同,簡單來說就是在基礎(chǔ)頻率無法大幅提升的情況下,,DDR4通過翻倍提升顯存核心的Bank(內(nèi)存庫)數(shù)量變相提高了數(shù)據(jù)吞吐率,,其數(shù)據(jù)頻率可從前代的0.8-2.1Gbps大幅提升到1.6-3.2Gbps,進而提高了內(nèi)存帶寬,。
此外,,DDR4內(nèi)存的電壓也從前代的1.5V降低到了1.2V,提高了能效,,而隨著工藝的進步,,DDR4內(nèi)存的核心容量也從之前4Gb提升到了8Gb、16Gb,,可以輕松實現(xiàn)單條64GB以及128GB內(nèi)存,,這些都是它比DDR3內(nèi)存先進的地方。
目前高頻DDR4內(nèi)存頻率已經(jīng)達到了4.26Gbps,,差不多又到了一個極限了,,下一步該準備DDR4的繼任者了,不出意外的話,,其命名就是DDR5,技術(shù)路線也類似DDR3到DDR4那樣,,核心頻率同樣不會有大幅提高,,能做文章的地方還是數(shù)據(jù)預(yù)取位寬、內(nèi)存庫數(shù)量等,。
DDR5內(nèi)存目前還在研發(fā)階段,,尚未有具體規(guī)范,所以廠商公布的很多規(guī)格都不是確定的,其目標是相比DDR4內(nèi)存至少帶寬翻倍,,容量更大,,同時更加節(jié)能,具體來說就是數(shù)據(jù)頻率從目前1.6-3.2Gbps的水平提升到3.2-6.4Gbps,,預(yù)取位寬從8bit翻倍到16bit,,內(nèi)存庫提升到16-32個。
至于電壓,,DDR4電壓已經(jīng)降至1.2v,,DDR5有望降至1.1v或者更低。
在三星討論的DDR5內(nèi)存規(guī)范中,,其目標跟美光基本一致,,也是帶寬至少翻倍,預(yù)取位寬也會翻倍,,不過內(nèi)存庫數(shù)量還是16個,,與美光公布的數(shù)據(jù)略有不同。
不過在時間點上,,業(yè)界還是有一定共識的——DDR5預(yù)計在2017年完成規(guī)范制定,,2018年出樣,2019年開始生產(chǎn),,不過要普及的話估計至少是2020年的事了,。
此外,盡管美光,、三星都沒提制程工藝的問題,,不過2018年10nm工藝已經(jīng)量產(chǎn)了,2020年左右則是7nm節(jié)點了,,而目前DDR4最先進的工藝是18nm,,到了2020年那個時間段,內(nèi)存也會殺向10nm以下節(jié)點的,。
DDR5內(nèi)存衍生版之GDDR6顯存
說DDR5內(nèi)存是最正統(tǒng)的內(nèi)存續(xù)作,,不僅因為它是最主流的內(nèi)存選擇,還與它的衍生版有關(guān)——顯存用的下一代GDDR與手機,、平板用的LPDDR低功耗內(nèi)存都跟DDR5息息相關(guān),,業(yè)界在討論DDR5內(nèi)存的同時,同樣也沒忘了GDDR6及未來的LPDDR5內(nèi)存,。
很久之前顯卡用的顯存是跟PC內(nèi)存一樣的,,但是隨著GPU性能的不斷提升,對帶寬的要求也水漲船高,,普通PC內(nèi)存已經(jīng)滿足不了需要了,,在DDR內(nèi)存基礎(chǔ)上就衍生出了GDDR內(nèi)存,,GDDR5就是在DDR3基礎(chǔ)上衍生的,大部分規(guī)格都是相同的,,不過數(shù)據(jù)預(yù)取位寬從4bit翻倍到8bit,,所以帶寬在DDR3基礎(chǔ)上提高一倍,這也是其數(shù)據(jù)頻率是真實頻率4倍的由來,,而普通DDR3內(nèi)存是2倍真實頻率,。
在DDR5基礎(chǔ)上衍生出來的顯存就是GDDR6(雖然還不是正式定名)了,它的實際頻率與目前高頻GDDR5內(nèi)存差不多,,都是1.75GHz左右,,但因為預(yù)取位寬再次翻倍,數(shù)據(jù)頻率則會從7Gbps提升到14+Gbps,,這個思路其實跟美光主推的GDDR5X顯存是一樣的,,同樣是在不提高實際頻率的情況下通過提升預(yù)取位寬實現(xiàn)帶寬提升。
當然,,為了進一步降低功耗,,GDDR6顯存的電壓也會從目前1.5V降至1.35V。
低功耗LPDDR內(nèi)存也會在DDR5基礎(chǔ)上演進,,其速率也能達到6.4Gbps,,不過電壓則會進一步降低,目前LPDDR4已經(jīng)是1.1v電壓了,,LPDDR5電壓會低于1.1v,,目標是實現(xiàn)20%的能效提升。
HBM:第三代性能更強大,,但降低成本也很重要
2015年AMD推出了Fiji核心的Fury系列顯卡,,雖然推出的三款顯卡都是面向高端市場的,售價比較高,,但從技術(shù)上來說Fury系列顯卡絕對是顯卡史上的一次重大變革,,因為它用上了HBM顯存,它不僅僅是性能更強大,,最重要的是HBM顯存極大地減少了PCB面積占用,,可以把高端顯卡做的非常小巧,AMD的R9 Nano顯卡是2015年讓筆者印象最深刻的產(chǎn)品,,比GTX Titan X和GTX 980 Ti更有意義,。
對于HBM顯存,我們之前在評測及解析中也詳細說過它的特點和優(yōu)勢了,,詳情可以參考:AMD詳解HBM顯存:性能遠超GDDR5,,功耗降50%,面積小94%,,一句話來說就是HBM在電壓只有1.2V的情況下將顯存帶寬提升到512GB/s,,性能更強,功耗更低,,占用面積更小,。
到了2016年,HBM顯存又進化到了第二代,,并正式成為JEDEC標準,。與前代產(chǎn)品相比,HBM 2顯存核心容量從2Gb提升到8Gb,,數(shù)據(jù)頻率從1Gbps提升到2Gbps,,帶來的好處就是在同樣4-hi堆棧下,HBM 2單顆顯存容量可達4GB,,帶寬1024GB/s,。
HBM顯存最早是AMD和SK Hynix聯(lián)合研發(fā)的,第一代HBM顯存主要是SK Hynix在生產(chǎn),,HBM 2時代NVIDIA,、三星也參與進來了,前者首發(fā)了HBM 2顯存的Tesla P100加速卡,,SK Hynix也開始量產(chǎn)HBM 2顯存了,,有2-hi、4-hi,、8-hi三種堆棧方式,,頻率1.0、1.6及2.0Gbps,,帶寬分別是128,、204256GB/s,堆棧容量2,、4,、8GB,最高可實現(xiàn)32GB堆???cè)萘浚?024GB/s帶寬,。
HBM 2還沒上市,三星已經(jīng)在討論HBM 3顯存了,,預(yù)計在2019-2020年問世,,不過目前并沒有確切的規(guī)格。從三星的表態(tài)來看,,HBM 3會進一步提高堆棧層數(shù),、核心容量及帶寬,但在核心頻率,、內(nèi)存庫,、DQ位寬方面保持HBM 2的水平,,不過就算提升容量和堆棧層數(shù),也足夠HBM 3容量翻倍,、帶寬翻倍了,,64GB HBM 3容量不是夢。
值得注意的是,,HBM 3顯存的電壓預(yù)計會比目前1.2v低得多,,這有助于大幅降低HBM 3功耗。
從HBM顯存問世開始,,我們就知道它是個好東西,,各方面完勝GDDR顯存——除了成本太高,因為HBM顯存是新標準,,產(chǎn)能不足,,而且它是2.5D堆棧的,制造工藝比GDDR5顯存復(fù)雜多了,,這都加劇了HBM顯存的普及難度,。
在這方面,三星一方面在推進更高性能的HBM 3,,同時也在探討研發(fā)低成本的HBM,,通過移除ECC校驗、緩沖器層,、減少I/O及降低TSV數(shù)量(TSV工藝中打孔數(shù)量越多,,性能越好,但會更復(fù)雜),,這些手段有助于減少HBM成本,,雖然這會對HBM性能造成一定影響,I/O位寬從1024bit減少到512bit,,但可以通過其他手段彌補,,比如提高數(shù)據(jù)頻率到3Gbps,這樣一來低成本HBM的帶寬會從256GB/s降低到200GB/s左右,,還在可接受范圍內(nèi),,而制造成本就低多了。
對HBM來說,,阻礙它普及的最大障礙就是成本了,,一旦低成本HBM得以實現(xiàn),那么HBM就有可能不再局限于高端顯卡之中,,CPU也可以拿它來做緩存了,。
HMC:不同于HBM的3D內(nèi)存,美光獨立支撐
如同閃存從2D NAND轉(zhuǎn)向3D NAND一樣,,內(nèi)存也要從平面轉(zhuǎn)向3D立體,,前面的HBM就是3D內(nèi)存技術(shù)的一種,,不過它并非唯一選擇,美光,、Intel還有HMC(Hybrid Memory Cube)內(nèi)存,,它也是通過TSV硅穿孔工藝堆棧多層DRAM核心以實現(xiàn)3D堆棧的。
實現(xiàn)3D堆棧之后,,HMC也可以搭積木一樣堆疊內(nèi)存核心了,帶來的優(yōu)勢就是:
·性能更強,,帶寬是DDR3內(nèi)存的15倍
·功耗更低,,功耗比DDR4減少70%
·占用面積更小,比DDR4減少90%
·設(shè)計更簡單,,通道復(fù)雜性比DDR4減少88%
HMC與HBM都是TSV工藝的堆棧內(nèi)存,,很容易混淆,不過具體結(jié)構(gòu)上HMC內(nèi)存與HBM還是有很大不同的,,它可以分為三個層次——頂部的是堆棧的DRAM核心,,中間有個邏輯層(logic Layer),最下面則是封裝層(package),。
HMC與處理器的連接方式也不同,,HBM有個工藝復(fù)雜的中介層,打通了處理器與HBM芯片,,而HMC與處理器連接是靠4條高速Link,,每條Link有16個通道,速度最高可達30Gbps,,典型速度有10Gbps,、15Gbps、25Gbps,。如果是4-link,、10Gbps速度,那么帶寬可達160GB/s,,15Gbps速度則是240GB/s,,美光還在開發(fā)8-link HMC,帶寬可上320GB/s,。
美光目前量產(chǎn)的HMC單顆容量2GB,,核心容量為4Gb,4層堆棧,,帶寬160GB/s,,算起來性能比HBM 2顯存的256GB/s要差一些,不過HMC相比HBM還有個優(yōu)勢,,那就是HBM的高帶寬需要離處理器很近,,顯卡跟HBM都是封裝在一起的,,所以制造工藝復(fù)雜,成本太高,,而HMC通過Link與處理器相連,,既可以做近場內(nèi)存(near memory),也可以距離遠點(far memory),,部署更加靈活,。
不過與HBM顯存受到顯卡、FPGA追捧不同,,HMC推廣的力度就小多了,,盡管HMC陣營也有三星、SK Hynix參與,,但真正在推的只有美光,、Intel,Intel代號“Knights Landing”的Xeon Phi上使用了16GB片上緩存,,就是美光提供的HMC,,號稱是DDR4內(nèi)存的5倍性能、5倍能效,,同時面積占用只有后者1/3,。
HMC的規(guī)范發(fā)展已經(jīng)到了2.0時代,據(jù)說美光今年還要推出HMC 3.0規(guī)范,,Link數(shù)量,、堆棧層數(shù)、核心容量都有進一步提高,,帶寬可提升到480GB/s,,該指標跟HBM 3差不多同級了。
小結(jié):
本文主要介紹了2020年之前新一代內(nèi)存/顯存技術(shù)路線,,DDR5內(nèi)存的發(fā)展是按部就班,,DDR5技術(shù)使用傳統(tǒng)思路提升帶寬、降低能耗,,而HBM及HMC則是3D堆棧,,發(fā)展?jié)摿Ρ菵DR5更誘人,不過3D堆棧目前制造過程復(fù)雜,,成本太高,,主要用于高性能計算領(lǐng)域,普通消費者要想用上廉價3D內(nèi)存/顯存還要等技術(shù)成熟,。