“數(shù)字時代的關(guān)鍵資源是數(shù)據(jù),、算力和算法,,其中數(shù)據(jù)是新生產(chǎn)資料,,算力是新生產(chǎn)力,,算法是新生產(chǎn)關(guān)系,,三者構(gòu)成數(shù)字經(jīng)濟時代最基本的生產(chǎn)基石,?!?/p>
2021年9月,,中國信息通信研究院發(fā)布的《中國算力發(fā)展指數(shù)白皮書》中,用上述結(jié)論強調(diào)了算力在數(shù)字經(jīng)濟時代的基礎(chǔ)性作用,。今年2月,,多部委聯(lián)合印發(fā)通知,同意在京津冀,、長三角,、粵港澳大灣區(qū)、成渝,、內(nèi)蒙古,、貴州、甘肅,、寧夏等8地啟動建設(shè)國家算力樞紐節(jié)點,,并規(guī)劃了10個國家數(shù)據(jù)中心集群,這標(biāo)志著全國一體化大數(shù)據(jù)中心體系——“東數(shù)西算”工程正式全面啟動,。
這項被稱為數(shù)字經(jīng)濟時代的“南水北調(diào)”“西電東送”“西氣東輸”的重大工程受到全社會高度關(guān)注,。而在熱點背后,當(dāng)上千億參數(shù)的超大規(guī)模深度學(xué)習(xí)模型成為現(xiàn)實,,指引整個人工智能產(chǎn)業(yè)尋找一條新的可行之路,,縮短我們與通用智能的距離之時,海量數(shù)據(jù)所引發(fā)的超大算力需求,,導(dǎo)致了目前的一個客觀現(xiàn)狀:算力的發(fā)展始終未能跟上算法的發(fā)展,,這對芯片半導(dǎo)體領(lǐng)域提出了新的挑戰(zhàn)。
怎樣實現(xiàn)“既能低功耗、又能高精度,、還能大算力”,,已成為“后摩爾時代”全球數(shù)字經(jīng)濟體可持續(xù)發(fā)展的基礎(chǔ)與核心。
實際上,,當(dāng)大洋彼岸的美國對我國芯片半導(dǎo)體產(chǎn)業(yè)一步步封鎖,,通過不斷干預(yù)中國購買光刻機、組建“芯片聯(lián)盟”阻礙中國發(fā)展先進(jìn)半導(dǎo)體產(chǎn)業(yè)以來,,我國就在為擺脫芯片受制于人的局面大力推動產(chǎn)業(yè)創(chuàng)新,。先是8月9日美國通過《2022年芯片和科學(xué)法案》,接著是8月31日,,芯片巨頭英偉達(dá)和AMD均接到美國政府的要求,,被限制向中國出口最新旗艦GPU計算芯片及板卡,一批擁有國產(chǎn)自主研發(fā)能力的半導(dǎo)體企業(yè)主動或被動地走入了大眾視野,。
創(chuàng)立于2020年,,以存算一體AI大算力芯片技術(shù)作為突破口的億鑄科技便是其中之一,作為國內(nèi)首家研發(fā)基于ReRAM(RRAM)全數(shù)字存算一體AI大算力芯片的企業(yè),,在摩爾定律逼近物理極限的情況下,,億鑄科技嘗試通過架構(gòu)創(chuàng)新突破馮·諾伊曼瓶頸,成為中國AI芯片創(chuàng)業(yè)大軍中的革新者,,也為解決國內(nèi)AI算力尤其是大算力的困局提供了新的方向,。
超越“摩爾時代”,億鑄聚焦存算一體架構(gòu)的AI大算力芯片
早在1992年,,中國工程院院士許居衍就預(yù)測,,到2014年后,半導(dǎo)體產(chǎn)業(yè)將會遇到拐點,,并進(jìn)入“后摩爾時代”,。
這種預(yù)測的根據(jù)在于,在傳統(tǒng)的馮·諾依曼計算系統(tǒng)采用存儲和運算分離的架構(gòu)下,,80%-90%的功耗發(fā)生在數(shù)據(jù)傳輸上,,99%的時間消耗在存儲器讀寫過程中,真正用于計算的能耗和時間占比很低,,于是造成“能耗墻”和“存儲墻”的出現(xiàn),。而存算分離的架構(gòu)非常容易導(dǎo)致數(shù)據(jù)搬運過程中發(fā)生擁塞,尤其是在動態(tài)環(huán)境下,,對數(shù)據(jù)進(jìn)行調(diào)度和管理其實非常復(fù)雜,導(dǎo)致編譯器無法在靜態(tài)可預(yù)測的情況下對算子,、函數(shù),、程序或者網(wǎng)絡(luò)做整體的優(yōu)化,只能手動、一個個或者一層層對程序進(jìn)行優(yōu)化,,包括層與層之間的適配,,耗費了大量時間,于是出現(xiàn)了“編譯墻”,。
在“三堵墻”的限制下,,采用馮·諾依曼架構(gòu)的計算系統(tǒng)將嚴(yán)重制約人工智能領(lǐng)域的算力和能效提升。以智能汽車領(lǐng)域為例,,十年前,,汽車的算力還不足1TOPS,而未來,,為滿足L5級別的無人駕駛技術(shù),,汽車需要達(dá)到4000TOPS的算力水平才有可能實現(xiàn),到那時若仍以傳統(tǒng)的馮·諾依曼架構(gòu)研發(fā)芯片,,其功耗將非??鋸垺?/p>
為解決這一問題,,科學(xué)家就必須要翻越這“三堵墻”,。實際上,早在1969年,,斯坦福大學(xué)研究員Kautz等人就提出過存算一體計算機的概念,,但在當(dāng)時,一方面受限于芯片設(shè)計復(fù)雜度與制造成本問題,,另一方面由于缺少大數(shù)據(jù)應(yīng)用驅(qū)動,,這些存算一體概念僅停留在研究階段,并未獲得實際應(yīng)用,。直到近年來,,伴隨GPT-3、“悟道”等人工智能大模型的問世,,海量數(shù)據(jù)所引發(fā)了超大算力需求和高能效比的矛盾而開始受到重視,,業(yè)界逐漸形成一個共識——存算一體架構(gòu)可能是現(xiàn)階段基于CMOS工藝能同時滿足大算力、高精度,、高能效比的最有效途徑,。
全球范圍內(nèi),再度興起了對存算一體的產(chǎn)業(yè)研究,,海外巨頭諸如英特爾,、三星、IBM,、東芝,、SK海力士等都在進(jìn)行相關(guān)領(lǐng)域的布局和產(chǎn)品研發(fā),。在億鑄科技首席技術(shù)官Debu看來,由于存儲器件以及配套工藝發(fā)展等原因,,此前的存算一體芯片多基于Flash通過模擬計算的方式實現(xiàn),,后來出現(xiàn)了基于SRAM的存算一體技術(shù)。這些技術(shù)無疑為存算一體架構(gòu)和生態(tài)發(fā)展做出了很大的貢獻(xiàn),,他們不僅向業(yè)界證明了存算一體技術(shù)的可實現(xiàn)性以及價值,,同時也為存算一體生態(tài)的建設(shè)做了很多基建工作。
但要注意到,,既有的存算一體技術(shù)仍然主要聚集于小算力,、低精度的場景,并未能將存算一體高能效比的優(yōu)勢應(yīng)用于大算力比如云計算,、自動駕駛等領(lǐng)域,。因此,億鑄的技術(shù)價值在于“將存算一體架構(gòu)切實向大算力,、高精度,、高能效比的方向推進(jìn)和落地,實現(xiàn)這一存算一體架構(gòu)里程碑式的發(fā)展節(jié)點”,。
億鑄科技創(chuàng)始人,、董事長兼CEO熊大鵬博士表示:“億鑄科技以全數(shù)字化的方式將ReRAM 應(yīng)用于存算一體AI大算力芯片,這么做的優(yōu)勢在于:一,, 存算一體架構(gòu)可以打破傳統(tǒng)馮·諾依曼架構(gòu)下的存算墻,、能耗墻和編譯墻;二,, 存儲介質(zhì)ReRAM在算力潛能,、算力精度和算力效率等主要指標(biāo)上有著數(shù)量級優(yōu)勢,是目前最適合做存算一體AI大算力芯片的憶阻器,;三,,全數(shù)字化的技術(shù)路徑在滿足大算力的同時還能做到支持高精度,使得存算一體架構(gòu)真正在AI大算力方向落地,。因此,,億鑄科技能夠為業(yè)界帶來大算力、超能效比,、低功耗,、易部署的AI推理計算解決方案?!?/p>
他強調(diào),,ReRAM這一新型憶阻器具有非易失性、面積小,、密度高,、成本低,、功耗低、讀寫速度快等一系列優(yōu)點,,隨著ReRAM的產(chǎn)業(yè)配套逐步完善和成熟,該技術(shù)無疑已經(jīng)到了“商業(yè)應(yīng)用爆發(fā)前夜”,。此外,,ReRAM與CMOS工藝兼容,不管是本身密度的發(fā)展,,還是通過工藝制程的演進(jìn)以及3D堆疊的技術(shù)的使用,,均能從多個維度持續(xù)推進(jìn)ReRAM密度和能效比的提升。億鑄相信,,億鑄在產(chǎn)品算力與能效比方面的提升在國內(nèi)屬于一流水準(zhǔn),。
“億鑄初代產(chǎn)品可以基于28納米工藝實現(xiàn)同等算力、10倍能效比,,同時擁有更低的軟件生態(tài)兼容和建設(shè)成本,,而且選擇的憶阻器未來有很大的成長空間,這些都是支撐億鑄未來發(fā)展動力以及確定性的重要因素,?!?/p>
大算力賽道上,中國企業(yè)以技術(shù)突圍
隨著AI的場景變得越來越普及以及多元化,,算法模型也變得越來越復(fù)雜,,社會對算力的需求遠(yuǎn)超我們想象。根據(jù)《中國算力發(fā)展指數(shù)白皮書》,,2020年,,全球算力總規(guī)模達(dá)到429EFlops,增速達(dá)到39%,,據(jù)IDC預(yù)測,,2025年全球物聯(lián)網(wǎng)設(shè)備數(shù)將超過400億臺,產(chǎn)生數(shù)據(jù)量接近80ZB,,預(yù)估未來五年全球算力規(guī)模將以超過50%的速度增長,,到2025年整體規(guī)模將達(dá)到3300EFlops。其中,,中國2021年的AI芯片市場規(guī)模超過400億元人民幣,,其中AI推理計算占比超50%,預(yù)計未來5年CAGR超40%,。
但國家對碳達(dá)峰,、碳中和的戰(zhàn)略目標(biāo)設(shè)定又要求AI算力在不斷攀升的同時,還要實現(xiàn)能效比的快速提升,,如此,,才能既滿足市場對AI算力的要求,、又滿足國家對能源結(jié)構(gòu)性優(yōu)化的要求。熊大鵬博士認(rèn)為,,在傳統(tǒng)異構(gòu)AI芯片面臨工藝摩爾墻的技術(shù)瓶頸,、算法模型日益復(fù)雜和龐大、能耗使用監(jiān)管日益嚴(yán)格的大背景下,,存算一體AI芯片有著不可多得的歷史發(fā)展機遇,,這也讓存算一體這一先進(jìn)計算架構(gòu)成為前沿研究熱點,存算一體及AI大算力芯片也即將迎來了行業(yè)爆發(fā)的契機,。
億鑄的全數(shù)字化存算一體技術(shù)可切實將存算一體架構(gòu)在大算力,、高能效比的芯片平臺應(yīng)用并落地,這一技術(shù)通過稀疏化的設(shè)計原理以及無需AD/DA(數(shù)模轉(zhuǎn)換)部分,,將芯片的面積和能耗用于數(shù)據(jù)計算本身,,從而實現(xiàn)大算力和高精度的多維度滿足。
憑借技術(shù)實力強勁的團(tuán)隊和國產(chǎn)產(chǎn)業(yè)鏈核心節(jié)點的支持,,億鑄即將于2023年上半年推出自己的第一代芯片,,并于同年投片第二代芯片。
存算一體架構(gòu)的AI大算力芯片作為技術(shù)領(lǐng)域跨度多,、集成度高,、創(chuàng)新型強的技術(shù)賽道,需要行業(yè)資深從業(yè)者以及優(yōu)秀的前沿科學(xué)家,。
億鑄團(tuán)隊研發(fā)能力覆蓋存儲器件,、存算陣列、芯片架構(gòu),、芯片設(shè)計,、軟件生態(tài)、AI算法和工程落地等全鏈條,,研發(fā)團(tuán)隊發(fā)表頂會論文40余篇,,工程團(tuán)隊成員平均擁有25年以上在高端集成電路設(shè)計領(lǐng)域的經(jīng)驗;還擁有20+顆SoC芯片的設(shè)計,、量產(chǎn)及銷售經(jīng)驗,,因此,團(tuán)隊在技術(shù)定位和技術(shù)戰(zhàn)略上的深謀遠(yuǎn)慮,,也有對存算一體技術(shù)探索的底氣,。
芯片作為人類社會各產(chǎn)業(yè)信息化、數(shù)字化,、智能化發(fā)展的基本生產(chǎn)資料,,其發(fā)展根植于人類社會信息化、數(shù)字化和智能化發(fā)展的要求,,這正是美國阻撓中國芯片半導(dǎo)體產(chǎn)業(yè)發(fā)展,,并大力投入爭奪頭部芯片企業(yè)支持的原因,。而在AI芯片領(lǐng)域,對算力的需求在未來較長的一段時間內(nèi)仍將保持較高速度的發(fā)展,,這一點已經(jīng)成為整個產(chǎn)業(yè)界的共識,。
但從另一角度來看,當(dāng)前存算一體領(lǐng)域的挑戰(zhàn)與機遇并存,。2021年,,中國芯片進(jìn)口額超過4300億美元,隨著中國本土工廠擴大產(chǎn)能,,去年中國對海外芯片制造設(shè)備的采購訂單增長58%,若不能通過先進(jìn)技術(shù)實現(xiàn)突破,,我國對海外芯片半導(dǎo)體產(chǎn)業(yè)的依賴將持續(xù)增加,,當(dāng)前局勢刻不容緩。
在億鑄看來,,在先進(jìn)工藝短期內(nèi)無法完全實現(xiàn)全鏈國產(chǎn)化的大前提下,,國內(nèi)半導(dǎo)體企業(yè)必須具備與先進(jìn)工藝制成解耦的技術(shù),同時還要實現(xiàn)與基于先進(jìn)工藝制程的芯片產(chǎn)品同等甚至更好的性能表現(xiàn),,在這方面,,億鑄基于傳統(tǒng)28納米CMOS工藝和既有國內(nèi)產(chǎn)業(yè)配套設(shè)計的存算一體AI大算力芯片可以實現(xiàn)與先進(jìn)工藝制程的AI芯片同等算力但10倍能效比。
此外,,億鑄的目標(biāo)除了將存算一體架構(gòu)切實在AI大算力領(lǐng)域商用落地之外,,還期望和其他存算一體賽道上共同奮斗的創(chuàng)業(yè)伙伴們一起共建存算一體生態(tài)。
芯片半導(dǎo)體領(lǐng)域發(fā)展至今,,已成為全鏈高度耦合的產(chǎn)業(yè),,各個環(huán)節(jié)唇齒相依、缺一不可,。但通過架構(gòu)的創(chuàng)新,,基于可國產(chǎn)化的產(chǎn)業(yè)配套,億鑄將為業(yè)界提供大算力,、超高能效比,、易部署的AI大算力芯片產(chǎn)品,在不改變數(shù)據(jù)中心物理空間和既有基建的前提下,,大大提升算力密度,,以及能效比,為國內(nèi)產(chǎn)業(yè)的智能化發(fā)展貢獻(xiàn)出自己的力量,。
更多信息可以來這里獲取==>>電子技術(shù)應(yīng)用-AET<<