11月3日,,據(jù)官方消息披露,寒武紀(jì)正式發(fā)布第三代云端AI芯片思元370,。據(jù)介紹,,思元370基于7nm工藝打造,也是寒武紀(jì)首款采用Chiplet(小芯片or芯粒)技術(shù)的AI芯片,。思元370集成了390億個晶體管,,最大算力高達(dá)256TOPS(INT8),是寒武紀(jì)第二代產(chǎn)品思元270算力的2倍,。
官方表示,,憑借寒武紀(jì)最新智能芯片架構(gòu)MLUarch03,相較于峰值算力的提升,,思元370實(shí)測性能表現(xiàn)更為優(yōu)秀,。
以ResNet-50為例,MLU370-S4加速卡(半高半長)實(shí)測性能為同尺寸主流GPU的2倍,。MLU370-X4加速卡(全高全長)實(shí)測性能與同尺寸主流GPU相當(dāng),,能效則大幅領(lǐng)先,。
值得一提的是,思元370也是國內(nèi)第一顆支持LPDDR5內(nèi)存的云端AI芯片,,內(nèi)存帶寬是上一代產(chǎn)品的3倍,,訪存能效達(dá)GDDR6的1.5倍。
解碼方面,,思元370支持132路1080p視頻解碼或10路8K視頻解碼,。
編碼上,全新編碼器通過靈活的碼率優(yōu)化(RDO)控制,、多參考幀,、二次編碼等特性組合,在相同圖像質(zhì)量(全高清視頻PSNR)的情況下比上一代產(chǎn)品節(jié)省42%帶寬,,有效降低帶寬成本,。
從云端推理思元270、邊緣推理思元220,、云端訓(xùn)練思元290,,到最新發(fā)布的推訓(xùn)一體思元370,寒武紀(jì)為用戶提供了覆蓋不同場景,、不同算力規(guī)模的全系列產(chǎn)品,。此次發(fā)布的256TOPS算力的思元370主要面向中高端推訓(xùn)場景,與主要面向訓(xùn)練的512TOPS高端產(chǎn)品思元290形成協(xié)同,,共同為客戶提供全功能,、全場景的智能算力。
思元370在2020年三季度流片,,相關(guān)加速卡產(chǎn)品于2021年二季度陸續(xù)送測客戶,。目前,部分客戶已完成測試,、導(dǎo)入,,產(chǎn)品進(jìn)入早期銷售階段。
日前寒武紀(jì)發(fā)布了2021第三季度業(yè)績報告,。2021年前三季度,,寒武紀(jì)營業(yè)收入2.22億元,同比增長41.19%,;研發(fā)投入合計7.04億元,,同比增加62.62%,研發(fā)投入占營業(yè)收入的比例為316.72%,,同比增加41.74%,。