《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 國內(nèi)首款存算一體大算力芯片,,瞄準(zhǔn)智能駕駛,!

國內(nèi)首款存算一體大算力芯片,瞄準(zhǔn)智能駕駛,!

2023-05-16
作者: 杜芹
來源:半導(dǎo)體行業(yè)觀察

  用存算一體創(chuàng)新架構(gòu),,重構(gòu)智能駕駛芯片,。后摩智能是國產(chǎn)AI大算力智駕芯片領(lǐng)域跑出的一匹黑馬。

  ChatGPT等人工智能應(yīng)用的爆火再次引發(fā)了行業(yè)對大算力的需求,。未來的計(jì)算系統(tǒng)相比現(xiàn)在的芯片,,至少需要有1000倍甚至更高的效率提升才能滿足無處不在的萬物智能。AI芯片是AI算力的“心臟”,,而高性能的AI芯片需要先進(jìn)的制程技術(shù)來實(shí)現(xiàn)更小的晶體管,、更高的集成度和更低的功耗。隨著摩爾定律在逼近極限,如果繼續(xù)依靠先進(jìn)工藝的底層技術(shù)創(chuàng)新,,沿這個方向走下去,,能否達(dá)到未來所需的算力提升?不好說,。但無論如何,,行業(yè)正在為之努力。

  與此同時(shí),,行業(yè)內(nèi)也有人在另辟蹊徑,,利用底層架構(gòu)創(chuàng)新來實(shí)現(xiàn)算力的提升。近幾年來,,存算一體在作為一項(xiàng)有望突破算力瓶頸的先進(jìn)技術(shù),,正在被國內(nèi)外越來越多企業(yè)選擇,。存算一體這種創(chuàng)新的架構(gòu),,通過將部分或全部的計(jì)算移到存儲中,把計(jì)算單元和存儲單元集成在同一個芯片,,在存儲單元內(nèi)完成運(yùn)算,,減少數(shù)據(jù)來回搬運(yùn)造成的數(shù)據(jù)傳輸延遲、損耗等問題,,以此來突破芯片性能瓶頸及提升能效比,。

  而在存算一體大算力這一領(lǐng)域,國內(nèi)芯片企業(yè)走在了前列,。

  從0到1,,國內(nèi)首款存算一體大算力芯片正式量產(chǎn)

  2023年5月10日,后摩智能正式發(fā)布首款存算一體智駕芯片——鴻途H30,。僅用12nm工藝制程,,該芯片的物理算力實(shí)現(xiàn)了高達(dá)256TOPS,在Int8全精度的計(jì)算提供下,,計(jì)算延時(shí)只有1.5ns,,能效比為30-150 TOPS/W,比業(yè)界同等精度計(jì)算條件下的水平提高了3倍以上,。250TOPS可以說是目前國內(nèi)效率最高的大算力智能駕駛芯片,!35W的典型功耗也令人震驚。這就是存算一體架構(gòu)技術(shù)的魅力,。

  除了大算力和低功耗之外,,它還具有全精度、車規(guī)級,、可量產(chǎn),、通用性的特性。而透過這些突破性技術(shù)表現(xiàn),,我們也嗅到了后摩智能濃濃的技術(shù)創(chuàng)新實(shí)力,。

  首先是存算一體電路結(jié)構(gòu)的設(shè)計(jì),,后摩智能采用的是基于SRAM存儲介質(zhì)的存算一體架構(gòu),將定制化的乘加電路和傳統(tǒng)的SRAM Bit Cell電路完全融合在一起,。下圖中右圖是存算一體電路的架構(gòu)圖,,淺色部分是傳統(tǒng)的SRAM電路,深色部分是一些定制化的電路結(jié)構(gòu),,包括乘法器,、加法數(shù)、累加器等,,做到數(shù)據(jù)讀取出來之后馬上可以在原地參與計(jì)算,。

  其次,H30芯片采用的是后摩智能自研的AI處理器架構(gòu)—IPU(Intelligence Processing Unit),。目前該IPU架構(gòu)規(guī)劃有三代:第一代是天樞架構(gòu),,面向智能駕駛;第二代是天璇架構(gòu),,它可以應(yīng)用于更多的場景,;第三代是天璣架構(gòu),將面向通用人工智能,。H30芯片采用的是第一代天樞架構(gòu)IPU,。

  解決了存和算的問題,在數(shù)據(jù)的傳輸方面:1)后摩智能專門設(shè)計(jì)了專用的數(shù)據(jù)傳輸總線,,它能把各個Tile和各個IPU核連接起來,,在它們之間建立高速的、直接的數(shù)據(jù)傳輸通道,。2)在AI計(jì)算里,,數(shù)據(jù)復(fù)用是一個非常重要的特性,因此,,后摩智能為此設(shè)計(jì)了獨(dú)特的多波機(jī)制,,避免了數(shù)據(jù)重復(fù)的讀取和傳輸。

  通過存算電路底層技術(shù)的創(chuàng)新加上AI處理器架構(gòu)的創(chuàng)新,,再加上出色的工程實(shí)現(xiàn)能力,,最終鴻途H30實(shí)現(xiàn)了多項(xiàng)芯片性能指標(biāo)的突破。與某國際巨頭芯片對比,,在工藝落后一代的情況下,,進(jìn)行完全相同的測試,H30芯片的功耗減少了50%以上,,性能卻有2倍以上的提升,。

  為了幫助客戶更好的落地,后摩智能同步推出了基于鴻途 H30芯片打造的智能駕駛硬件平臺——力馭(Sailing,寓意早日揚(yáng)帆起航),。僅依靠一顆H30芯片,,力馭平臺的CPU算力高達(dá)200 Kdmips,AI算力高 256Tops,,足夠支撐智能駕駛所有的傳感器,。而且力馭平臺的功耗僅為85W,可采用更加靈活的散熱方式,,實(shí)現(xiàn)更低成本的便捷部署,。

  基于鴻途H30芯片后摩智能自主研發(fā)了一款軟件開發(fā)工具鏈—后摩大道,支持 PyTorch,、TensorFlow,、ONNX等主流開源框架,編程兼容CUDA前端語法,,同時(shí)支持SIMD和SIMT 兩種編程模型,,兼顧運(yùn)行效率和開發(fā)效率,進(jìn)一步實(shí)現(xiàn)了鴻途?H30 的高效,、易用,。

  目前后摩智能的鴻途H30芯片將于6月份開始給Alpha客戶送測,。同時(shí),,后摩智能的第二代產(chǎn)品鴻途H50 已經(jīng)在全力研發(fā)中,將于2024年推出,,支持客戶 2025年的量產(chǎn)車型,。

  存算一體技術(shù)優(yōu)勢已然顯現(xiàn)

  當(dāng)下,在各國都在爭搶加速進(jìn)入人工智能時(shí)代的時(shí)間節(jié)點(diǎn)下,,算力是AI技術(shù)角逐的源動力,。然而持續(xù)緊張的地緣關(guān)系,國內(nèi)在先進(jìn)工藝采用方面的掣肘,,使得國產(chǎn)算力的提速面對著多方面的難題,,不僅是算力的需求,功耗也是行業(yè)所面臨的挑戰(zhàn),。此次后摩智能率先在存算一體大算力芯片上的突破,,可以說用實(shí)際產(chǎn)品證明了存算一體技術(shù)的優(yōu)勢和潛力。

  計(jì)算效率高,,工藝依賴度低:我們可以看到,,后摩智能鴻途H30芯片,所采用的12nm的工藝并不是最先進(jìn)的,,但卻能達(dá)到超過200TOPS的算力,。縱觀全球AI芯片的算力發(fā)展情況,基于傳統(tǒng)路徑的芯片在算力提升方面需要很大程度上依賴先進(jìn)工藝,,行業(yè)內(nèi)達(dá)到200TOPS算力的AI芯片一般的工藝都要7nm甚至更先進(jìn)才行,,如英偉達(dá)的Orin芯片和國內(nèi)的一些200TOPS左右算力的芯片等大多都是在7nm。更甚之,,英偉達(dá)的Thor可以實(shí)現(xiàn)1000T以上的算力,,但是工藝要采用4nm。

  與某國際巨頭的8nm智駕領(lǐng)域的某款旗艦芯片,,以Resnet50網(wǎng)絡(luò)為例,,后摩智能H30的性能在等于1的配置條件下,可以達(dá)到8700幀每秒,;如果把它設(shè)成8,,可以突破1萬幀,達(dá)到10300幀每秒的性能,。整體來說后摩H30芯片的性能可以達(dá)到友商的2倍以上,。

  微信截圖_20230516111259.png

  低成本:因?yàn)閷に嚨囊蕾囆圆桓撸钥梢詫?shí)現(xiàn)低成本,,更加普惠,。后摩智能聯(lián)合創(chuàng)始人兼產(chǎn)品副總裁信曉旭在發(fā)布會上透露到:“H30芯片在成本上會非常非常有競爭力?!?/p>

  更低的能耗:由于數(shù)據(jù)傳輸?shù)母咝?,存算一體芯片在計(jì)算過程中需要消耗更少的能量,從而可以實(shí)現(xiàn)更低的功耗,,也更符合可持續(xù)和低碳環(huán)保的理念,。

  計(jì)算延時(shí)低:由于存儲和計(jì)算任務(wù)在同一芯片內(nèi)部完成,存算一體架構(gòu)芯片能夠更快地完成數(shù)據(jù)的讀寫和處理,,從而提高數(shù)據(jù)處理的效率,。例如,相比業(yè)界用5nm工藝的存算一體芯片,,后摩智能的鴻途H30芯片在Int8全精度的計(jì)算提供下,,計(jì)算延時(shí)只有1.5ns,降低了70%,。

  支持大規(guī)模并行計(jì)算:存算一體架構(gòu)芯片能夠支持大規(guī)模并行計(jì)算,,從而更好地滿足人工智能、邊緣計(jì)算,、高性能計(jì)算等應(yīng)用的需求,。

  我們也可以看到,后摩智能的鴻途H30存算一體大算力芯片落地的第一站是智能駕駛,。單從市場應(yīng)用場景來看,,存算一體架構(gòu)的芯片也顯現(xiàn)出多個優(yōu)勢:

  1:存算一體架構(gòu)芯片的高效數(shù)據(jù)傳輸和計(jì)算能力可以幫助實(shí)現(xiàn)高效的圖像處理,;

  2:智能駕駛的安全性是行業(yè)密切關(guān)注的一大問題,而存算一體架構(gòu)的芯片可以將敏感數(shù)據(jù)存儲在同一芯片中,,從而減少了數(shù)據(jù)傳輸?shù)娘L(fēng)險(xiǎn),,提高了數(shù)據(jù)的安全性;

  3:智能駕駛需要支持多種算法和模型,,包括神經(jīng)網(wǎng)絡(luò),、深度學(xué)習(xí)等。存算一體芯片可以根據(jù)不同的算法和模型進(jìn)行靈活配置,,從而實(shí)現(xiàn)更高效的計(jì)算和存儲,。在這方面,鴻途H30芯片可以支持經(jīng)典的基礎(chǔ)網(wǎng)絡(luò)Resnet50,,包括BEV網(wǎng)絡(luò)模型以及廣泛應(yīng)用于高階輔助駕駛領(lǐng)域的 Pointpillar網(wǎng)絡(luò)模型,。

  后摩智能創(chuàng)始人吳強(qiáng)也表示,從技術(shù)和產(chǎn)品需求匹配的角度來看,,存算一體帶來的技術(shù)和產(chǎn)品的優(yōu)勢,,和智能駕駛的關(guān)鍵需求是天然吻合的。其原因主要有兩方面:一方面是算力功耗的需求,;另一方面從終局的角度來看,,智能駕駛的終局是要代替人,實(shí)現(xiàn)無人駕駛,。所以智能駕駛芯片一定要無限接近人腦的效率,。而存算一體技術(shù)正是一個比傳統(tǒng)架構(gòu)更接近人腦的計(jì)算形式,它也能夠達(dá)到比傳統(tǒng)架構(gòu)高許多的計(jì)算效率,。

  從1到100,,存算一體技術(shù)將走向更多應(yīng)用

  對于市場空間如此大的智能駕駛,,如果后摩智能的鴻途H30芯片能夠真正走量并釋放出其優(yōu)勢,。那么,這將不僅為國產(chǎn)智能駕駛領(lǐng)域的客戶們提供一個差異化的新選擇,,也將為存算一體架構(gòu)的芯片的大規(guī)模發(fā)展奠定良好的基礎(chǔ),。許多機(jī)構(gòu)都預(yù)測2023年將是存算一體大規(guī)模商業(yè)落地的元年,伴隨著此次鴻途H30芯片的量產(chǎn)發(fā)布,,存算一體技術(shù)的商業(yè)化元年也即將正式開啟,。

  作為一項(xiàng)通用技術(shù),存算一體技術(shù)可以根據(jù)不同領(lǐng)域和應(yīng)用場景進(jìn)行優(yōu)化和應(yīng)用,。智能駕駛只是存算一體技術(shù)應(yīng)用的冰山一角,,存算一體還有很大的應(yīng)用可能性和商業(yè)價(jià)值的潛力深埋于底下。比如人形機(jī)器人,,服務(wù)機(jī)器人,,以及對算力和能效有更高要求的場景如ChatGPT,、云端推理等等都將是存算一體技術(shù)能夠發(fā)揮所長的應(yīng)用。

  當(dāng)然,,存算一體技術(shù)的更大商用化還需要產(chǎn)業(yè)界上下游的共同努力,,讓存算一體技術(shù)的規(guī)模化應(yīng)用從1走向100,。后摩智能聯(lián)合創(chuàng)始人兼研發(fā)副總裁陳亮在會上透露:“在不久的將來,,我們會把我們的AI處理器硬件設(shè)計(jì)開源,大家可以去下載到我們的IPU設(shè)計(jì)資料,,做PPA的評估和軟件算法的開發(fā),,或者甚至將來用到自己的產(chǎn)品當(dāng)中去。我們希望有更多的人和組織能夠參與進(jìn)來,,相信以大家的智慧可以更好的讓這個方向落地,,大家可以共建生態(tài),最終讓整個產(chǎn)業(yè)鏈?zhǔn)芤??!?/p>

  寫在最后

  2020年11月成立,2022年5月驗(yàn)證芯片成功點(diǎn)亮,,2023年5月量產(chǎn)芯片面世,,對于存算一體新架構(gòu)+大算力這樣一項(xiàng)顛覆性技術(shù)而言,這個速度彰顯了后摩智能的產(chǎn)品落地能力,。通過不斷突破技術(shù)瓶頸和持續(xù)的研發(fā)投入,,后摩智能成功地將存算一體的概念應(yīng)用于大算力AI芯片,并實(shí)現(xiàn)了高性能計(jì)算與低能耗的平衡,。后摩智能的存算一體AI芯片取名鴻途,,寓意是有鴻鵠之志,但是又腳踏實(shí)地,,走向漫漫征途,。

  憑借這一芯片的落地,后摩智能迅速成長為國產(chǎn)AI芯片行業(yè)的重要創(chuàng)新力量,。而且在當(dāng)下大算力AI芯片發(fā)展遭遇瓶頸之際,,作為國內(nèi)率先落地存算一體大算力AI芯片的公司,后摩智能用實(shí)打?qū)嵉漠a(chǎn)品,,為我國發(fā)展高算力,、低功耗和低成本的AI芯片注入新的發(fā)展動能。

  更多精彩內(nèi)容歡迎點(diǎn)擊==>>電子技術(shù)應(yīng)用-AET<<

微信圖片_20210517164139.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章,、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容,、版權(quán)和其它問題,,請及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118;郵箱:[email protected],。