1、芯片是軟件定義汽車生態(tài)發(fā)展的基石
在智能網(wǎng)聯(lián)汽車產(chǎn)業(yè)大變革背景下,,軟件定義汽車?yán)砟钜殉蔀楣沧R(shí),。傳統(tǒng)汽車采用 的分布式 E/E 架構(gòu)因計(jì)算能力不足、通訊帶寬不足,、不便于軟件升級(jí)等瓶頸,,不能滿足 現(xiàn)階段汽車發(fā)展的需求,E/E 架構(gòu)升級(jí)已成為智能網(wǎng)聯(lián)汽車發(fā)展的關(guān)鍵,。
汽車 E/E 架構(gòu)升級(jí)主要體現(xiàn)在:1)硬件架構(gòu)升級(jí),。由分布式 ECU 向域控制/中央 集中架構(gòu)方向發(fā)展。好處在于:提升算力利用率,,減少算力設(shè)計(jì)總需求,;數(shù)據(jù)統(tǒng)一交互, 實(shí)現(xiàn)整車功能協(xié)同,;縮短線束,,降低故障率,減輕質(zhì)量,。2)軟件架構(gòu)升級(jí),。通過(guò) AutoSAR 等軟件架構(gòu)提供標(biāo)準(zhǔn)的接口定義,模塊化設(shè)計(jì),,促使軟硬件解耦分層,,實(shí)現(xiàn)軟硬件設(shè)計(jì) 分離;Classic AutoSAR 架構(gòu)逐步向 Classic AutoSAR 和 Adaptive AutoSAR 混合式架構(gòu)方 向發(fā)展,。好處在于:可實(shí)現(xiàn)軟件/固件 OTA 升級(jí),、軟件架構(gòu)的軟實(shí)時(shí)、操作系統(tǒng)可移植,;采集數(shù)據(jù)信息多功能應(yīng)用,,有效減少硬件需求量,真正實(shí)現(xiàn)軟件定義汽車,。3)通信架構(gòu) 升級(jí),。車載網(wǎng)絡(luò)骨干由 LIN/CAN 總線向以太網(wǎng)方向發(fā)展,。好處在于:滿足高速傳輸、 高通量,、低延遲等性能需求,,同時(shí)也可減少安裝、測(cè)試成本,。
從博世對(duì) E/E 架構(gòu)定義來(lái)看,,硬件架構(gòu)的升級(jí)路徑表現(xiàn)為分布式(模塊化→集成 化)、域集中(域控制集中→跨域融合),、中央集中式(車載電腦→車-云計(jì)算),。即為分 布式 ECU(每個(gè)功能對(duì)應(yīng)一個(gè) ECU)逐漸模塊化,、集成向域控制器(一般按照動(dòng)力域,、 底盤域、車身域,、信息娛樂域和 ADAS 域等),,然后部分域開始跨域融合發(fā)展(如底盤 和動(dòng)力域功能安全、信息安全相似),,并發(fā)展整合為中央計(jì)算平臺(tái)(即一個(gè)電腦),,最后 向云計(jì)算和車端計(jì)算(中央計(jì)算平臺(tái))發(fā)展。其中車端計(jì)算主要用于車內(nèi)部的實(shí)時(shí)處理,, 而云計(jì)算作為車端計(jì)算的補(bǔ)充,,為智能汽車提供非實(shí)時(shí)性(如座艙部分場(chǎng)景可允許微秒 級(jí)別的延遲)的數(shù)據(jù)交互和運(yùn)算處理。
硬件架構(gòu)升級(jí)驅(qū)動(dòng)芯片算力需求呈現(xiàn)指數(shù)級(jí)提升趨勢(shì),。傳統(tǒng)汽車功能簡(jiǎn)單,,與外界 交互較少,常為分布式 ECU,,主要為控制指令運(yùn)算(約為百萬(wàn)條指令每秒),、無(wú) AI 運(yùn)算 能力、存儲(chǔ)較??;智能網(wǎng)聯(lián)汽車,不僅需要與人交互,,也需要大量與外界環(huán)境甚至云數(shù) 據(jù)中心交互,,未來(lái)將面臨海量的非結(jié)構(gòu)化數(shù)據(jù)需要處理,車端中央計(jì)算平臺(tái)將需要 500+ 百萬(wàn)條指令/秒的控制指令運(yùn)算能力,、300+TOPS(即為 300*1012 次每秒)的 AI 算力,。
智能網(wǎng)聯(lián)汽車四大核心技術(shù):芯片、操作系統(tǒng),、算法,、數(shù)據(jù)共同形成生態(tài)閉環(huán),,芯 片是智能網(wǎng)聯(lián)汽車生態(tài)發(fā)展的基石。類比手機(jī)產(chǎn)業(yè)鏈,,我們認(rèn)為芯片/操作系統(tǒng)或成為寡 頭壟斷格局,,而從當(dāng)下行業(yè)發(fā)展看,芯片或格局相對(duì)較為穩(wěn)定,,且處在產(chǎn)業(yè)核心位置,。
2. 汽車處理芯片由 MCU 向 AI 芯片方向發(fā)展
半導(dǎo)體可分為模擬芯片、數(shù)字芯片,、OSD 三大類,。模擬電路是指處理模擬信號(hào)的電 子電路。模擬信號(hào)具有連續(xù)性,,信號(hào)傳播的信息包含在幅度,、頻率、相位的變化上,,常 應(yīng)用于放大信號(hào),,信號(hào)源兩方面。數(shù)字電路是指處理數(shù)字信號(hào)的電子電路,。數(shù)字信號(hào)以 二進(jìn)制邏輯代數(shù)為基礎(chǔ),,實(shí)現(xiàn)簡(jiǎn)單,系統(tǒng)可靠,,具有算數(shù)運(yùn)算和邏輯運(yùn)算的功能,。OSD 包括光電器件、傳感器,、分立器件三個(gè)細(xì)分類型,。
2.1. 汽車數(shù)據(jù)處理芯片運(yùn)算由控制指令向 AI 運(yùn)算方向發(fā)展
現(xiàn)階段,汽車芯片市場(chǎng)上對(duì)汽車數(shù)據(jù)處理芯片分類有按三類:1)智能運(yùn)算為主的 AI 芯片,;2)算力較強(qiáng)的主 CPU,;3)算力較弱的 MCU(仍可視為 CPU)。也有按兩類:1)智能運(yùn)算為主的 AI 芯片,;2)CPU 運(yùn)算為主的 MCU,。為了便于理解,主 CPU 和 MCU 的主要玩家都是同一類,,而且 CPU 與 MCU 本質(zhì)均為控制指令運(yùn)算,,因此我們采用第二 種分類方法。
汽車芯片由以控制指令運(yùn)算為主的 MCU 向智能運(yùn)算為主的 AI 芯片方向發(fā)展,。1) 控制指令運(yùn)算可執(zhí)行如等待指令,、停機(jī)指令、空操作指令、中斷指令等,,其運(yùn)算單位為 DMIPS:即 Dhrystone MIPS 測(cè)試下,,計(jì)算能力為百萬(wàn)條指令/秒,,一般通用芯片常用其 表示,,如傳統(tǒng)汽車電子的 MCU 等,代表廠商如英飛凌,、瑞薩,、恩智浦等。2)AI 矩陣 運(yùn)算常指對(duì)矩陣運(yùn)算做加速的能力,,對(duì)應(yīng)用于圖像,、視頻等非結(jié)構(gòu)化數(shù)據(jù)的運(yùn)算處理的 情況下,單位功耗將更低,,計(jì)算速度更快,,其運(yùn)算單位為 TOPS、Tflops,,均指每秒運(yùn)算 1012 次,。TOPS:指數(shù)據(jù)類型為整數(shù)型,,常用于自動(dòng)駕駛等領(lǐng)域,,代表產(chǎn)品如華為昇騰系 列芯片、地平線征程系列芯片,、寒武紀(jì)的 MLU 系列芯片等,。Tflops:指數(shù)據(jù)類型為單精度浮點(diǎn)數(shù),較整數(shù)型數(shù)據(jù)精度更高,,通用 AI 芯片常用它表示,,常用于如核實(shí)驗(yàn)室運(yùn)算、 分子動(dòng)力學(xué)運(yùn)算等,,代表產(chǎn)品如英偉達(dá)的 GPU 芯片,。
在智能網(wǎng)聯(lián)汽車領(lǐng)域,Int8 數(shù)據(jù)類型精度即可滿足現(xiàn)階段 AI 運(yùn)算要求,。Int 8 和 FP32 分為定點(diǎn)數(shù)和浮點(diǎn)數(shù),,小數(shù)點(diǎn)的位置是固定的,則為定點(diǎn)數(shù),,小數(shù)點(diǎn)的位置是浮動(dòng) 的,,則為浮點(diǎn)數(shù)。Int8 代表 8 個(gè)字節(jié),,此外,,還有 int4,int16 等字節(jié)數(shù)越高,,計(jì)算精度 會(huì)提升,,但占用存儲(chǔ)增多,會(huì)降低計(jì)算速度,,所以為保證滿足數(shù)據(jù)精度和運(yùn)算速度,,常 用 Int8 數(shù)據(jù)類型,,單位為 TOPS(即 1012次/秒)。
汽車芯片結(jié)構(gòu)形式由 MCU 向 SOC 異構(gòu)芯片方向發(fā)展,。汽車數(shù)據(jù)處理芯片按應(yīng)用 可分為 MCU(微控制器),、SoC(System on Chip 系統(tǒng)級(jí)芯片),。MCU 結(jié)構(gòu)簡(jiǎn)單,可視 為簡(jiǎn)化版本的 CPU,,其將 CPU 的頻率和規(guī)格適當(dāng)縮減,,并將內(nèi)存、計(jì)數(shù)器,、IO 接口、 I/D 轉(zhuǎn)換等結(jié)構(gòu)都整合到單一芯片,,形成芯片級(jí)的計(jì)算機(jī),,主要用于汽車執(zhí)行端 ECU 中 進(jìn)行控制指令運(yùn)算。
SoC 是一顆系統(tǒng)級(jí)芯片,,常由 CPU+GPU+DSP+NPU+各種外設(shè)接 口,、存儲(chǔ)類型等電子元件組成,現(xiàn)階段主要應(yīng)用于座艙 IVI,、域控制等較復(fù)雜的領(lǐng)域,。SOC 較 MCU 集成程度更高,常集成 AI 處理單元,,功能更復(fù)雜,。SOC 芯片:1) 硬件集成規(guī)模更為龐大,提升資源利用效率,。常額外集成音頻處理 DSP/圖像處理 GPU/ 深度學(xué)習(xí)加速單元 NPU 等,單顆芯片上集成更多的配套電路,,減小了面積,,提升資源 利用率,片上互聯(lián)利于集成電路之間的高速互通互聯(lián)。2)芯片上軟件配套更大,,提升處 理效率,。SOC 芯片上有豐富的軟件配套(工具鏈、編譯器等),,提升了處理效率,。3)可 支持多任務(wù)的復(fù)雜系統(tǒng)。但并非所有的 SOC 芯片均為 AI 芯片,,需集成一定規(guī)模的時(shí) 間網(wǎng)絡(luò)單元才是 AI 芯片,,如華為昇騰芯片、地平線征程芯片,、寒武紀(jì) MLU 芯片,、特斯 拉 FSD 均為此類芯片。
2.2. ARM 內(nèi)核提供芯片控制指令運(yùn)算能力
CPU 架構(gòu)可分為 X86 為代表的復(fù)雜指令集架構(gòu),,和 ARM 為代表的精簡(jiǎn)指令集架 構(gòu),。汽車 CPU 架構(gòu)主要為 ARM 架構(gòu),在 MCU 和 SOC 中擔(dān)任控制指令運(yùn)算,。CPU 架 構(gòu)可分為 CISC(復(fù)雜指令集)架構(gòu)和 RISC(精簡(jiǎn)指令集)架構(gòu),。1)復(fù)雜指令集指令可 變格式,包括 8,、16,、32、64 位,,其特點(diǎn)是單指令功能強(qiáng)大且復(fù)雜,,指令執(zhí)行周期長(zhǎng), 可以直接操作內(nèi)存,,常見的復(fù)雜指令集如 X86,代表企業(yè) intel,、AMD,。2)精簡(jiǎn)指令集 的特點(diǎn)是單指令功能簡(jiǎn)單、執(zhí)行速度快,,編譯效率高,,不能直接操作內(nèi)存,常見的精簡(jiǎn) 指令集有 ARM,、MIPS,、OpenRISC 以及 RSIC-V 等,代表企業(yè):ARM,。ARM 處理器內(nèi) 核廣泛用于嵌入式系統(tǒng),,具有執(zhí)行效率高,低成本等優(yōu)點(diǎn)。
ARM Cortex 系列主要分為 A,、R,、M 三類。1)Cortex-A 系列:常集成于 SOC 中,, 面向性能密集型系統(tǒng)的應(yīng)用處理器內(nèi)核,,帶寬多為 64/32 位,主頻可達(dá) GHz 級(jí)別 (1GHz=103MHz),,當(dāng)主頻達(dá)到 1GHz 時(shí),,其單核控制指令算力為幾千 DMIPS(DMIPS 即為百萬(wàn)條指令每秒),多用于汽車座艙娛樂信息系統(tǒng)或 ADAS 領(lǐng)域,;2)Cortex-M 系 列:常集成于 MCU 中,,主要面向各類嵌入式應(yīng)用的微控制器內(nèi)核,主頻為幾十-幾百 MHz 級(jí)別,,其單核控制指令算力為幾十至幾百 DMIPS,,多用于汽車執(zhí)行端控制領(lǐng)域;3)Cortex-R 系列面向?qū)崟r(shí)應(yīng)用的高性能內(nèi)核,,介于 A 與 M 之間,。
2.3. AI 處理器提供芯片智能運(yùn)算能力
AI 處理器可分為云端處理器、邊緣端處理器,、終端處理器,。1)云端 AI 處理器, 支持 Int8 定點(diǎn)運(yùn)算或 FP16,、FP32 浮點(diǎn)運(yùn)算,,支持深度學(xué)習(xí)推理/訓(xùn)練要求,主要應(yīng)用 于政府,、企業(yè)數(shù)據(jù)中心的服務(wù)器中,,如服務(wù)金融業(yè)、航空航天,、氣象預(yù)報(bào),、宇宙演化模 擬以及抗震分析等領(lǐng)域計(jì)算。此外在未來(lái) 5G 應(yīng)用,,更多的汽車數(shù)據(jù)會(huì)傳送到車企數(shù)據(jù) 中心用來(lái)訓(xùn)練模型,,實(shí)現(xiàn)軟件、算法的優(yōu)化,。2)邊緣端 AI 處理器,,Int8 定點(diǎn)運(yùn)算,支 持深度學(xué)習(xí)推理要求,,主要應(yīng)用于工控機(jī),、安防攝像頭,、機(jī)器人、汽車車端等領(lǐng)域,,由 于所搭載設(shè)備的電力資源有限,,能效比高(算力/功耗,值越高越經(jīng)濟(jì)),、接口豐富等是 關(guān)鍵,。3)終端 AI 處理器主要支持深度學(xué)習(xí)推理功能,主要應(yīng)用于手機(jī)等移動(dòng)終端,,如 華為麒麟系列芯片,。未來(lái)云邊端三類處理器并非競(jìng)爭(zhēng)關(guān)系,而是未來(lái)會(huì)進(jìn)一步協(xié)同發(fā)展,, 云端訓(xùn)練模型實(shí)現(xiàn)算法軟件的優(yōu)化,,并提供給邊緣/終端進(jìn)行本地化 AI 運(yùn)算。
車端 AI 處理器現(xiàn)階段主要負(fù)責(zé)深度學(xué)習(xí)的推理任務(wù),。智能算法范圍由大至小依次 為:人工智能,、機(jī)器學(xué)習(xí)、深度學(xué)習(xí),、神經(jīng)網(wǎng)絡(luò),。應(yīng)用場(chǎng)景越少,對(duì)應(yīng)需要的實(shí)現(xiàn)的算 法越少,,就越適用于專用芯片,,可通過(guò)精簡(jiǎn)處理器軟硬件模塊,使處理器計(jì)算效率,、能 效比更高,。
2.4. 車規(guī)級(jí)芯片條件苛刻
車規(guī)級(jí)芯片標(biāo)準(zhǔn)遠(yuǎn)高于消費(fèi)級(jí),認(rèn)證流程長(zhǎng),。1)工作環(huán)境更為惡劣:相比于消費(fèi) 芯片及一般工業(yè)芯片,,汽車芯片的工作環(huán)境溫度范圍寬(-40 至 155 攝氏度)、高振動(dòng),、 多粉塵,、多電磁干擾。2)可靠性安全性要求高:一般的汽車設(shè)計(jì)壽命都在 15 年或 20 萬(wàn) 公里左右,,遠(yuǎn)大于消費(fèi)電子產(chǎn)品壽命要求。在相同的可靠性要求下,,系統(tǒng)組成的部件和 環(huán)節(jié)越多,,對(duì)組成的部件的可靠性要求就越高。3)車規(guī)級(jí)芯片認(rèn)證流程長(zhǎng),。一款芯片一 般需要 2 年左右時(shí)間完成車規(guī)級(jí)認(rèn)證,,進(jìn)入車企供應(yīng)鏈后一般擁有 5-10 年的供貨周期,。
汽車標(biāo)準(zhǔn)需認(rèn)證可靠性標(biāo)準(zhǔn) AEC-Q 系列、質(zhì)量管理標(biāo)準(zhǔn) ISO/TS16949 其中之一,, 此外需要通過(guò)功能安全標(biāo)準(zhǔn) ISO 26262 ASIL B(D),。ISO 26262 在 2011 年 11 月 15 日正 式發(fā)布,主要包括四個(gè)等級(jí),,分別為 ASIL A/B/C/D,。ISO 26262 安全是汽車電子元件穩(wěn) 定性優(yōu)劣的評(píng)判依據(jù)之一,通過(guò)該等級(jí)代表其產(chǎn)品穩(wěn)定性合格,,耐用,,但不代表其算力、 能效比高,。此外,,還需要通過(guò)零失效的供應(yīng)鏈質(zhì)量管理標(biāo)準(zhǔn) TS16949/ISO 9000 國(guó)際認(rèn)證 體系下的汽車行業(yè)分支的標(biāo)準(zhǔn)認(rèn)證;另一個(gè)是 AEC-Q 認(rèn)證,,由克萊斯勒,、通用、福特制定的汽車電子元件安全性檢測(cè)標(biāo)準(zhǔn),。
3. MCU 引領(lǐng)汽車由機(jī)械化時(shí)代走向電氣化時(shí)代
3.1. MCU 承擔(dān)汽車執(zhí)行 ECU 的運(yùn)算大腦
汽車發(fā)展初期,,控制功能較少,一般新增一個(gè)功能便新增一個(gè) ECU(Electronic Control Unit,,即電子控制單元),,即為典型的分布式電子電氣架構(gòu)。因此,,一般汽車中 包括多個(gè) ECU,,每個(gè) ECU 管理不同的功能,而 MCU 芯片嵌入在 ECU 中作為運(yùn)算大 腦,。MCU 的工作過(guò)程:傳感器輸入信號(hào),,輸入處理器對(duì)信號(hào)進(jìn)行模數(shù)轉(zhuǎn)換、放大等處 理后,,傳遞給 MCU 進(jìn)行運(yùn)算處理,,然后輸出處理器對(duì)信號(hào)進(jìn)行功率放大、數(shù)模轉(zhuǎn)換等,, 使其驅(qū)動(dòng)如電池閥,、電動(dòng)機(jī)、開關(guān)等被控元件工作,。MCU 主要有 8 位,、16 位、32 位,, 位數(shù)越多越復(fù)雜,,處理能力越強(qiáng),,可實(shí)現(xiàn)的功能越多。
MCU 單車價(jià)值量提升的核心邏輯在于:1)芯片用量提升,,應(yīng)用領(lǐng)域由傳統(tǒng)底盤延伸至整車,。隨著汽車電子化發(fā)展,ECU 逐漸占領(lǐng)整個(gè)汽車,,從防抱死制動(dòng)系統(tǒng),、四輪驅(qū) 動(dòng)系統(tǒng)、電控自動(dòng)變速器,、主動(dòng)懸架系統(tǒng),,到現(xiàn)在逐漸延伸到了車身各類安全、網(wǎng)絡(luò),、 娛樂控制系統(tǒng)等領(lǐng)域,。2)芯片集成復(fù)雜化,單價(jià)提升,。以發(fā)動(dòng)機(jī)管理系統(tǒng) ECU(MCU 為其核心芯片)為例,,汽車電子發(fā)展的初期,ECU 最早僅應(yīng)用于發(fā)動(dòng)機(jī)的控制,,如汽車 發(fā)動(dòng)機(jī)的排氣管(氧傳感器),、氣缸(爆震傳感器)、水溫傳感器等核心部件才會(huì)放置傳 感器,,數(shù)量少,。之后隨著國(guó)三至國(guó)五標(biāo)準(zhǔn)的提升,在油耗控制,、信號(hào)輸出控制等方面需 要芯片處理的能力增強(qiáng),,推動(dòng) MCU 芯片集成度提升,產(chǎn)品升級(jí)帶來(lái)價(jià)值提升,。
3.2. 預(yù)計(jì) 2025 年我國(guó)汽車 MCU 市場(chǎng)達(dá) 32.9 億美元,,CAGR 7.7%
2025 年我國(guó)汽車 MCU 市場(chǎng)規(guī)模達(dá) 32.9 億美元,未來(lái) 6 年 CAGR 為 7.7%,。經(jīng)測(cè) 算,,2019 年我國(guó)汽車 MCU 市場(chǎng)規(guī)模為 21.1 億美元,同比-2.7%,,隨著汽車智能化加速,, 更多的功能將會(huì)被整車搭載,大量執(zhí)行元件需要被 MCU 所控制,,到 2025 年 MCU 市場(chǎng) 規(guī)模達(dá) 32.9 億美元,,CAGR 為 7.7%,到 2030 年將達(dá) 47.6 億美元,。
3.3. 汽車 MCU 行業(yè)加快整合集中度提升
全球 MCU 通用市場(chǎng)并購(gòu)加速,。我們重點(diǎn)參考 MCU 通用領(lǐng)域(汽車、工業(yè),、消費(fèi) 電子等)市場(chǎng),,MCU 廠商為爭(zhēng)奪市場(chǎng)份額,近年來(lái)發(fā)生了數(shù)起大規(guī)模并購(gòu),。NXP 在 2015 年以 118 億美元收購(gòu)飛思卡爾,,完成了在汽車電子領(lǐng)域的布局,排名也一舉從第六上升 至第一,;Cypress 在 2015 年以 40 億美元收購(gòu) spansion,;Microchip 在 2016 年完成對(duì) Atmel 的收購(gòu),成為全球第二大 MCU 廠商,。我們判斷,,汽車 MCU 市場(chǎng)也將隨通用市場(chǎng)的加 快整合,實(shí)現(xiàn)集中度的提升,。
歐美日前五大汽車 MCU 供應(yīng)商占據(jù)全球 82.7%市場(chǎng)份額,,頭部集中效應(yīng)顯著。根 據(jù) Stratety Analytics 分析數(shù)據(jù),,全球汽車 MCU 市場(chǎng)前 5 占 82.7%的市場(chǎng)份額,,前五大 MCU 供應(yīng)商分別為日本瑞薩電子,歐洲:NXP,、英飛凌,,美國(guó):德州儀器、微芯科技,。
全球前八大廠商也同樣占據(jù)我國(guó)汽車 MCU 93%的市場(chǎng)份額,。仍由歐美日傳統(tǒng)汽車電子廠商占據(jù)絕大部分市場(chǎng)份額,我們重點(diǎn)參考 IHS 數(shù)據(jù)分析,,目前中國(guó) MCU 市場(chǎng),, 前八大 MCU 廠商的市場(chǎng)占有率達(dá)到 93%。國(guó)產(chǎn)化率不足 5%,,替代空間大,。國(guó)內(nèi)企業(yè) 技術(shù)較為薄弱,企業(yè)規(guī)模與前八大廠商差距較大,,現(xiàn)階段主要為工業(yè)控制,、儀器儀表、 消費(fèi)電子,、物聯(lián)網(wǎng)等通用領(lǐng)域供貨,。隨著國(guó)內(nèi)企業(yè)技術(shù)逐漸成熟,國(guó)內(nèi)廠商憑借價(jià)格和 服務(wù)優(yōu)勢(shì),,正逐步搶奪低端 MCU 市場(chǎng),,進(jìn)口替代趨勢(shì)逐漸明顯,。但由于車規(guī)級(jí)標(biāo)準(zhǔn)較 高,技術(shù)和市場(chǎng)發(fā)展均晚于一般工業(yè)和消費(fèi)級(jí)芯片,。
4. 軟件定義汽車時(shí)代來(lái)臨,,域控制 AI 芯片是重要一環(huán)
4.1. AI 芯片是智能汽車時(shí)代實(shí)現(xiàn)域控制的核心
汽車由分布式架構(gòu)向域控制/中央集中式架構(gòu)方向發(fā)展。傳統(tǒng)分布式硬件架構(gòu)面臨 智能汽車時(shí)代多維感知需求和海量非結(jié)構(gòu)化數(shù)據(jù)處理的需求,,一般每新增一個(gè)應(yīng)用功能,, 便新增對(duì)應(yīng)的感知傳感器、決策,、執(zhí)行層,。隨著智能網(wǎng)聯(lián)汽車時(shí)代的到來(lái),以特斯拉為 代表的汽車電子電氣架構(gòu)改革先鋒率先采用中央集中式架構(gòu),,即用一個(gè)電腦控制整車,。全球范圍內(nèi)各大主機(jī)廠均已認(rèn)識(shí)到軟件定義汽車的大趨勢(shì),紛紛升級(jí)自身的電子電氣架 構(gòu),,雖不同主機(jī)廠采用幾個(gè)電腦控制整車的方案不同,,但架構(gòu)域控制/集中化方向相同。域控制器逐漸集成前期的傳感器處理器,、數(shù)據(jù)融合,、路徑規(guī)劃、決策等諸多運(yùn)算處理器 功能,,因此對(duì)域控制器芯片算力需求大幅提升,。
非結(jié)構(gòu)化數(shù)據(jù)導(dǎo)致傳統(tǒng) MCU 不能滿足需求,AI 作為協(xié)處理器逐漸成為智能時(shí)代 的核心,。隨著芯片需要處理傳感器傳來(lái)的大量汽車內(nèi)外部環(huán)境信息,,而且也要處理大量 圖片、視頻等非結(jié)構(gòu)化數(shù)據(jù),,面向控制指令運(yùn)算的 MCU 不能滿足需求,。AI 處理器作為 智能時(shí)代的協(xié)處理器,成為智能汽車時(shí)代的核心,。一般待處理數(shù)據(jù)信息會(huì)先傳遞給 CPU(等同于 MCU),,CPU 發(fā)現(xiàn)有大規(guī)模的非結(jié)構(gòu)化數(shù)據(jù),自身無(wú)法處理,,便將其傳輸給 AI 處理器運(yùn)算,,而 CPU 便暫停運(yùn)算,等待 AI 處理器運(yùn)算結(jié)束后,,再進(jìn)行下一步操作,, 所以 AI 處理器是人工智能時(shí)代的協(xié)處理器,是現(xiàn)階段智能汽車時(shí)代運(yùn)算的核心。
4.2. 預(yù)計(jì) 2025 年我國(guó)汽車 AI 芯片市場(chǎng)超 91 億美元,,CAGR46.2%
假設(shè):1)汽車市場(chǎng)容量預(yù)測(cè),。如前文 MCU 測(cè)算假設(shè)一致,我國(guó)汽車產(chǎn)量 2019-2025 年復(fù)合增速為 2%,。
2)各級(jí)別自動(dòng)駕駛滲透率預(yù)測(cè),。L3、L4 級(jí)分別于 2020 年,、2023 年規(guī)模量產(chǎn),每 年并以 3-4%滲透率提升,。根據(jù)工信部發(fā)布的《汽車中長(zhǎng)期發(fā)展規(guī)劃》指出,,我國(guó) 2020 年自動(dòng)駕駛滲透率達(dá) 50%,2025 年滲透率達(dá) 80%,。L3 級(jí)于 2020 年開始量產(chǎn)并規(guī)模投 放市場(chǎng),,滲透率快速提升,隨著 L4 級(jí)車于 2023 年開始量產(chǎn),,低級(jí)別滲透率陸續(xù)到達(dá)滲 透率峰值后又緩慢下降,。
3)各級(jí)別自動(dòng)駕駛 AI 芯片單車價(jià)值預(yù)測(cè)。2020 年 L1-L3 級(jí) AI 芯片單車價(jià)值分別 為 50 美元,、150 美元,、500 美元,隨著技術(shù)逐漸成熟,,2030 年下降到 41 美元,、111 美 元、315 美元,。我們預(yù)計(jì)到 2023 年 L4 級(jí)高級(jí)自動(dòng)駕駛出現(xiàn),,AI 芯片單車價(jià)值約為 1500 美元,到 2030 年下降到 931 美元,。
2025 年我國(guó) AI 芯片市場(chǎng)超 91 億美元,,未來(lái) 6 年復(fù)合增速達(dá) 46.4%。經(jīng)測(cè)算,,2020 年我國(guó)汽車 AI 芯片市場(chǎng)規(guī)模為 15 億美元,,同比增長(zhǎng) 59.4%,隨著汽車 EE 架構(gòu)加速升 級(jí),,域控制器/中央計(jì)算平臺(tái)被廣泛使用,,到 2025 年 AI 芯片市場(chǎng)規(guī)模達(dá) 91 億美元, CAGR 為 45.9%,,到 2030 年將達(dá) 177 億美元,,十年復(fù)合增速 28.1%。
4.3. 集成更多 AI 單元是智能芯片技術(shù)路徑發(fā)展的大趨勢(shì)
CPU,又稱中央處理器,,擅長(zhǎng)邏輯控制和通用類型數(shù)據(jù)運(yùn)算,,具有不可替代性。CPU 有很強(qiáng)的通用性,,可處理不同的數(shù)據(jù)類型,,主要負(fù)責(zé)順序控制、操作控制,、時(shí)間控制,、 數(shù)據(jù)加工等操作,因此在任何一個(gè)電腦或嵌入式的計(jì)算中都有 CPU 或其裁剪版本,。CPU 由控制器(Control),,寄存器(Cache、DRAM)和邏輯單元(ALU)構(gòu)成,,其中控制器 和寄存器占比較大,,而處理數(shù)據(jù)的邏輯單元占比較小,因此對(duì)于專用領(lǐng)域數(shù)據(jù)處理能力 較弱,。代表廠商即為 X86 處理器的英特爾和嵌入式處理器的 ARM,。
GPU,又稱圖形處理器,,俗稱顯卡,,擅長(zhǎng)大規(guī)模并行計(jì)算。GPU 擁有計(jì)算單元數(shù)量 眾多和超長(zhǎng)的流水線,,處理的數(shù)據(jù)類型通常為高度統(tǒng)一的,、相互無(wú)依賴,省去了大量 CPU 的不必要控制指令計(jì)算模塊,,并行計(jì)算能力較 CPU 強(qiáng),。隨著人工智能的發(fā)展,GPU 不 斷被應(yīng)用于數(shù)值模擬,、機(jī)器學(xué)習(xí),、視覺處理、語(yǔ)音識(shí)別等領(lǐng)域,,廠商代表即為英偉達(dá),。
FPGA 全稱是 Field Programmable Gate Array:又稱可編程邏輯門陣列,算力較 高,,適合小規(guī)模定制化開發(fā)測(cè)試,。用戶可通過(guò)燒入配置文件來(lái)定義其內(nèi)部結(jié)構(gòu)的連線, 從而達(dá)到定制電路的目的,。FPGA 的芯片量產(chǎn)成本較高,,能效比較差,,不如 ASIC 專用 芯片。適用于科研,、企業(yè)開發(fā)階段,,一旦方案確定,其成本優(yōu)勢(shì)就不再突出,。代表廠商:賽靈思,、阿爾特拉(被英特爾收購(gòu))、深鑒科技,。
ASIC 全稱是 Application-Specific Integrated Circuit:是一種為專門目的而設(shè)計(jì)的 集成電路,,具有算力最高,能效比優(yōu)等特點(diǎn),。ASIC 面向特定用戶的需求,,適合較為單 一的大規(guī)模應(yīng)用場(chǎng)景,運(yùn)行速度在同等條件下比 FPGA 快,。但在架構(gòu)層面對(duì)特定智能算再適用,,需要跟新?lián)Q代。面對(duì)現(xiàn)階段,,AI 算法日新月異,每年都有大量的算法被開發(fā)出 來(lái),,對(duì)于自動(dòng)駕駛領(lǐng)域適用性不強(qiáng),。所以現(xiàn)階段并沒有真正意義上的 ASIC 芯片,。
N-SOC,(即添加神經(jīng)網(wǎng)絡(luò)單元的系統(tǒng)級(jí)芯片)是指在芯片中集成更多的神經(jīng)網(wǎng)絡(luò) 單元,以實(shí)現(xiàn)快速的 CNN(卷積神經(jīng)網(wǎng)絡(luò))運(yùn)算。N-SOC 是現(xiàn)階段市場(chǎng)的新名詞,,主 要系隨著 AI 芯片的發(fā)展,,傳統(tǒng)定義方法并不完全適用,N-SOC 區(qū)別于 ASIC 的智能算 法被硬化,,但其并不是一顆完全通用芯片,,僅支持少量的算法,。典型的代表企業(yè):英特 爾旗下的 Mobileye,、華為(達(dá)芬奇架構(gòu) Ascend 系列)、寒武紀(jì)(MLU 系列),、百度(昆 侖云),、阿里平頭哥、Google(TPU)等,。
由通用向?qū)S门判蛞来危篊PU,、GPU,、FPGA,、ASIC,;數(shù)據(jù)處理成本經(jīng)濟(jì)性(由優(yōu) 至差):ASIC、FPGA,、GPU,、CPU。1)CPU 最通用,,算力差,能效比最差,,但除了運(yùn) 算,還包括控制指令,,不可被替代,;2)GPU 為較為通用的芯片,,算力高,架構(gòu)較為開 放,,可允許主機(jī)廠基于底層硬件架構(gòu)開發(fā)自己的專門算法,,但能效比較差,;3)FPGA,, 算力一般,,可根據(jù)客戶需求用配置文件更改芯片結(jié)構(gòu)的連線,,實(shí)現(xiàn)定制電路,適用于實(shí) 驗(yàn)室科研,、前期開發(fā)等小批量應(yīng)用,;4)ASIC 為專用芯片,,算力高,、能效比優(yōu),節(jié)約不 必要開發(fā)資源,,規(guī)模量產(chǎn)成本最低,,但支持算法不夠靈活,。
AI 芯片通過(guò)添加神經(jīng)網(wǎng)絡(luò)單元實(shí)現(xiàn) AI 運(yùn)算的更高效。目前市場(chǎng)對(duì)未來(lái)汽車 AI 芯 片采用通用 GPU,、FPGA、ASIC 芯片方案仍有較大爭(zhēng)議,我們認(rèn)為汽車數(shù)據(jù)處理芯片不 斷異構(gòu)化,,通過(guò)不斷添加神經(jīng)網(wǎng)絡(luò)單元實(shí)現(xiàn) AI 運(yùn)算是未來(lái)發(fā)展的主要方向,。除了華為、 地平線,、寒武紀(jì)等 AI 芯片不斷增加神經(jīng)網(wǎng)絡(luò)單元外,而作為通用 GPU 的代表供應(yīng)商英 偉達(dá)的自動(dòng)駕駛系列芯片,,也通過(guò)添加神經(jīng)網(wǎng)絡(luò)單元,,以實(shí)現(xiàn)對(duì) AI 處理越來(lái)越高效,。但總體而言 GPU 仍功耗較高,,豐富的通用模塊可實(shí)現(xiàn)對(duì)各種場(chǎng)景的適用性,,但也帶來(lái) 了成本過(guò)高,功耗過(guò)高的問(wèn)題,。而新出現(xiàn)的 N-SOC 雖不是 ASIC 固定算法,,具有成本/ 功耗較低等優(yōu)點(diǎn),,但其針對(duì)各種場(chǎng)景的適應(yīng)性仍較弱。在汽車領(lǐng)域,,未來(lái)兩者未來(lái)性能,、 成本等方面會(huì)有相互靠近的趨勢(shì)。
5. 域控制器 AI 芯片呈現(xiàn)三強(qiáng)多極競(jìng)爭(zhēng)格局
結(jié)論:特斯拉 FSD 芯片自研自用,,引領(lǐng)產(chǎn)業(yè)發(fā)展,,屬于獨(dú)立一級(jí);全球 GPU 領(lǐng)域 AI 龍頭英偉達(dá)和背靠英特爾的汽車 AI 芯片龍頭 Mobileye 屬于第一陣列,;華為技術(shù)強(qiáng) 勁自建生態(tài)體系屬于 1.5 陣列,,有望快速突圍進(jìn)入第一陣列;國(guó)內(nèi)智能駕駛 AI 芯片新 銳地平線,、云邊端全領(lǐng)域覆蓋 AI 新興寒武紀(jì)等處于第二陣列,;傳統(tǒng)汽車電子廠商及其 他潛在進(jìn)入者處于第三陣列
特斯拉自研 FSD 方案屬于另一極。主要優(yōu)勢(shì):由于其自研自用,,根據(jù)需求研發(fā)專 用芯片,,減少不必要的軟硬件模塊,1)縮短研發(fā)周期,,減少研發(fā)設(shè)計(jì)工作量,;2)提升 能效比;3)用戶數(shù)據(jù)驅(qū)動(dòng)研發(fā)優(yōu)化,。主要劣勢(shì):1)生態(tài)較為封閉,,僅內(nèi)部開發(fā)和使用, 無(wú)法建立完善的生態(tài)體系,。2)若使用量有限,,芯片研發(fā)需要投入大量資金,軟硬件開發(fā) 的成本難以通過(guò)大規(guī)模使用均攤成本,。
Mobileye 與英偉達(dá)屬于第 1 陣列,。在 L3 級(jí)到來(lái)以前,兩公司產(chǎn)品幾乎不會(huì)處于正 面競(jìng)爭(zhēng),,隨著自動(dòng)駕駛進(jìn)程加速發(fā)展,,競(jìng)爭(zhēng)會(huì)逐漸加劇。短期來(lái)看,,Mobileye 面向 L3 級(jí)以下市場(chǎng),產(chǎn)品更加成熟,,會(huì)更占優(yōu)勢(shì),。中長(zhǎng)期來(lái)看,英偉達(dá)面向 L3 級(jí)以上預(yù)研市 場(chǎng)在 AI 領(lǐng)域?qū)嵙ι詈?,后發(fā)有力,,優(yōu)勢(shì)會(huì)更加突出,。
NIVIDA 屬于第 1 陣列,作為通用 AI 芯片龍頭,,占據(jù) L3 級(jí)及以上市場(chǎng),,對(duì)外提 供芯片級(jí)產(chǎn)品,而非芯片+算法的解決方案,,是合資品牌的優(yōu)選,。主要優(yōu)勢(shì):1)中立第 三方,最豐富的生態(tài)體系,。定位 Tier 2 芯片供應(yīng)商,,提供芯片或開發(fā)平臺(tái),具備最完善的軟件工具鏈和應(yīng)用生態(tài),;2)算力高(但利用率仍有待提升),,Xaier 芯片的 30TOPS 高 于 Eye Q4 的 2.5TOPS,Orin 芯片的 200TOPS 高于 Eye Q5 的 24TOPS,;3)支持各類傳 感器數(shù)據(jù)融合,,可提供攝像頭+雷達(dá)等各類傳感器數(shù)據(jù)融合處理;4)提供云服務(wù),,有望 獲取數(shù)據(jù)實(shí)現(xiàn)優(yōu)化,。主要劣勢(shì):主要系 GPU 通用芯片,有大量的非必要軟硬件模塊,, 1)成本價(jià)格較貴,,浪費(fèi)資源,后續(xù)有望規(guī)模量產(chǎn)后實(shí)現(xiàn)快速下降,;2)能效比差,,后續(xù) 產(chǎn)品開發(fā)加入更多的 DLA 深度學(xué)習(xí)加速器模塊,能效比有望改善,。
Mobileye 屬于第 1 陣列,,背靠英特爾,占據(jù) L2 級(jí)及以下市場(chǎng),,芯片+算法綁定的 一體式解決方案,。主要優(yōu)勢(shì):1)經(jīng)驗(yàn)豐富&質(zhì)量可靠,產(chǎn)品已經(jīng)有眾多量產(chǎn)車搭載,,質(zhì) 量和適配過(guò)關(guān),;2)客戶資源最豐富,國(guó)內(nèi)外絕大多數(shù)主機(jī)廠和 Tier1 級(jí)供應(yīng)商均為其客 戶,;3)價(jià)格較為合理,。主要劣勢(shì):1)算力提升明顯低于其他廠商,最新 EyeQ5 算力峰 值僅 24TOPS,而市場(chǎng)認(rèn)為 L3 級(jí)算力需求 30TOPS 以上,,后期芯片僅靠提升 VMP 等手 段,,算力提升或難以為繼,又或者因?yàn)楦叨榷ㄖ苹槍?duì)視覺領(lǐng)域,,減少不必要的軟硬件 資源,,算力不高但性能仍滿足需求;2)黑盒子模式限制用戶創(chuàng)新,,算法和芯片捆綁銷 售,,或與廠商規(guī)模較小,為客戶提供定制化服務(wù),,在主機(jī)廠軟件開發(fā)能力較差的初期階 段受廣泛歡迎,,但隨著開發(fā)能力提升,一體銷售的靈活度較差,,客戶難以做出差異性產(chǎn) 品,。根據(jù)規(guī)劃 Eye Q5 或?qū)㈤_放融合算法,但感知算法并未提及,。
華為屬于第 1.5 陣列,,憑借強(qiáng)勁的技術(shù)實(shí)力有望快速進(jìn)入第一陣列,主要針對(duì) L2+ 及以上市場(chǎng),,模式與 NVIDIA 類似,,現(xiàn)階段對(duì)外提供平臺(tái)類產(chǎn)品(開發(fā)平臺(tái)),而非解 決方案,,是國(guó)產(chǎn)品牌的優(yōu)選,。主要優(yōu)勢(shì):1)算力高,能效優(yōu),,計(jì)算平臺(tái)可提供 64~350TOPS,, 端到端 1TOPS/W(芯片級(jí) 2TOPS/W);2)支持各種傳感器融合處理,;3)華為整體技術(shù) 雄厚,,生態(tài)體系有望迅速完善,依托華為從底層芯片,、操作系統(tǒng),、應(yīng)用算法、5G,、云計(jì) 算服務(wù)等迅速建立豐富生態(tài)體系,;4)提供云服務(wù),有望獲取數(shù)據(jù)實(shí)現(xiàn)優(yōu)化,。主要劣勢(shì):1)無(wú)量產(chǎn)車,,缺乏相關(guān)的經(jīng)驗(yàn)積累,,暫時(shí)無(wú)數(shù)據(jù)優(yōu)化軟件算法,搭載量產(chǎn)車或到 2021 年底左右,;2)現(xiàn)階段生態(tài)體系仍弱于英偉達(dá),所以目前華為廣交朋友圈,,依靠眾多領(lǐng)域 的優(yōu)勢(shì)構(gòu)建龐大生態(tài)體系,;3)客戶對(duì)其“不造車”尚持懷疑,或影響合作,。
地平線屬于強(qiáng)勢(shì)第 2 陣列,,模式與 Mobileye 類似,對(duì)外主要提供解決方案類產(chǎn)品 (芯片+算法),,未捆綁銷售,,AI 芯片于 2020 年已搭載在長(zhǎng)安 UNI-T 座艙域。自動(dòng)駕 駛域芯片尚未搭載量產(chǎn)車,,現(xiàn)階段主要針對(duì) L2 級(jí)及以下市場(chǎng),,對(duì)外提供芯片+算法方 案。主要優(yōu)勢(shì):1)作為中立第三方,,芯片和算法可分開銷售或一體式解決方案,,受客戶 信任;2)國(guó)產(chǎn)芯片,,國(guó)內(nèi)優(yōu)選,。主要劣勢(shì):1)現(xiàn)階段算力較低,無(wú)豐富生態(tài),,創(chuàng)企等,;2)尚未通過(guò)功能安全認(rèn)證,無(wú)自動(dòng)駕駛芯片量產(chǎn)車,。
寒武紀(jì)屬于第 2 陣列,,或從車路協(xié)同、云服務(wù)(數(shù)據(jù)中心)等領(lǐng)域?qū)崿F(xiàn)快速切入,。主要優(yōu)勢(shì):1)云邊端三類產(chǎn)品可從各種商業(yè)模式供應(yīng)給智能車產(chǎn)業(yè)領(lǐng)域,,云端產(chǎn)品可 供應(yīng)車企/Tier 1 數(shù)據(jù)中心或提供給云服務(wù)供應(yīng)商;邊緣端產(chǎn)品供應(yīng)給政府類客戶用于車 路協(xié)同設(shè)備使用,;邊緣/終端產(chǎn)品供應(yīng)給主機(jī)廠等,。2)國(guó)產(chǎn)芯片,國(guó)內(nèi)優(yōu)選,、中立第三方,。主要劣勢(shì):1)與車企合作較少,無(wú)豐富生態(tài),,創(chuàng)企等,;2)尚未通過(guò)功能安全認(rèn)證,。
5.1. 特斯拉:自研 FSD 芯片,引領(lǐng)產(chǎn)業(yè)發(fā)展
總結(jié):特斯拉自研 FSD 方案屬于另一極,。主要優(yōu)勢(shì):由于其自研自用,,根據(jù)需求 研發(fā)專用芯片,減少不必要的軟硬件模塊,。1)縮短研發(fā)周期,,減少研發(fā)設(shè)計(jì)工作量;2) 提升能效比,;3)用戶數(shù)據(jù)驅(qū)動(dòng)研發(fā)優(yōu)化,。主要劣勢(shì):1)生態(tài)較為封閉,僅內(nèi)部開發(fā)和 使用,,無(wú)法建立完善的生態(tài)體系,。2)若使用量有限,芯片研發(fā)需要投入大量資金,,軟硬 件開發(fā)的成本難以通過(guò)小規(guī)模使用均攤成本,。
Autopilot 1.0 系統(tǒng)因 Mobileye EyeQ3 算力低、算法和芯片捆綁銷售限制創(chuàng)新被棄 用,。2014 年特斯拉發(fā)布 Autopilot 1.0,,視覺芯片采用 Mobileye EyeQ3,數(shù)據(jù)融合芯片采 用英偉達(dá) Tegra 3,。搭載 1 個(gè)前置攝像頭,、1 個(gè)后置倒車攝像頭(不參與輔助駕駛)、1 個(gè) 前置雷達(dá),、12 個(gè)超聲波傳感器,。特斯拉棄用主要原因在于:EyeQ3 算力僅 0.256TOPS, 而且視覺感知算法和芯片捆綁銷售,,影響產(chǎn)品創(chuàng)新,。
Autopilot 2.0 系統(tǒng)因 NVIDIA PX2 方案能效比差,成本較高被棄用,。2.0 系統(tǒng)較上 一代提升 40 倍性能,,系統(tǒng)由 1.0 系統(tǒng)的雷達(dá)引導(dǎo)為主,轉(zhuǎn)變?yōu)橐詳z像頭為主,,雷達(dá)作為 輔助,。硬件方案采用 NVIDIA 的 1 顆 Tegra Parker 芯片和 1 顆 Pascal 架構(gòu)芯片方案;支 持 8 個(gè)攝像頭,、12 個(gè)超聲波雷達(dá)和 1 個(gè)前置毫米波雷達(dá),。2.5 系統(tǒng)仍是 NIVIDIA 方案的 延續(xù)。特斯拉棄用 NVIDIA 方案主要原因在于:NVIDIA PX2 方案 GPU 芯片仍有較多 的軟硬件資源浪費(fèi),,能效比(算力/功耗)較差,,成本較高,。
特斯拉 Autopilot 3.0 系統(tǒng)自研 FSD+算法。3.0 系統(tǒng)采用了自研的 FSD 芯片方案,, 2 顆 FSD 芯片實(shí)現(xiàn)冗余設(shè)計(jì),,共 2*72TOPS/72W,針對(duì)自身應(yīng)用算法和場(chǎng)景專門設(shè)計(jì) FSD,,可減少不必要的軟硬件模塊,,實(shí)現(xiàn)資源的最大化利用。Autopilot 3.0 實(shí)際應(yīng)用性能 相比 2.5 版本提升 21 倍,,功耗僅高 25%,其成本卻只有 2.5 版本的 80%,。兩顆芯片將運(yùn) 算結(jié)果互相比對(duì),,若結(jié)果正確則執(zhí)行操作,若錯(cuò)誤則返回重算,,而且若某顆芯片出現(xiàn)故 障,,自動(dòng)駕駛系統(tǒng)仍不受影響。
FSD 芯片是一顆 CPU+GPU+ISP+2*NPU 的異構(gòu)芯片,。芯片異構(gòu)化是總體發(fā)展方 向,,讓專用處理單元運(yùn)算對(duì)應(yīng)的操作。1)CPU 是 1 個(gè) 12 核心 ARM A72 架構(gòu)的 64 位處 理器,,運(yùn)行頻率為 2.2GHz,;2)GPU 能夠提供 0.6TFLOPS 計(jì)算能力,運(yùn)行頻率為 1GHz,;3)2 顆 NPU(神經(jīng)網(wǎng)絡(luò)單元)運(yùn)行在 2.2GHz 頻率下能提供 2*36TOPS 的處理能力,。為 了提升神經(jīng)網(wǎng)絡(luò)處理器的內(nèi)存存取速度以提升計(jì)算能力,每顆 FSD 芯片內(nèi)部還集成了 32MB 高速緩存
FSD 芯片針對(duì)自身需求專門開發(fā),,是特斯拉芯片性能高和功耗優(yōu)的重大法寶,。發(fā)布 Autopilot 3.0 時(shí),特斯拉宣稱 FSD 芯片算力為 72TOPS,,系統(tǒng)整體算力 2*72TOPS,,而 NVIDIA Xavier 芯片僅為 21TOPS。盡管之后 NVIDIA 公布 Xavier 理論計(jì)算能力為 30TOPS,,但依然不及 FSD芯片,。而NVIDIA DRIVE AGX Pegasus計(jì)算平臺(tái),基于2*Xavier 和 2*TensorCore GPU,,算力達(dá)到 320TOPS,,功耗為 320W,高于 Autopilot 3.0 系統(tǒng)的 72W,。主要系 FSD 芯片作為特斯拉專用芯片,,較 GPU 的通用芯片可減少不必要的軟硬 件模塊,,實(shí)現(xiàn)資源的最大化利用。
5.2. NVIDIA:全球通用 AI 芯片龍頭,,構(gòu)建生態(tài)王國(guó)(略)
結(jié)論:NIVIDA 屬于第 1 陣列,,作為通用 AI 芯片龍頭,占據(jù) L3 級(jí)及以上市場(chǎng),,對(duì) 外提供芯片級(jí)產(chǎn)品,,而非芯片+算法的解決方案,是合資品牌的優(yōu)選,。主要優(yōu)勢(shì):1)中 立第三方,,最豐富的生態(tài)體系。定位 Tier 2 芯片供應(yīng)商,,提供芯片或開發(fā)平臺(tái),,具備最 完善的軟件工具鏈和應(yīng)用生態(tài);2)算力高(但利用率仍有待提升),,Xaier 芯片的 30TOPS 高于 Eye Q4 的 2.5TOPS,,Orin 芯片的 200TOPS 高于 Eye Q5 的 24TOPS;3)支持各類 傳感器數(shù)據(jù)融合,,可提供攝像頭+雷達(dá)等各類傳感器數(shù)據(jù)融合處理,;4)提供云服務(wù),有 望獲取數(shù)據(jù)實(shí)現(xiàn)優(yōu)化,。主要劣勢(shì):主要系 GPU 通用芯片,,有大量的非必要軟硬件模塊, 1)成本價(jià)格較貴,,浪費(fèi)資源,,后續(xù)有望規(guī)模量產(chǎn)后實(shí)現(xiàn)快速下降;2)能效比差,,后續(xù) 產(chǎn)品開發(fā)加入更多的 DLA 深度學(xué)習(xí)加速器模塊,,能效比有望改善。
5.3. Mobileye:背靠英特爾,,全球自動(dòng)駕駛 AI 芯片龍頭(略)
結(jié)論:Mobileye 屬于第 1 陣列,,背靠英特爾,占據(jù) L2 級(jí)及以下市場(chǎng),,芯片+算法 綁定的一體式解決方案,。主要優(yōu)勢(shì):1)經(jīng)驗(yàn)豐富&質(zhì)量可靠,產(chǎn)品已經(jīng)有眾多量產(chǎn)車搭 載,,質(zhì)量和適配過(guò)關(guān),;2)客戶資源最豐富,國(guó)內(nèi)外絕大多數(shù)主機(jī)廠和 Tier1 級(jí)供應(yīng)商均 為其客戶,;3)價(jià)格較為合理,。主要劣勢(shì):1)算力提升明顯低于其他廠商,,最新 EyeQ5 算力峰值僅 24TOPS,而市場(chǎng)認(rèn)為 L3 級(jí)算力需求 30TOPS 以上,,后期芯片僅靠提升 VMP 等手段,,算力提升或難以為繼,又或者因?yàn)楦叨榷ㄖ苹槍?duì)視覺領(lǐng)域,,減少不必要的軟 硬件資源,,算力不高但性能仍滿足需求;2)黑盒子模式限制用戶創(chuàng)新,,算法和芯片捆綁 銷售,,或與廠商規(guī)模較小,為客戶提供定制化服務(wù),,在主機(jī)廠軟件開發(fā)能力較差的初期 階段受廣泛歡迎,,但隨著開發(fā)能力提升,一體銷售的靈活度較差,,客戶難以做出差異性 產(chǎn)品。根據(jù)規(guī)劃 Eye Q5 或?qū)㈤_放融合算法,,但感知算法并未提及,。
5.4. 華為:依托芯片,欲打造最強(qiáng)生態(tài)體系
總結(jié):華為屬于第 1.5 陣列,,憑借強(qiáng)勁的技術(shù)實(shí)力有望快速進(jìn)入第一陣列,,主要針 對(duì) L2+及以上市場(chǎng),模式與 NVIDIA 類似,,現(xiàn)階段對(duì)外提供平臺(tái)類產(chǎn)品(開發(fā)平臺(tái)),, 而非解決方案,是國(guó)產(chǎn)品牌的優(yōu)選,。主要優(yōu)勢(shì):1)算力高,,能效優(yōu),計(jì)算平臺(tái)可提供 64~350TOPS,,端到端 1TOPS/W(芯片級(jí) 2TOPS/W),;2)支持各種傳感器融合處理;3) 華為整體技術(shù)雄厚,,生態(tài)體系有望迅速完善,;依托華為從底層芯片、操作系統(tǒng),、應(yīng)用算 法,、5G、云計(jì)算服務(wù)等迅速建立豐富生態(tài)體系,;4)提供云服務(wù),,有望獲取數(shù)據(jù)實(shí)現(xiàn)優(yōu) 化,。主要劣勢(shì):1)無(wú)量產(chǎn)車,缺乏相關(guān)的經(jīng)驗(yàn)積累,,暫時(shí)無(wú)數(shù)據(jù)優(yōu)化軟件算法,,搭載量 產(chǎn)車或到 2021 年底左右;2)現(xiàn)階段生態(tài)體系仍弱于英偉達(dá),,所以目前華為廣交朋友圈,, 依靠眾多領(lǐng)域的優(yōu)勢(shì)構(gòu)建龐大生態(tài)體系;3)客戶對(duì)其“不造車”尚持懷疑,,或影響合作,。
華為芯片主要有五大系列,昇騰芯片是車端 AI 計(jì)算核心,。1)麒麟芯片是手機(jī)等移 動(dòng)終端設(shè)備芯片,,主要包括應(yīng)用于高端領(lǐng)域的 9 系列,包括麒麟 990,、麒麟 980,、麒麟 970 等。除此之外,,麒麟還擁有 6 系,,7 系以及 8 系等面向中低端系列的芯片;2)鯤鵬 芯片主要面向服務(wù)器領(lǐng)域,,鯤鵬 920 芯片完全由華為自主研發(fā),,是全球第一款 7nm 的數(shù) 據(jù)中心 ARM 處理器,主要適用于華為的泰山服務(wù)器,;3)昇騰芯片是 AI 領(lǐng)域的處理器,, 昇騰芯片分為云端和邊緣端兩個(gè)系列,云端(數(shù)據(jù)中心等大算力需求)為昇騰 910,,邊 緣端(設(shè)備端等)為昇騰 310,,現(xiàn)階段運(yùn)用車端的主要是昇騰 310;4)巴龍芯片是基帶 (通信)芯片,,如支持 5G 雙模的巴龍 5000,,主要應(yīng)用在麒麟 980 和麒麟 990 上,其中 麒麟 990 還推出了集成巴龍 5000 基帶芯片的版本,;5)凌霄芯片是路由器芯片,,其中 Hi5651 芯片是業(yè)界首款 4 核 1.4GHz 家庭路由處理芯片。
基于昇騰 310 AI 芯片的 MDC 計(jì)算平臺(tái)是華為車端生態(tài)的堅(jiān)實(shí)根基,。在 2018 年推 出 MDC 計(jì)算平臺(tái)以及高階自動(dòng)駕駛?cè)珬=鉀Q方案,,包括分別對(duì)應(yīng)于 L3、L4 級(jí)自動(dòng)駕 駛的 MDC 300 和 MDC 600 平臺(tái)。MDC 集成了華為自研的 Host CPU 芯片,、AI 芯片,、 ISP 芯片與 SSD 控制芯片,并通過(guò)底層的軟硬件一體化調(diào)優(yōu),,在時(shí)間同步,、傳感器數(shù)據(jù) 精確處理、多節(jié)點(diǎn)實(shí)時(shí)通信,、最小化底噪,、低功耗管理、快速安全啟動(dòng)等方面業(yè)界領(lǐng)先,。MDC 的核心是昇騰 310 芯片,,主要用于 AI 計(jì)算。昇騰 310 是一顆 N-SOC 芯片,,采用 自研達(dá)芬奇架構(gòu),,算力功耗 16TOPS/8W,12nm 工藝,,其主要應(yīng)用于整個(gè)邊緣端市場(chǎng),, 2019 年底已量產(chǎn)可提供給工業(yè)領(lǐng)域客戶。
MDC 300 計(jì)算平臺(tái)支持 L3 級(jí)自動(dòng)駕駛,。MDC 300 由華為昇騰 310 芯片,、華為鯤 鵬 CPU 芯片和英飛凌的 TC397 三部分構(gòu)成,算力為 64TOPS,,支持 L3 級(jí)自動(dòng)駕駛需 求,可接入 11 個(gè)攝像頭,、6 個(gè)毫米波雷達(dá),、12 個(gè)超聲波雷達(dá)、6 個(gè)激光雷達(dá),。
MDC600 計(jì)算平臺(tái)支持 L4 及以上自動(dòng)駕駛,。MDC 600 包括鯤鵬 CPU+8 塊昇騰 310+ISP,支持 L4,,算力為 352TOPS,,支持 L4 及以上自動(dòng)駕駛,可接入 16 個(gè)攝像頭,、 16 個(gè)超聲波雷達(dá),、8 個(gè)激光雷達(dá)、6 個(gè)毫米波雷達(dá),。
MDC 是一套開放的車規(guī)級(jí)平臺(tái),,優(yōu)勢(shì)突出。1)高能效:整套計(jì)算平臺(tái)可實(shí)現(xiàn)端到 端 1TOPS/W 能效(芯片級(jí)高達(dá) 2TOPS/W 能效)。2)開放:MDC 具備組件服務(wù)化,、接 口標(biāo)準(zhǔn)化,、開發(fā)工具化的特性,基于此平臺(tái)可快速開發(fā),、調(diào)測(cè),、運(yùn)行自動(dòng)駕駛算法與功 能。針對(duì)不同級(jí)別的自動(dòng)駕駛算力需求,,MDC 可提供一套軟件架構(gòu),,不同硬件配置, 內(nèi)部支持 ROS 與 Adaptive AutoSAR 軟件架構(gòu),,具備較好的跨域通信能力,。3)高安全:華為的自動(dòng)駕駛?cè)珬=鉀Q方案、MDC 智能駕駛硬件平臺(tái),、車載操作系統(tǒng)鴻蒙內(nèi)核近期 均已通過(guò) ASIL-D 功能安全認(rèn)證,。
在商業(yè)合作模式方面,華為不提供芯片級(jí)別的解決方案,,只提供 MDC 系統(tǒng)級(jí)產(chǎn)品,。已合作客戶包括奧迪,一汽,、沃爾沃,、東風(fēng)、蘇州金龍,、山東浩睿智能,、新石器等。
車企面對(duì)自動(dòng)駕駛的快速開發(fā)和功能迭代,,主要面臨幾大挑戰(zhàn):1)處理海量數(shù)據(jù),, 成本高。一輛測(cè)試車 1 小時(shí)產(chǎn)生 8TB 數(shù)據(jù),,一天按 8 小時(shí),,一個(gè)月按 22 天計(jì)算,單車 將產(chǎn)生約 1.3PB /月的數(shù)據(jù),,而有效數(shù)據(jù)僅為 0.05%,,同時(shí)還有 80 萬(wàn)張/車/天圖片待人工 標(biāo)識(shí)。2)訓(xùn)練及仿真需要優(yōu)異 AI 算法和強(qiáng)大算力,。從訓(xùn)練和仿真來(lái)看,,單車預(yù)計(jì)需累 積里程 100+億公里,300GPU/2 天模型訓(xùn)練,,仿真測(cè)試則每天需處理 100 萬(wàn)公里,。3)仿 真是自動(dòng)駕駛持續(xù)提升安全的關(guān)鍵。仿真不可代替實(shí)車,但是前期開發(fā)實(shí)驗(yàn)過(guò)程仿真可 快速實(shí)現(xiàn)和減少大量試錯(cuò)成本,,不僅需要大量場(chǎng)景支持在線仿真,,同時(shí)也需要有以實(shí)車 為主的決策規(guī)劃仿真系統(tǒng)。4)工具分散不能統(tǒng)一管理?,F(xiàn)有工具多為煙囪式孤島,,分 散,不利于大數(shù)據(jù)的統(tǒng)一,、AI 能力的統(tǒng)一構(gòu)建,,及高效運(yùn)營(yíng)管理。
華為“八爪魚”自動(dòng)駕駛云服務(wù)是基于昇騰 910AI 芯片的數(shù)據(jù)中心云服務(wù),?!鞍俗?魚”自動(dòng)駕駛云服務(wù)覆蓋自動(dòng)駕駛數(shù)據(jù)、模型,、訓(xùn)練,、仿真、標(biāo)注等全生命周期業(yè)務(wù),, 向車企及開發(fā)者,,提供了包括數(shù)據(jù)服務(wù)、訓(xùn)練服務(wù),、仿真服務(wù)在內(nèi)的 3 大服務(wù),。1)數(shù)據(jù) 服務(wù):處理車載硬件平臺(tái)上輸出的傳感器數(shù)據(jù),回放雷達(dá),、攝像頭等不同格式的數(shù)據(jù),;支持 PB 級(jí)海量存儲(chǔ)、交互式大數(shù)據(jù)查詢和海量數(shù)據(jù)治理,。2)訓(xùn)練服務(wù):管理和訓(xùn)練自 動(dòng)駕駛模型,,不斷在新的數(shù)據(jù)集和測(cè)試集上提升模型的準(zhǔn)確度,持續(xù)提升自動(dòng)駕駛安全 系數(shù),。平臺(tái)提供軟硬件加速,,能大幅縮短訓(xùn)練時(shí)間,,提升訓(xùn)練效率,。3)仿真服務(wù):提供 仿真、場(chǎng)景庫(kù)管理,、場(chǎng)景片段,、評(píng)測(cè)系統(tǒng)等應(yīng)用工具,確保自動(dòng)駕駛模型合規(guī),、安全,、 可度量、質(zhì)量達(dá)標(biāo),快速集成到版本中,。
現(xiàn)階段自動(dòng)駕駛云服務(wù)供應(yīng)商主要為華為,、英偉達(dá)兩家巨頭。目前數(shù)據(jù)中心云端芯 片供應(yīng)商主要包括華為,、英偉達(dá),、寒武紀(jì)等,而 google,、百度等均為自研內(nèi)供,。其他企 業(yè)需要數(shù)據(jù)中心云服務(wù)可通過(guò)直接外購(gòu)云計(jì)算服務(wù)或者自建數(shù)據(jù)中心兩種放式。
5.5. 地平線:對(duì)標(biāo) Mobileye,,AI 芯片率先搭載 UNI-T 座艙域(略)
結(jié)論:地平線屬于強(qiáng)勢(shì)第 2 陣列,,模式與 Mobileye 類似,對(duì)外主要提供解決方案 類產(chǎn)品(芯片+算法),,未捆綁銷售,,AI 芯片于 2020 年已搭載在長(zhǎng)安 UNI-T 座艙域。自 動(dòng)駕駛域芯片尚未搭載量產(chǎn)車,,現(xiàn)階段主要針對(duì) L2 級(jí)及以下市場(chǎng),,對(duì)外提供芯片+算法 方案。主要優(yōu)勢(shì):1)作為中立第三方,,芯片和算法可分開銷售或一體式解決方案,,受客 戶信任;2)國(guó)產(chǎn)芯片,,國(guó)內(nèi)優(yōu)選,。主要劣勢(shì):1)現(xiàn)階段算力較低,無(wú)豐富生態(tài),,創(chuàng)企 等,;2)尚未通過(guò)功能安全認(rèn)證,無(wú)自動(dòng)駕駛芯片量產(chǎn)車,。
地平線成立于 2015 年 6 月,,創(chuàng)始人系百度深度學(xué)習(xí)研究院院長(zhǎng)余凱博士,學(xué)術(shù)背 景濃厚,,2017 年被英特爾領(lǐng)投,。2017 年 12 月發(fā)布中國(guó)首款邊緣端人工智能視覺芯片征 程(Journey)系列和旭日(Sunrise)系列。征程系列主要用于智能駕駛領(lǐng)域,,旭日系列 主要用于物聯(lián)網(wǎng)領(lǐng)域,。合作伙伴包括奧迪、博世,、長(zhǎng)安,、比亞迪,、上汽 、廣汽等國(guó)內(nèi)外 的頂級(jí) Tier1,,OEM 廠商,。
5.6. 寒武紀(jì):源于中科院,面向云邊端全領(lǐng)域(略)
結(jié)論:寒武紀(jì)屬于第 2 陣列,,或從車路協(xié)同,、云服務(wù)(數(shù)據(jù)中心)等領(lǐng)域?qū)崿F(xiàn)快速 切入。主要優(yōu)勢(shì):1)云邊端三類產(chǎn)品可從各種商業(yè)模式供應(yīng)給智能車產(chǎn)業(yè)領(lǐng)域,,云端 產(chǎn)品可供應(yīng)車企/Tier 1 數(shù)據(jù)中心或提供給云服務(wù)供應(yīng)商,;邊緣端產(chǎn)品供應(yīng)給政府類客戶 用于車路協(xié)同設(shè)備使用;邊緣/終端產(chǎn)品供應(yīng)給主機(jī)廠等,。2)國(guó)產(chǎn)芯片,,國(guó)內(nèi)優(yōu)選、中 立第三方,。主要劣勢(shì):1)與車企合作較少,,無(wú)豐富生態(tài),創(chuàng)企等,;2)尚未通過(guò)功能安 全認(rèn)證,。
寒武紀(jì)是智能芯片領(lǐng)域的先行者。寒武紀(jì)創(chuàng)始團(tuán)隊(duì)源于中科院,,并長(zhǎng)期致力于在人 工智能與處理器架構(gòu)交叉研究,,DianNao、DaDianNao,、PuDianNao,、ShiDianNao、 DianNaoYu 等系列深度學(xué)習(xí)處理器架構(gòu)或指令集成果在國(guó)際學(xué)術(shù)界引起的轟動(dòng)性效應(yīng),。隨著研究成果趨于成熟,,2016 年寒武紀(jì)公司成立,并著手將其芯片和指令集業(yè)務(wù)向商用 方向轉(zhuǎn)化,,截止目前,,寒武紀(jì)是國(guó)際上少數(shù)幾家全面系統(tǒng)掌握了智能芯片及其基礎(chǔ)系統(tǒng) 軟件研發(fā)和產(chǎn)品化核心技術(shù)的企業(yè)之一。
寒武紀(jì)產(chǎn)品覆蓋云端,、邊緣端,、終端。寒武紀(jì)已面向云端,、邊緣端,、終端推出了三 個(gè)系列不同品類的通用型智能芯片與加速卡產(chǎn)品,,以及共用相同自研指令集,、處理器架 構(gòu)和基礎(chǔ)系統(tǒng)軟件平臺(tái),,完成了“云邊端一體化”建設(shè),可覆蓋人工智能領(lǐng)域高度多樣 化的應(yīng)用場(chǎng)景(如視覺,、語(yǔ)音,、自然語(yǔ)言理解、機(jī)器學(xué)習(xí)等),。
5.7. 域控制器 AI 芯片潛在進(jìn)入者
AI 芯片具備成為域控制器 AI 芯片的潛質(zhì):1)需要通過(guò)車規(guī)級(jí)/功能安全標(biāo)準(zhǔn),;2) 算力至少應(yīng)為 TOPS 量級(jí);3)能效比(算力/功耗)應(yīng) TOPS/W 量級(jí),;4)與主機(jī)廠或 Tier1 供應(yīng)商較長(zhǎng)時(shí)間的合作適配等幾個(gè)特點(diǎn),。
邊緣端芯片公司:以下廠商均未涉及汽車領(lǐng)域,更未通過(guò)車規(guī)級(jí),。比特大陸產(chǎn)品主 要用于礦機(jī)芯片,,功耗過(guò)高;云天勵(lì)飛算力較低,。
云端 AI 芯片公司:1)百度,、谷歌在自動(dòng)駕駛領(lǐng)域布局最多,主要針對(duì) L4 級(jí)以上 自動(dòng)駕駛領(lǐng)域,,自研硬件,、算法、編程框架等,。例如百度自研算法,、編程框架 PaddlePadlle, 其昆侖芯片為云端芯片,,目前已搭載于服務(wù)器,,具備開發(fā)自動(dòng)駕駛域 AI 芯片的技術(shù)能 力。2)阿里,、騰訊通過(guò)投資創(chuàng)企或設(shè)立企業(yè)進(jìn)行布局 AI 芯片,,芯片主要對(duì)內(nèi)提供數(shù)據(jù) 中心云端芯片,暫不涉及自動(dòng)駕駛領(lǐng)域,。3)國(guó)內(nèi)外云端創(chuàng)企如 Grop,、Graphcore、依圖 科技等暫時(shí)主要針對(duì)數(shù)據(jù)中心云端芯片,,短期內(nèi)無(wú)法布局更多領(lǐng)域,。
FPGA 芯片公司:主要為賽靈思(美國(guó)),深鑒科技(賽靈思收購(gòu)),,阿爾特拉(英 特爾收購(gòu)),。整體算力較低,能效比低于 N-SOC,,通用性能低于 GPU,,需要 Tier 1 級(jí)供 應(yīng)商定制化芯片結(jié)構(gòu)以及提供一整套的算法應(yīng)用方案,。
傳統(tǒng)汽車電子巨頭:瑞薩電子、NXP,、英飛凌,、TI 等均部署自動(dòng)駕駛領(lǐng)域計(jì)算平臺(tái) 產(chǎn)品。但現(xiàn)階段提供的計(jì)算平臺(tái)產(chǎn)品仍屬于 CPU 占主導(dǎo)的范疇,,AI 算力較低,,而且能 耗較大。部分企業(yè)通過(guò)并購(gòu)或投資 AI 芯片創(chuàng)企的方式快速切入汽車 AI 芯片領(lǐng)域,。