在自動(dòng)駕駛領(lǐng)域,,GPU強(qiáng)大的算力是自動(dòng)駕駛芯片的一種選擇,,也造就了擁有著最強(qiáng)大性能GPU的英偉達(dá)在這個(gè)領(lǐng)域的地位,英偉達(dá)Xavier也可能成為全球首個(gè)通過ISO26262標(biāo)準(zhǔn)的自動(dòng)駕駛芯片,。
但是,,特斯拉正在研發(fā)的這款人工智能芯片,,也稱之為神經(jīng)網(wǎng)絡(luò)芯片,,則可以在不使用CPU和GPU的情況下,,通過使用微處理器設(shè)計(jì)的芯片,同樣可以為汽車帶來完全自動(dòng)駕駛能力,,這款芯片將隨著Autopilot 3.0硬件版本一起發(fā)布,。
在特斯拉最新公開的專利申請(qǐng)中,解釋了特斯拉為何要放棄CPU和GPU為特斯拉的機(jī)器學(xué)習(xí)系統(tǒng)提供算力:
機(jī)器學(xué)習(xí)和人工智能的處理通常需要對(duì)大量數(shù)據(jù)進(jìn)行數(shù)學(xué)運(yùn)算,,通常需要解決多個(gè)卷積層和池化層,,機(jī)器學(xué)習(xí)和人工智能技術(shù)通常利用矩陣運(yùn)算和激活函數(shù)等非線性函數(shù),機(jī)器學(xué)習(xí)的應(yīng)用包括自動(dòng)駕駛和輔助駕駛,。
在一些場(chǎng)景中,,計(jì)算機(jī)處理器(CPU)被用來執(zhí)行機(jī)器學(xué)習(xí)訓(xùn)練和推理。傳統(tǒng)的計(jì)算機(jī)處理器能夠非??斓貓?zhí)行單一的數(shù)學(xué)運(yùn)算,,但通常只能同時(shí)處理有限數(shù)量的數(shù)據(jù)。作為一種替代方法,,可以使用圖形處理單元(GPU),,并能夠并行地對(duì)更大的數(shù)據(jù)集執(zhí)行相同的數(shù)學(xué)操作。
通過使用多個(gè)處理器內(nèi)核,,GPU可以并行執(zhí)行多個(gè)任務(wù),,通常能夠比傳統(tǒng)計(jì)算機(jī)處理器更快地完成大型圖形處理任務(wù)。然而,,GPU和傳統(tǒng)的計(jì)算機(jī)處理器最初都不是為機(jī)器學(xué)習(xí)或人工智能操作而設(shè)計(jì)的,。
機(jī)器學(xué)習(xí)和人工智能操作,通常依賴于在非常大的數(shù)據(jù)集上重復(fù)應(yīng)用一組特定的機(jī)器學(xué)習(xí)處理器操作,。因此,,需要一種微處理器系統(tǒng)來支持在大型數(shù)據(jù)集上并行執(zhí)行機(jī)器學(xué)習(xí)和人工智能特定的處理操作,而不需要每個(gè)并行操作的多個(gè)處理核心的處理方式,。
在特斯拉這系列的專利被提名的專利人包括Peter Bannon,,前蘋果芯片架構(gòu)師,現(xiàn)特斯拉芯片項(xiàng)目負(fù)責(zé)人,;Emil Taples,,曾長期擔(dān)任AMD芯片架構(gòu)師;Debjit Das Sarma,,AMD前首席CPU架構(gòu)師,。
特斯拉一系列的專利,闡述了為解決放棄GPU問題而設(shè)計(jì)的微處理器,,下面是關(guān)于特斯拉全新人工智能芯片專利的介紹:
01
加速數(shù)字引擎
特斯拉在專利申請(qǐng)中描述了該發(fā)明:
本發(fā)明的各種實(shí)施例與加速數(shù)學(xué)引擎有關(guān):在某些實(shí)施例中,,所述加速數(shù)學(xué)引擎應(yīng)用于圖像處理,,以便通過使用包含包括ALU、輸出寄存器和陰影寄存器的子電路的二維矩陣處理器加速圖像的卷積,。這種架構(gòu)支持一種時(shí)鐘化的二維架構(gòu),,在這種架構(gòu)中,圖像數(shù)據(jù)和權(quán)重以同步的方式相乘,,從而允許并行執(zhí)行大量的數(shù)學(xué)運(yùn)算,。
以下是申請(qǐng)專利時(shí)的一些圖紙和原理圖:
02
可變延遲內(nèi)存訪問計(jì)算陣列微處理器系統(tǒng)
特斯拉在專利申請(qǐng)中描述了該發(fā)明:
微處理器系統(tǒng)包括計(jì)算陣列和硬件仲裁器:計(jì)算陣列包括多個(gè)計(jì)算單元。多個(gè)計(jì)算單元中的每一個(gè)都對(duì)從存儲(chǔ)器中尋址的相應(yīng)值進(jìn)行操作,。硬件仲裁程序被配置為控制對(duì)來自計(jì)算單元的內(nèi)存的一個(gè)或多個(gè)對(duì)應(yīng)值發(fā)出至少一個(gè)內(nèi)存請(qǐng)求,。硬件仲裁器還被配置為根據(jù)內(nèi)存請(qǐng)求的發(fā)出調(diào)度要發(fā)出的控制信號(hào)。
以下是申請(qǐng)專利時(shí)的一些圖紙和原理圖:
03
非連續(xù)數(shù)據(jù)格式的計(jì)算陣列微處理器系統(tǒng)
特斯拉在專利申請(qǐng)中描述了該發(fā)明:
微處理器系統(tǒng)包括計(jì)算陣列和硬件數(shù)據(jù)格式化器:計(jì)算陣列包括多個(gè)計(jì)算單元,,每個(gè)計(jì)算單元對(duì)從內(nèi)存中尋址的對(duì)應(yīng)值進(jìn)行操作,。由計(jì)算單元操作的值作為一組要并行處理的值同步地提供給計(jì)算陣列。硬件數(shù)據(jù)格式化程序配置為收集值組,,其中值組包括內(nèi)存中連續(xù)放置的值的第一個(gè)子集和內(nèi)存中連續(xù)放置的值的第二個(gè)子集,。不需要從第二個(gè)值子集連續(xù)地在內(nèi)存中定位第一個(gè)值子集。
以下是申請(qǐng)專利時(shí)的一些圖紙和原理圖:
04
Vertor計(jì)算單元
特斯拉在專利申請(qǐng)中描述了該發(fā)明:
微處理器系統(tǒng)包括計(jì)算陣列和向量計(jì)算單元:計(jì)算陣列包括多個(gè)計(jì)算單元,。所述矢量計(jì)算單元與所述計(jì)算陣列通信,,并包括多個(gè)處理元素。處理元素被配置為接收計(jì)算數(shù)組的輸出數(shù)據(jù)元素,,并并行處理接收的輸出數(shù)據(jù)元素,。
以下是申請(qǐng)專利時(shí)的一些圖紙和原理圖:
特斯拉的自動(dòng)駕駛芯片的設(shè)計(jì)思路,為解決自動(dòng)駕駛的問題提供了新的方向,,這可能是這個(gè)芯片最值得研究的地方,。之所以采取微處理器為主的設(shè)計(jì)思路,或許是因?yàn)檫@個(gè)設(shè)計(jì)更符合特斯拉自動(dòng)駕駛路線的硬件設(shè)備,。