進(jìn)入 2020 年,自動(dòng)駕駛技術(shù)的跨越式路線與漸進(jìn)式路線之間的陣營(yíng)劃分已經(jīng)十分明顯,。對(duì)于自動(dòng)駕駛的技術(shù)進(jìn)展,WEVOLVER 發(fā)布的《2020 自動(dòng)駕駛技術(shù)報(bào)告》進(jìn)行了全面的闡釋,。但最終自動(dòng)駕駛要完全實(shí)現(xiàn)無(wú)人化,其技術(shù)還需要進(jìn)行不斷的迭代和發(fā)展,。
報(bào)告從感知,、規(guī)劃、執(zhí)行三個(gè)層面表述了自動(dòng)駕駛汽車技術(shù)的最新發(fā)展?fàn)顩r,,涉及了傳感器,、數(shù)據(jù)處理、機(jī)器學(xué)習(xí),、SLAM 與傳感器融合,、路徑規(guī)劃等多個(gè)領(lǐng)域,同時(shí)提供了多個(gè)自動(dòng)駕駛公司的案例,,包括特斯拉,、Volvo、Waymo 等,。
感知
自動(dòng)駕駛汽車是在一個(gè)未知的動(dòng)態(tài)環(huán)境中運(yùn)行的,,所以它需要事先構(gòu)建出環(huán)境地圖并在地圖中進(jìn)行自我定位,而執(zhí)行同步定位和映射過(guò)程(SLAM,,即時(shí)定位和地圖構(gòu)建)的輸入則需要傳感器和 AI 系統(tǒng)的幫助,。
報(bào)告指出,傳感器可分為有源傳感器和無(wú)源傳感器,,各種傳感器都有其優(yōu)缺點(diǎn),,沒(méi)有一種單一傳感器能夠適用于所有路況。通常情況下,,想要可靠,、安全地操控一輛自動(dòng)駕駛汽車,需要同時(shí)使用多個(gè)傳感器,。
一般情況下,,自動(dòng)駕駛汽車包含的傳感器主要有五種類型:
1、遠(yuǎn)程雷達(dá):信號(hào)能夠透過(guò)雨,、霧,、灰塵等視線障礙物進(jìn)行目標(biāo)檢測(cè)。
2,、照相機(jī):一般以組合形式進(jìn)行短程目標(biāo)探測(cè),,多應(yīng)用于遠(yuǎn)距離特征感知和交通檢測(cè)。
3,、激光雷達(dá):多用于三維環(huán)境映射和目標(biāo)檢測(cè),。
4、短程/中程雷達(dá):中短程目標(biāo)檢測(cè),,適用于側(cè)面和后方避險(xiǎn),。
5、超聲波:近距離目標(biāo)檢測(cè),。
前面提到,,各類傳感器均有其優(yōu)缺點(diǎn),而自動(dòng)駕駛汽車需要從技術(shù)上對(duì)傳感器進(jìn)行判斷,、選擇,,篩選的條件主要有以下幾個(gè)方面:
掃描范圍,決定了傳感器對(duì)被感知的物體做出反應(yīng)的時(shí)間;
分辨率,,傳感器可以為自動(dòng)駕駛車輛提供的環(huán)境細(xì)節(jié);
視野/角度分辨率,,決定自動(dòng)駕駛汽車需要多少傳感器來(lái)覆蓋感知的區(qū)域;
3D 環(huán)境下區(qū)分靜態(tài)對(duì)象和動(dòng)態(tài)對(duì)象的能力;
刷新率,決定傳感器信息更新的頻率;
在不同環(huán)境條件下的總體可靠性和準(zhǔn)確性;
成本,、尺寸和軟件兼容性;
生成的數(shù)據(jù)量,。
以下是 Waymo、Volvo-Uber,、Tesla 的傳感器方案示意圖:
另外,,關(guān)于無(wú)源傳感器和有源傳感器,報(bào)告中也作了詳盡的介紹:
無(wú)源傳感器
無(wú)源傳感器能夠探測(cè)環(huán)境中物體反射的現(xiàn)有能量,,如光,、輻射等。但在弱光環(huán)境下,,由于沒(méi)有自己的傳播源,,無(wú)源傳感器的性能將有所下降。并且在產(chǎn)生的數(shù)據(jù)方面,,對(duì)比有源傳感器,,無(wú)源傳感器產(chǎn)生的數(shù)據(jù)量更多,約 0.5-3.5 Gbps,。
即便如此,,無(wú)源傳感器仍具有多方面特點(diǎn),主要包括:
1.涵蓋整個(gè)視野寬度的高分辨率的像素和顏色;
2.在視野中保持恒定的幀頻;
3.兩個(gè)攝像頭可以生成一個(gè) 3D 立體視圖;
4.缺乏發(fā)射源減少了來(lái)自其他車輛的干擾的可能性;
5.技術(shù)成熟,,成本低;
6.系統(tǒng)生成的圖像便于用戶理解和交互,。
如果在自動(dòng)駕駛汽車上使用無(wú)源攝像頭傳感器套件,需要覆蓋汽車周邊的各個(gè)環(huán)境,。這可以通過(guò)使用在特定時(shí)間間隔拍攝圖像的旋轉(zhuǎn)相機(jī)來(lái)實(shí)現(xiàn),,或者通過(guò)軟件將 4-6 個(gè)相機(jī)的圖像拼接在一起,。
此外,這些傳感器需要一個(gè)超過(guò) 100 分貝的高動(dòng)態(tài)范圍(場(chǎng)景中高光和陰影的成像能力),,使它們能夠在各種光照條件下工作,,并區(qū)分不同的對(duì)象。
有源傳感器
有源傳感器具有信號(hào)傳輸源,,依靠 TOF 原理感知環(huán)境,,ToF 能夠通過(guò)等待信號(hào)的反射返回來(lái)測(cè)量信號(hào)從源到目標(biāo)的傳播時(shí)間,信號(hào)的頻率決定了系統(tǒng)所使用的能量及其準(zhǔn)確性,。因此,,確定正確的波長(zhǎng)在選擇系統(tǒng)時(shí)起著關(guān)鍵的作用。
關(guān)于有源傳感器的類型,,報(bào)告主要介紹了以下三種:
超聲波傳感器:也稱為聲納;聲音導(dǎo)航測(cè)距,。在有源傳感器中,聲波的頻率最低(波長(zhǎng)最長(zhǎng)),,因此聲波更容易被干擾,,這也意味著超聲波傳感器很容易受到不利環(huán)境條件的影響,如下雨和灰塵,。另外,,其他聲波產(chǎn)生的干擾也會(huì)影響傳感器的性能,需要通過(guò)使用多個(gè)傳感器和依賴額外的傳感器類型來(lái)緩解干擾,。
雷達(dá):主要通過(guò)無(wú)線電波進(jìn)行測(cè)距,。無(wú)線電波以光速傳播,在電磁波譜中頻率最低(波長(zhǎng)最長(zhǎng)),,基于無(wú)線電波的反射特性,,雷達(dá)傳感器可以探測(cè)到前方物體之外的東西。
不過(guò),,雷達(dá)信號(hào)容易被具有相當(dāng)導(dǎo)電性的材料(如金屬物體)反射,,并且其他無(wú)線電波的干擾也會(huì)影響雷達(dá)的性能,造成雷達(dá)傳感器無(wú)法對(duì)物體進(jìn)行探測(cè),。在確定被探測(cè)目標(biāo)的形狀方面,,雷達(dá)的能力不如激光雷達(dá)。
激光雷達(dá):以脈沖激光的形式使用光,。激光雷達(dá)傳感器能夠以每秒 50,000- 200,000 個(gè)脈沖的速度覆蓋一個(gè)區(qū)域,,并將返回的信號(hào)編譯成一個(gè) 3D 點(diǎn)云,通過(guò)比較連續(xù)感知的點(diǎn)云,、物體的差異檢測(cè)其運(yùn)動(dòng),,由此創(chuàng)建一個(gè) 250 米范圍內(nèi)的 3D 地圖。
2
規(guī)劃
根據(jù)自動(dòng)駕駛汽車傳感器套件捕獲的原始數(shù)據(jù)和已有地圖,自動(dòng)駕駛系統(tǒng)需要通過(guò)同時(shí)定位和映射算法構(gòu)建和更新具體的環(huán)境地圖,,跟蹤其具體定位,,從而開(kāi)始規(guī)劃從一個(gè)點(diǎn)到另一個(gè)點(diǎn)的路徑。
SLAM與傳感器融合
SLAM 是一個(gè)復(fù)雜的過(guò)程,,因?yàn)槎ㄎ恍枰貓D,,而繪制地圖需要良好的位置估計(jì)。為了更準(zhǔn)確地執(zhí)行即時(shí)定位和地圖構(gòu)建,,傳感器融合開(kāi)始發(fā)揮作用。
傳感器融合是將多個(gè)傳感器和數(shù)據(jù)庫(kù)的數(shù)據(jù)結(jié)合起來(lái)以實(shí)現(xiàn)信息改進(jìn)的過(guò)程,。它是一個(gè)多層次的過(guò)程,,能夠處理數(shù)據(jù)間的聯(lián)系和相關(guān)性,對(duì)數(shù)據(jù)進(jìn)行組合,,與使用單個(gè)數(shù)據(jù)源相比,,能夠獲得更便宜、更高質(zhì)量,、相關(guān)性更高的信息,。
在自動(dòng)駕駛汽車 AI 架構(gòu)中,主要有兩種方法:
1. 逐步處理,。把整個(gè)駕駛過(guò)程拆解為一系列逐層連接的流水線,,其中的每一步,比如感知,、定位,、地圖、路徑導(dǎo)航,、運(yùn)動(dòng)控制,,都分別由各自的具體軟件組件處理。
2. 端到端,?;谏疃葘W(xué)習(xí)的解決方案,一次性處理所有這些功能,。
通過(guò)傳感器的融合,,自動(dòng)駕駛汽車獲得了數(shù)據(jù),不過(guò),,如何從傳感器信號(hào)中提取有用的信息,,并基于現(xiàn)有信息執(zhí)行任務(wù),則需要利用機(jī)器學(xué)習(xí)算法——CNN,、RNN,、DRL。
CNN(卷積神經(jīng)網(wǎng)絡(luò)):主要用于處理圖像和空間信息,提取感興趣的特征和識(shí)別環(huán)境中的對(duì)象,。這些神經(jīng)網(wǎng)絡(luò)是由一個(gè)卷積層構(gòu)成的:一個(gè)過(guò)濾器的集合,,它試圖區(qū)分圖像的元素或輸入數(shù)據(jù)來(lái)標(biāo)記它們。這個(gè)卷積層的輸出被輸入到一個(gè)算法中,,該算法將它們結(jié)合起來(lái)預(yù)測(cè)圖像的最佳描述,。最后的軟件組件通常稱為對(duì)象分類器,因?yàn)樗梢詫?duì)圖像中的對(duì)象進(jìn)行分類,,例如一個(gè)路標(biāo)或另一輛汽車,。
RNN(遞歸神經(jīng)網(wǎng)絡(luò)):主要用于處理視頻信息,在這些網(wǎng)絡(luò)中,,先前步驟的輸出將作為輸入進(jìn)入到網(wǎng)絡(luò)中,,從而允許信息和知識(shí)能夠在網(wǎng)絡(luò)中持久存在并被上下文化。
DRL(深度強(qiáng)化學(xué)習(xí)):DRL 方法允許軟件定義的“代理”學(xué)習(xí)在虛擬環(huán)境中使用獎(jiǎng)勵(lì)函數(shù)實(shí)現(xiàn)目標(biāo)的最佳可能操作,。這些面向目標(biāo)的算法將學(xué)習(xí)如何實(shí)現(xiàn)目標(biāo),,或如何在多個(gè)步驟中沿著一個(gè)特定的維度最大化。目前,,深度強(qiáng)化學(xué)習(xí)在無(wú)人駕駛汽車中的應(yīng)用還處于起步階段,。
這些方法不一定是孤立存在的。為了避免過(guò)度擬合,,在深度學(xué)習(xí)中通常會(huì)進(jìn)行多任務(wù)訓(xùn)練網(wǎng)絡(luò),。當(dāng)機(jī)器學(xué)習(xí)算法被訓(xùn)練用于一個(gè)特定的任務(wù)時(shí),它會(huì)變得如此專注于模仿它所訓(xùn)練的數(shù)據(jù),,以至于試圖進(jìn)行插值或外推時(shí),,它的輸出會(huì)變得不現(xiàn)實(shí)。
通過(guò)在多個(gè)任務(wù)上訓(xùn)練機(jī)器學(xué)習(xí)算法,,網(wǎng)絡(luò)的核心將專注于發(fā)現(xiàn)對(duì)所有目的都有用的通用特性,,而不是專注于一個(gè)任務(wù),以便輸出更加實(shí)際有用的應(yīng)用程序,。
利用傳感器提供的所有數(shù)據(jù)和這些算法,,自動(dòng)駕駛汽車能夠探測(cè)到周圍的物體。接下來(lái),,它需要找到一條路徑,。
3
路徑規(guī)劃
車輛了解其環(huán)境中的物體及其位置后,可以使用 voronoi 圖(車輛與物體之間的最大距離),、占用網(wǎng)格算法或駕駛廊道算法來(lái)確定車輛的大尺度路徑,。然而,這些傳統(tǒng)方法并不能夠滿足車輛在動(dòng)態(tài)環(huán)境下的移動(dòng),。
報(bào)告指出,,部分自動(dòng)駕駛汽車不僅依靠機(jī)器學(xué)習(xí)算法來(lái)感知環(huán)境,,還依靠這些數(shù)據(jù)來(lái)控制汽車。路徑規(guī)劃可以通過(guò)模仿學(xué)習(xí)的方式傳授給 CNN,,在模仿學(xué)習(xí)中,,CNN 試圖模仿駕駛員的行為。
通常情況下,,這些機(jī)器學(xué)習(xí)方法會(huì)與經(jīng)典的運(yùn)動(dòng)規(guī)劃和軌跡優(yōu)化方法相結(jié)合,,以確保路徑的魯棒性。此外,,出于其他目的(例如減少燃料使用),,汽車制造商還會(huì)在模型中提供最佳路徑參考。
車輛運(yùn)行過(guò)程中的神經(jīng)網(wǎng)絡(luò)訓(xùn)練和推理需要巨大的計(jì)算能力,,由于汽車需要對(duì)新數(shù)據(jù)作出及時(shí)反應(yīng),,因此,操作車輛所需的部分處理需要在車上進(jìn)行,,而模型的改進(jìn)可以在云上完成。
目前,,機(jī)器學(xué)習(xí)的最新進(jìn)展在于有效處理自動(dòng)駕駛汽車傳感器產(chǎn)生的數(shù)據(jù),,減少計(jì)算成本。此外,,芯片制造和微型化的進(jìn)步正在提高可安裝在自動(dòng)駕駛汽車上的計(jì)算能力,。隨著網(wǎng)絡(luò)協(xié)議的進(jìn)步,汽車或許能夠依靠低延遲的基于網(wǎng)絡(luò)的數(shù)據(jù)處理來(lái)幫助它們進(jìn)行自主操作,。
4
執(zhí)行
那么,,車輛是如何行動(dòng)的呢?
在人類駕駛的汽車中,汽車的轉(zhuǎn)向,、剎車或信號(hào)等動(dòng)作通常由駕駛員控制,。來(lái)自駕駛員的機(jī)械信號(hào)由電子控制單元(ECU)轉(zhuǎn)換成驅(qū)動(dòng)命令,再由車上的電動(dòng)或液壓執(zhí)行器執(zhí)行,。
在(半)自動(dòng)駕駛汽車中,,這種功能被直接與 ECU 通信的驅(qū)動(dòng)控制軟件取代。這些軟件能夠改變車輛的結(jié)構(gòu),,減少部件的數(shù)量;尤其是那些專門用于為 ECU 將機(jī)械信號(hào)從駕駛員轉(zhuǎn)換為電信號(hào)的部件,。
自動(dòng)駕駛汽車通常包含多個(gè) ECU,一般車輛大約有 15-20 個(gè),,高端車型可能達(dá)到 100 個(gè),。
ECU 是一個(gè)簡(jiǎn)單的計(jì)算單元,有獨(dú)立的微控制器和內(nèi)存,,以此處理接收到的輸入數(shù)據(jù),,并將其轉(zhuǎn)換為其子系統(tǒng)的輸出命令,例如,轉(zhuǎn)換自動(dòng)變速箱,。
一般來(lái)說(shuō),,ECU 既可以負(fù)責(zé)控制車輛的操作,也可以負(fù)責(zé)安全功能,,運(yùn)行信息娛樂(lè)和內(nèi)部應(yīng)用程序,。并且,大多數(shù) ECU 支持單個(gè)應(yīng)用程序,,如電子動(dòng)力轉(zhuǎn)向,,能夠在本地運(yùn)行算法和處理傳感器數(shù)據(jù)。
挑戰(zhàn)一:系統(tǒng)復(fù)雜性
工程師需要為系統(tǒng)設(shè)計(jì)正確的電子體系結(jié)構(gòu),,以便進(jìn)行傳感器融合,,將決策同步分發(fā)到按指令行事的較低層子系統(tǒng),這對(duì)需求的增加和復(fù)雜性提出了挑戰(zhàn),。
理論上,,在一種極端情況下,人們可以選擇一種完全分布式的架構(gòu),,其中每個(gè)傳感單元處理其原始數(shù)據(jù)并與網(wǎng)絡(luò)中的其他節(jié)點(diǎn)通信,。在光譜的另一端存在一個(gè)集中的架構(gòu),其中所有的遠(yuǎn)程控制單元(RCUs)都直接連接到一個(gè)中央控制點(diǎn),,該控制點(diǎn)收集所有信息并執(zhí)行傳感器融合過(guò)程,。
而在這個(gè)范圍的中間是混合解決方案,它將在更高抽象級(jí)別工作的中央單元與執(zhí)行專用傳感器處理,,或與執(zhí)行決策算法的域相結(jié)合,。這些域可以基于車輛內(nèi)部的位置,例如汽車前部和后部的域,,它們控制的功能類型,,或者它們處理的傳感器類型(例如照相機(jī))。
在集中式體系架構(gòu)中,,來(lái)自不同傳感器的測(cè)量值是獨(dú)立的量,,不受其他節(jié)點(diǎn)的影響。數(shù)據(jù)在系統(tǒng)的邊緣節(jié)點(diǎn)上沒(méi)有被修改或過(guò)濾,,為傳感器融合提供了最大可能的信息,,并且具有較低的延遲。這一架構(gòu)挑戰(zhàn)在于,,大量的數(shù)據(jù)需要傳送到中央單元并在那里進(jìn)行處理,。這不僅需要一個(gè)強(qiáng)大的中央計(jì)算機(jī),而且還需要一個(gè)高帶寬的重型線束,。
分布式架構(gòu)可以用更輕的電氣系統(tǒng)實(shí)現(xiàn),,但更復(fù)雜,。盡管在這樣的架構(gòu)中,與帶寬和集中處理相關(guān)的需求大大減少,,但它在驅(qū)動(dòng)和傳感階段之間引入了延遲,,增加了對(duì)數(shù)據(jù)驗(yàn)證的挑戰(zhàn)。
挑戰(zhàn)二:動(dòng)力,、熱量,、重量和尺寸的增加
除了增加系統(tǒng)的復(fù)雜性之外,自動(dòng)化還會(huì)增加車輛部件的功耗,、熱足跡,、重量和尺寸。無(wú)論架構(gòu)是分布式的還是集中式的,,auton - omous 系統(tǒng)的功耗需求都是巨大的,,而在這之中,主要的驅(qū)動(dòng)因素是競(jìng)爭(zhēng)需求,。
全自動(dòng)汽車的競(jìng)爭(zhēng)需求比目前生產(chǎn)的最先進(jìn)的汽車高出近 100 倍,。對(duì)純電動(dòng)汽車來(lái)說(shuō),行駛里程容易受到這種動(dòng)力需求的負(fù)面影響,。因此,,Waymo 和福特等公司選擇專注于混合動(dòng)力汽車,而 Uber 則使用全汽油 suv,。然而,專家指出,,全電動(dòng)最終會(huì)成為動(dòng)力系統(tǒng)的選擇,,因?yàn)閮?nèi)燃機(jī)在為車載電腦發(fā)電方面效率低下。
增加的處理需求和更高的功率吞吐量會(huì)使系統(tǒng)升溫,,但為了使電子元件正??煽康毓ぷ鳎还苘囃獠織l件如何,,電子元件必須保持在一定的溫度范圍內(nèi),,這就需要冷卻系統(tǒng)的存在。但是,,冷卻系統(tǒng)進(jìn)一步增加車輛的重量和尺寸,,特別是液體冷卻。另外,,額外的組件,、額外的布線和熱管理系統(tǒng)也會(huì)對(duì)車輛任何部分的重量、尺寸和熱性能造成壓力,。
針對(duì)于此,,自動(dòng)驅(qū)動(dòng)元件的供應(yīng)商正改變著產(chǎn)品,,從減輕像 LIDARs 的大型元件重量,到構(gòu)建像 semicon - ductor 這樣的微型元件,。同時(shí),,半導(dǎo)體公司正在制造占地面積更小、熱性能更好,、干擾更小的元件,,發(fā)展各種硅元件,如 MOSFET,、bipo - lar 晶體管,、二極管和集成電路。
不僅如此,,該行業(yè)還考慮使用新材料——氮化鎵(GaN),。與硅相比,氮化鎵可以更有效地傳導(dǎo)電子,,從而能夠在給定的導(dǎo)通電阻和擊穿電壓下,,制造出更小的器件。
一輛全自動(dòng)駕駛汽車所包含的代碼可能比迄今為止所開(kāi)發(fā)的任何軟件平臺(tái)或操作系統(tǒng)都要多,,要自行處理所有的算法和過(guò)程需要顯著的計(jì)算能力和強(qiáng)大的處理,。目前,GPU 的加速處理正成為行業(yè)的標(biāo)準(zhǔn),。