駕駛員在要變道時(shí),就會注意確保沒有車輛出現(xiàn)在盲區(qū),而這種意識對于自動駕駛系統(tǒng)而言也非常重要,。因此,,自動駕駛技術(shù)需要依賴強(qiáng)大的感知中樞,,而該中樞預(yù)計(jì)可以識別環(huán)境中所有相關(guān)的主體,包括預(yù)測道路上其他車輛的精確“姿態(tài)和形狀”。
現(xiàn)在,,自動駕駛汽車系統(tǒng)可以利用最常見的傳感模式之一——激光雷達(dá)的數(shù)據(jù)來觀察周圍情況。據(jù)外媒報(bào)道,,自動駕駛汽車技術(shù)公司Argo AI,、微軟和卡內(nèi)基梅隆大學(xué)(CMU)的研究人員合作,推出了一個全新的網(wǎng)絡(luò)架構(gòu),可以通過部分激光雷達(dá)的觀測信息估計(jì)車輛的形狀和姿態(tài),。
現(xiàn)在用于預(yù)測姿態(tài)和形狀的SOTA法通常會首先估計(jì)局部點(diǎn)云的姿態(tài),,然后在部分輸入信息中加入該姿態(tài),再預(yù)測形狀,。不過,,此種編碼—姿態(tài)解碼以及編碼-形狀解碼架構(gòu)會導(dǎo)致形狀估計(jì)誤差,最終的性能很差,。此外,,部分輸入的信息被冗余編碼兩次。
因此,,為何不使用一個共享式編碼網(wǎng)絡(luò)以估計(jì)姿態(tài)和形狀呢?
研究人員采用該策略,,將編碼合并到一個過程中,,以減少冗余,并在共享式編碼網(wǎng)絡(luò)中實(shí)現(xiàn)穩(wěn)定的姿態(tài)和形狀估計(jì),。
訓(xùn)練該共享式編碼網(wǎng)絡(luò)可分為兩部分,。首先,對編碼器和補(bǔ)全解碼器進(jìn)行形狀補(bǔ)全訓(xùn)練,。接下來,,凍結(jié)編碼器,并采用凍結(jié)編碼器產(chǎn)生的代碼對姿態(tài)解碼器進(jìn)行訓(xùn)練,。凍結(jié)是通過逐步凍結(jié)隱藏層來加速神經(jīng)網(wǎng)絡(luò)訓(xùn)練的常用技術(shù),。與基線網(wǎng)絡(luò)相比,用此種方法訓(xùn)練的姿態(tài)估計(jì)器的精度得到顯著提高,。
未來,,Argo AI會在追蹤等下游模塊中利用該形狀估計(jì)模型,并在實(shí)時(shí)系統(tǒng)中采用該種新型架構(gòu),。