基于深度強(qiáng)化學(xué)習(xí)和社會(huì)力模型的移動(dòng)機(jī)器人自主避障 | |
所屬分類(lèi):技術(shù)論文 | |
上傳者:zhoubin333 | |
文檔大?。?span>1912 K | |
標(biāo)簽: 深度強(qiáng)化學(xué)習(xí) 社會(huì)力模型 自主避障 | |
所需積分:0分積分不夠怎么辦,? | |
文檔介紹:深度強(qiáng)化學(xué)習(xí)在移動(dòng)機(jī)器人自主避障領(lǐng)域已得到廣泛應(yīng)用,,其基本原理是通過(guò)模擬環(huán)境中的不斷試錯(cuò),,結(jié)合獎(jiǎng)勵(lì)機(jī)制提升機(jī)器人的避障性能,。然而,,針對(duì)不同任務(wù)場(chǎng)景,,網(wǎng)絡(luò)訓(xùn)練效率存在顯著差異,。同時(shí),,在人群密集的場(chǎng)景中,,機(jī)器人的行為可能對(duì)人類(lèi)造成干擾。為了應(yīng)對(duì)訓(xùn)練效率低下和機(jī)器人行為不符合社會(huì)規(guī)范的問(wèn)題,,提出了一種將社會(huì)力模型融入深度強(qiáng)化學(xué)習(xí)的自主避障策略,。該策略首先將人類(lèi)未來(lái)的運(yùn)動(dòng)軌跡考慮進(jìn)獎(jiǎng)勵(lì)函數(shù),以確保機(jī)器人理解人類(lèi)意圖并避免闖入人類(lèi)的舒適區(qū),。其次,,在訓(xùn)練過(guò)程中引入先驗(yàn)的傳統(tǒng)控制器模型,并設(shè)計(jì)了一種基于概率的切換開(kāi)關(guān),,以隨機(jī)切換控制器輸出,,提高機(jī)器人的探索效率。實(shí)驗(yàn)結(jié)果表明,,所提出的方法能夠增加機(jī)器人與人類(lèi)之間的安全距離,,同時(shí)實(shí)現(xiàn)平穩(wěn)導(dǎo)航。 | |
現(xiàn)在下載 | |
VIP會(huì)員,,AET專(zhuān)家下載不扣分,;重復(fù)下載不扣分,本人上傳資源不扣分,。 |
Copyright ? 2005-2024 華北計(jì)算機(jī)系統(tǒng)工程研究所版權(quán)所有 京ICP備10017138號(hào)-2