當前位置：首頁 >

无限场景开放式仿真器 PGDrive：Improving the Generalization of End-to-End Driving through Procedural Generation

發布時間：2023/12/10 40 豆豆

生活随笔收集整理的這篇文章主要介紹了无限场景开放式仿真器 PGDrive：Improving the Generalization of End-to-End Driving through Procedural Generation 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

本文介紹一個擁有無限場景開放式駕駛仿真器：PGDrive，通過 Procedural Generation 技術可以生成無限多的駕駛場景，由香港中文大學周博磊團隊開發。

論文地址：https://arxiv.org/pdf/2012.13681.pdf

項目地址：https://decisionforce.github.io/pgdrive/

0. Absrtact

（這里先給出本文摘要）

在過去的幾年中，基于學習的自動駕駛系統（learning-based self driving system）受到了越多越多的關注。為了保證安全性，自動駕駛系統首先在模擬器中開發和驗證，然后再應用到真實世界中。但是，大多數現有的駕駛模擬器僅包含一組固定的場景和數量有限的配置設置。這很容易造成系統的過擬合，以及缺乏對未見場景的泛化能力。

為了更好地評估和改善端到端駕駛系統的泛化能力，本文將介紹一個開放、高度可配置的駕駛模擬器 PGDrive，模擬器具有procedural generation 的特征。模擬器首先通過提出的生成算法從基本blocks中采樣來生成多樣化的道路網絡。然后將它們轉變為交互式訓練環境，在該環境中以逼真的運動學方法渲染車輛附近的交通流。實驗結果證實隨著procedural generation的場景數量的增加，能夠提高自動駕駛汽車在不同交通密度和道路網絡場景的泛化能力。

1. Introduction & Related Work

( 本文的引言部分和第二部分研究現狀這里就不詳細介紹了，大家可以查看原文，我在這里大致總結下。)

Self Driving
自動駕駛研究可以分為兩類：模塊化（modular）和端到端（end-to-end）。在模塊化研究中，自動駕駛系統由許多子系統組成，如感知，定位，規劃，控制，決策等。模塊化設計的優勢是可解釋性，如果發生故障或意外行為，則可以輕松識別出發生故障的模塊。但是，設計和維護模塊需要花費大量的人力，并且還可能會因人工設計而導致系統內部冗余。另一方面，一種流行的端到端方法是通過強化學習駕駛汽車。近年來，強化學習能夠通過與環境交互來發現特定于任務的知識，因此大大減輕了對精心設計和領域知識的需求。同時，強化學習主體通過對環境的探索來學習，因此其能力不限于訓練數據。
Driving Simulators
這里介紹了8種常用的駕駛模擬器，CARLA，GTA V，SUMMIT，Flow，TORCS，Duckietown，Highway-env，SMARTS。它們的主要劣勢是地圖場景有限，不能提供多樣的訓練場景來幫助自動駕駛汽車提高泛化能力。
Procedural Feneration
這里介紹了過程生成技術，使用到了數據增強，域隨機化，GAN等技術來設計過程生成算法。
Generalization
這里提出強化學習可以解決過擬合現象，在本文作者中比較了SAC和PPO兩種強化學習算法的學習能力。

2. PGDrive Simulator

下表給出了PGDrive與其它駕駛模擬器的比較，可以看到，PGDrive最突出的特征是支持Procedural Generation，可以生成無限多的駕駛場景。

A. Road Blocks

如下圖所示，有7種基本道路塊（road block）：Straight，Ramp，Fork，Roundabout，Curve，T-Intersection，Intersection。它們是基本的道路塊，可以任意組合來形成道路網絡。

B. Procedural Generation of Driving Scene （重點）

下面將介紹本文提出的Procedural Generation算法（如下圖所示）。

首先隨機選擇一個基本road block： $G_w$ 。
隨機旋轉所選擇的road block，判斷 $G_w$ 和 $G_{net}$ 之間是否能連接起來，如果成功的話，則將新塊 $G_w$ 添加到 $G_{net}$ 中，這里至多進行 $T$ 次嘗試，每個 $G_{net}$ 包含 $n$ 個blocks。
最后是對交通流進行初始化設置，包括汽車類型，運動學參數，目標速度等。

3. Experiments

Results on Generalization

論文比較了SAC和PPO兩種強化學習算法的泛化能力，可以看到隨著訓練場景數量的增加，算法在測試集上的性能不斷提高，其中SAC算法性能優于PPO。

最后，作者在項目網站上也給出了一個視頻demo。

Reinforcement Learning 自動駕駛仿真

總結

以上是生活随笔為你收集整理的无限场景开放式仿真器 PGDrive：Improving the Generalization of End-to-End Driving through Procedural Generation的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：交行信用卡账单日怎么查询账单日修改只允
下一篇： Waymo研发经理：《自动驾驶感知前沿技