當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

深度解析，教你如何打造自动驾驶的数据闭环

發布時間：2023/12/2 编程问答 46 豆豆

生活随笔收集整理的這篇文章主要介紹了深度解析，教你如何打造自动驾驶的数据闭环小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

最近自動駕駛和數據閉環結合在一起，原因是自動駕駛工程已經被認可是一個解決數據分布“長尾問題”的任務，時而出現的corner case（極端情況）是對數據驅動的算法模型進行升級的來源之一，如圖所示。

構成這個自動駕駛數據閉環的核心技術和模塊都有哪些呢？首先是這個自動駕駛的算法和模塊是數據驅動的，其次源源不斷的數據需要有合理有效的方法去利用。

如圖是Tesla眾所周知的Autopilot數據引擎框架：確認模型誤差、數據標注和清洗、模型訓練和重新部署。

這是谷歌waymo報告提到的數據閉環平臺：其中有數據挖掘、主動學習、自動標注、自動化模型調試優化、測試校驗和部署發布。

如圖是英偉達公司在自動駕駛開發建立的機器學習平臺MAGLEV，也是基于閉環的模型迭代：其中有smart的數據選擇、數據標注、模型搜索、訓練、評估、調試和部署。

下面對數據閉環各個組成部分進一步討論：

自動駕駛的數據驅動模型；
云計算平臺的基建和大數據處理技術；
訓練數據標注工具；
大型模型訓練平臺；
模型測試和檢驗；
相關的機器學習技術。

1 自動駕駛的數據驅動模型

應該說，自動駕駛的算法模塊，基本都是數據驅動的訓練模型要優于基于規則或者優化的，尤其是感知和預測。

以下圖（綜述論文 “A Survey of Autonomous Driving: Common Practices and Emerging Technologies”）為例，現在自動駕駛的開發基本是模塊化的（a），只有個別是采用端到端模式（b）。

端到端模式可以說絕對是數據驅動的（如圖為例），因為傳統的優化和規則方法無法處理如此復雜的系統設計和公式化。

“E2E Learning of Driving Models with Surround-View Cameras and Route Planners”

模塊化的方法也是可以采用數據驅動方式，可以分成以下模塊：

感知：圖像/激光雷達/毫米波雷達
地圖+定位
預測（感知-預測）
規劃決策（預測-規劃）
控制（規劃-控制）
傳感器預處理
模擬仿真

下面以此分別討論：

1）感知：2-D/3-D 目標檢測和分割基本是采用深度學習模型，無論激光雷達、攝像頭或者傳感器融合的形式；跟蹤基本是tracking-by-detection方式，不過把跟蹤和檢測集成在一起做深度學習模型也是大家討論的熱點之一。

“Keep your Eyes on the Lane: Real-time Attention-guided Lane Detection”

“M3DSSD: Monocular 3D Single Stage Object Detector”

“PointPillars: Fast Encoders for Object Detection from Point Clouds”

“Joint 3D Proposal Generation and Object Detection from View Aggregation”

”Seeing Through Fog: Deep Multimodal Sensor Fusion in Unseen Adverse Weather“

“Fast and Furious: R-T E2E 3D Detection, Tracking &amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp; Motion Forecasting with a Single Cnn”

2）地圖定位：車輛定位中基于語義地圖的方法，在語義目標提取也是采用深度學習模型，甚至語義地圖的制作也是如此，目前感興趣的地圖更新（或者在線地圖）多半需要檢測語義目標。定位的后端也可以是數據驅動的解決，包括全局定位和相對定位，最近SLAM和深度學習的結合工作也如火如荼進行。

“LCDNet: Deep Loop Closure Detection andPoint Cloud Registration for LiDAR SLAM”

“DeepSFM: Structure From Motion Via DeepBundle Adjustment”

“HDMapNet: An Online HD Map Construction and Evaluation Framework”

3）預測：障礙物的軌跡預測現在已經是自動駕駛發展至今的重點之一，現在重要性可以說是高于感知。如何建模智體行為、如何建模智體之間的交互和軌跡預測的動作多模態性，自然最佳方式是采用數據來訓練。另外，感知-預測結合解決也是需要大量數據訓練去得到合理的模型。

“Learning Lane Graph Representations for Motion Forecasting”

“PnPNet: End-to-End Perception and Prediction with Tracking in the Loop”

“Deep Multi-Task Learning for Joint Localization, Perception, and Prediction”

“TNT: Target-driven Trajectory Prediction”

4）規劃：規劃問題可以是傳統的規則方法，也可以是強化學習或者模仿學習，其中強化學習也需要數據學習懲罰/獎勵和策略。目前人們關心規劃的地域化和個性化問題，這個比起感知的類似問題解決起來更加困難，比如激進還是保守地進行換道超車和并道匯入。最近有討論合并預測和規劃的解決方法，甚至包括地圖定位一起建模，這個沒有數據的“喂養”是很難成立的。

“DSDNet: Deep Structured self-Driving Network”

“End-to-end Interpretable Neural Motion Planner”

“MP3: A Unified Model to Map, Perceive,Predict and Plan”

“Probabilistic Anchor Trajectory Hypotheses For Behavior Prediction”

“VectorNet: Encoding HD Maps and Agent Dynamics From Vectorized Representation”

“Deep Imitation Learning for AV in Generic Urban Scenarios with Enhanced Safety”

“Perceive, Predict, and Plan: Safe Motion Planning Through Interpretable Semantic Rep”

5）控制：應該說，控制的傳統方法相對成熟，不過并不是說數據驅動就沒有價值，實際上規劃和控制的確集成在一起建模也是大家感興趣的領域，前面提到的強化學習和模仿學習同樣是不錯的解決手段。

“A Fast Integrated Planning and Control Framework for AV via Imitation Learning”

“Deep Imitative Models For Flexible Inference, Planning, And Control”

6）傳感器預處理：在進入感知模塊之前，傳感器的數據處理，比如污染檢測、修補、去噪和增強等，傳統的方法也會被數據驅動的機器學習方法取代。

“ZeroScatter: Domain Transfer for Long Distance Imaging and Visionthrough Scattering Media”

7）模擬仿真：模擬仿真需要對車輛/行人、傳感器、交通環境和道路環境建模，有時候無法直接獲得逼真的合成模型，特別是實際發生的交通事件，有時候不得不采用真實傳感器數據來建模合成。下圖是GAN-based的雨夜圖像合成方法。

“ForkGAN: Seeing into the Rainy Night”

2 云計算平臺的基建和大數據處理技術

數據閉環需要一個云計算/邊緣計算平臺和大數據的處理技術，這個不可能在單車或單機實現的。大數據云計算發展多年，在資源管理調度、數據批處理/流處理、工作流管理、分布式計算、系統狀態監控和數據庫存儲等方面提供了數據閉環的基礎設施支持，比如亞馬遜AWS、微軟Azure和谷歌云等。

Amazon Elastic Compute Cloud（EC2）是亞馬遜云服務AWS的一部分，而Amazon Elastic MapReduce（EMR）是其大數據云平臺，可使用多種開放源代碼工具處理大量數據，例如數據流處理Apache Spark、數據倉庫Apache Hive和Apache HBase、數據流處理Apache Flink、數據湖Apache Hudi和大數據分布式SQL查詢引擎Presto。

下圖是亞馬遜云AWS提供的自動駕駛數據處理服務平臺例子：其中標明1-10個任務環節

使用?AWS Outposts?（運行本地 AWS 基礎設施和服務）從車隊中提取數據以進行本地數據處理。

使用?AWS IoT Core?（將 IoT 設備連接到 AWS 云，而無需配置或管理服務器）和?Amazon Kinesis Data Firehose?（將流數據加載到數據湖、數據存儲和分析服務中）實時提取車輛T-box數據，該服務可以捕獲和轉換流數據并將其傳輸給?Amazon S3（AWS全球數據存儲服務）、Amazon Redshift（用標準 SQL 在數據倉庫、運營數據庫和數據湖中查詢和合并 EB 級結構化和半結構化數據）、Amazon Elasticsearch Service（部署、保護和運行 Elasticsearch，是一種在 Apache Lucene 上構建的開源 RESTful 分布式搜索和分析引擎）、通用 HTTP 終端節點和服務提供商（如 Datadog、New Relic、MongoDB?和 Splunk），這里Amazon Kinesis?提供的功能Data Analytics，可通過?SQL?或?Apache Flink?（開源的統一流處理和批處理框架，其核心是分布流處理數據引擎）的實時處理數據流。

刪除和轉換低質量數據。

使用?Apache Airflow （開源工作流管理工具）安排提取、轉換和加載 (ETL) 作業。

基于 GPS 位置和時間戳，附加天氣條件來豐富數據。

使用?ASAM OpenSCENARIO?（一種駕駛和交通模擬器的動態內容文件格式）提取元數據，并存儲在Amazon DynamoDB?（NoSQL 數據庫服務）和?Amazon Elasticsearch Service中。

在?Amazon Neptune?（圖形數據庫服務，用于構建查詢以有效地導航高度互連數據集）存儲數據序列，并且使用?AWS Glue Data Catalog（管理ETL服務的AWS Glue提供數據目錄功能）對數據建立目錄。

處理駕駛數據并深度驗證信號。

使用?Amazon SageMaker Ground Truth?（構建訓練數據集的標記工具用于機器學習，包括 3D 點云、視頻、圖像和文本）執行自動數據標記，而Amazon SageMaker?整合ML功能集，提供基于 Web 的統一可視化界面，幫助數據科學家和開發人員快速準備、構建、訓練和部署高質量的機器學習 (ML) 模型。

AWS AppSync?通過處理與 AWS DynamoDB、AWS Lambda（事件驅動、自動管理代碼運行資源的計算服務平臺）等數據源之間連接任務來簡化數據查詢/操作GraphQL API 的開發，在此使用是為特定場景提供搜索功能。

下圖是AWS給出的一個自動駕駛數據流水線框架：數據收集、注入和存儲、模型訓練和部署；其中Snowball是AWS的邊緣計算系列之一，負責車輛和AWS S3之間的數據傳輸；其他還有兩個，是AWS?Snowcone和 AWS?Snowmobile。

可以看到，AWS使用了數據存儲S3、數據傳輸Snowball、數據庫DynamoDB、數據流處理Flink和Spark、搜索引擎Elasticsearch、工作流管理Apache Airflow和機器學習開發平臺SageMaker等。

其他開源的使用，比如流處理的實時數據饋送平臺Apache Kafka、資源管理&調度Apache Mesos和分布NoSQL數據庫Apache Cassandra。

如圖是國內自動駕駛公司Momenta基于亞馬遜AWS建立的系統架構實例圖：

其中AWS IoT Greengrass?提供邊緣計算及機器學習推理功能，可以實時處理車輛中的本地規則和事件，同時最大限度地降低向云傳輸數據的成本。

其中P3實例和C5實例是Amazon EC2提供的。Amazon CloudFront是AWS的CDN，Amazon Glacier是在線文件存儲服務，而Amazon FSx for Lustre 是可擴展的高性能文件存儲系統。

除此之外，亞馬遜指出的，Momenta采用的AWS服務還包括：監控可觀測性服務Amazon CloudWatch、關系數據庫Amazon Relational Database Service (Amazon RDS)、實時流數據處理和分析服務Amazon Kinesis（包括Video Streams、Data Streams、Data Firehose和Data Analytics）和消息隊列服務Amazon Simple Queue Service (Amazon SQS)等。

最近Momenta還采用Amazon Elastic Kubernetes Service (EKS) 運行容器Kubernetes。此外亞馬遜也推薦了Kubernetes服務，AWS Fargate。

Apache Kafka

Apache Spark

Apache Flink

Apache HBase

Apache Cassandra

Presto

Apache Hudi

Apache Airflow

Apache Mesos

3 訓練數據標注工具

其實AWS的機器學習平臺本身也提供了數據標注工具Amazon SageMaker Ground Truth。

如圖是微軟開源標注工具VOTT（Video Object Tagging Tool）：

標注工具可以是全自動、半自動和手工等3類。

比如人工標注工具：攝像頭圖像LabelMe和激光雷達點云PCAT

還有半自動標注工具：攝像頭CVAT、VATIC，激光雷達3D BAT、SAnE，圖像點云融合Latte

自動標注工具：基本沒有開源（商用也沒有吧）的工具可用。

這里有一些自動標注方面的論文：

“Beat the MTurkers: Automatic Image Labeling from Weak 3D Supervision“

“Auto-Annotation of 3D Objects via ImageNet“

“Offboard 3D Object Detection from Point Cloud Sequences“

這里是Nvidia在會議報告中給出的端到端標注流水線：它需要人工介入

在這里順便提一下“數據可視化”的問題，各種傳感器數據除了標注，還需要一個重放、觀察和調試的平臺。如圖是Uber提供的開源可視化工具?Autonomous Visualization System (AVS)：

其中”XVIZ“是提出的自動駕駛數據實時傳輸和可視化協議：

另外，“streetscape.gl“是一個可視化工具包，在XVIZ 協議編碼自動駕駛和機器人數據。它提供了一組可組合的 React 組件，對 XVIZ 數據進行可視化和交互。

4 大型模型訓練平臺

模型訓練平臺，主要是機器學習（深度學習）而言，前面亞馬遜AWS提供了自己的ML平臺SageMaker。我們知道最早有開源的軟件Caffe，目前最流行的是Tensorflow和Pytorch（Caffe2并入）。

Tensorflow

Pytorch

在云平臺部署深度學習模型訓練，一般采用分布式。按照并行方式，分布式訓練一般分為數據并行和模型并行兩種。當然，也可采用數據并行和模型并行的混合。

模型并行：不同GPU負責網絡模型的不同部分。例如，不同網絡層被分配到不同的GPU，或者同一層不同參數被分配到不同GPU。

數據并行：不同GPU有模型的多個副本，每個GPU分配不同的數據，將所有GPU計算結果按照某種方式合并。

模型并行不常用，而數據并行涉及各個GPU之間如何同步模型參數，分為同步更新和異步更新。同步更新等所有GPU的梯度計算完成，再計算新權值，同步新值后，再進行下一輪計算。異步更新是每個GPU梯度計算完無需等待，立即更新權值，然后同步新值進行下一輪計算。

分布式訓練系統包括兩種架構：Parameter Server Architecture（PS，參數服務器）和Ring -AllReduce Architecture（環-全歸約）。

如下圖是PS結構圖：

這個圖是Ring AllReduce的架構圖：

Pytorch現在和多個云平臺建立合作關系，可以安裝使用。比如AWS，在AWS Deep Learning AMIs、AWS Deep Learning Containers和Amazon SageMaker，都可以訓練Pytorch模型，最后采用TorchServe進行部署。

Pytorch提供兩種方法在多GPU平臺切分模型和數據：

DataParallel
distributedataparallel

DataParallel更易于使用。不過，通信是瓶頸，GPU利用率通常很低，而且不支持分布式。DistributedDataParallel支持模型并行和多進程，單機/多機都可以，是分布訓練。

PyTorch 自身提供幾種加速分布數據并行的訓練優化技術，如 bucketing gradients、overlapping computation with communication 以及 skipping gradient synchronization 等。

Tensorflow在模型設計和訓練使用也方便，可以使用高階?Keras API；對于大型機器學習訓練任務，使用?Distribution Strategy API?在不同的硬件配置上進行分布式訓練，而無需更改模型定義。

其中Estimator API?用于編寫分布式訓練代碼，允許自定義模型結構、損失函數、優化方法以及如何進行訓練、評估和導出等內容，同時屏蔽與底層硬件設備、分布式網絡數據傳輸等相關的細節。

tf.distribute.MirroredStrategy支持在一臺機器的多個 GPU 上進行同步分布式訓練。該策略會為每個 GPU 設備創建一個副本。模型中的每個變量都會在所有副本之間進行鏡像。這些變量將共同形成一個名為MirroredVariable的單個概念變量。這些變量會通過應用相同的更新彼此保持同步。

tf.distribute.experimental.MultiWorkerMirroredStrategy與MirroredStrategy非常相似。它實現了跨多個工作進程的同步分布式訓練，而每個工作進程可能有多個 GPU。與MirroredStrategy類似，它也會跨所有工作進程在每個設備的模型中創建所有變量的副本。

tf.distribute.experimental.ParameterServerStrategy支持在多臺機器上進行參數服務器PS訓練。在此設置中，有些機器會被指定為工作進程，有些會被指定為參數服務器。模型的每個變量都會被放在參數服務器上。計算會被復制到所有工作進程的所有 GPU 中。(注：該策略僅適用于 Estimator API。)

5 模型測試和檢驗

模型的測試和檢驗可以分成多種方式：

一是仿真測試檢驗。建立仿真測試環境，比如開源的一些軟件平臺：

Carla

AirSim

LGSVL

還有一些成熟的商用軟件，也可以構建仿真測試環境：Prescan和VTD。存在一些仿真子模塊，比如開源的交通流仿真方面SUMO，商用的動力學仿真方面CarSim、Trucksim和Carmaker等。測試方式包括模型在環（MIL）、軟件在環（SIL）、硬件在環（HIL）和整車在環（VIL）等。傳感器的仿真，特別是攝像頭的圖像生成，除了圖形學的渲染方式，還有基于機器學習的方式。

這里列出Uber ATG發表的一系列仿真建模論文：

“LiDARsim: Realistic LiDAR Simulation by Leveraging the Real World“

”S3: Neural Shape, Skeleton, and Skinning Fields for 3D Human Modeling“

”SceneGen: Learning to Generate Realistic Traffic Scenes“

”TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors“

”GeoSim: Realistic Video Simulation via Geometry-Aware Composition for Self-Driving“

“AdvSim: Generating Safety-Critical Scenarios for Self-Driving Vehicles“

另外谷歌Waymo最近推出的傳感器仿真工作：

”SurfelGAN: Synthesizing Realistic Sensor Data for Autonomous Driving“

二是封閉場地的實車測試檢驗。各大車企都有自己的測試基地，現在自動駕駛方面也可使用。其開銷遠大于仿真系統。

谷歌waymo測試場

三是開放場地的測試檢驗。現在好多L4級別的自動駕駛，比如無人出租車/無人卡車/無人送貨，都在做這種政府批準的實際駕駛實驗區測試。這種測試，必要時候安全員的接管或者遙控接管，都是需要花費大量投入的。

GM的自動駕駛公司Cruise在舊金山測試

最后是用戶的測試檢驗。這個是特斯拉特有的影子模式，以及FSD beta版本測試的志愿者模式。

特斯拉的“Operation Vacation”模式

如圖是英偉達報告描述的車隊級別的模型部署閉環：

4 大型模型訓練平臺

Tensorflow

Pytorch

模型并行：不同GPU負責網絡模型的不同部分。例如，不同網絡層被分配到不同的GPU，或者同一層不同參數被分配到不同GPU。

數據并行：不同GPU有模型的多個副本，每個GPU分配不同的數據，將所有GPU計算結果按照某種方式合并。

分布式訓練系統包括兩種架構：Parameter Server Architecture（PS，參數服務器）和Ring -AllReduce Architecture（環-全歸約）。

如下圖是PS結構圖：

這個圖是Ring AllReduce的架構圖：

Pytorch提供兩種方法在多GPU平臺切分模型和數據：

DataParallel
distributedataparallel

PyTorch 自身提供幾種加速分布數據并行的訓練優化技術，如 bucketing gradients、overlapping computation with communication 以及 skipping gradient synchronization 等。

5 模型測試和檢驗

模型的測試和檢驗可以分成多種方式：

一是仿真測試檢驗。建立仿真測試環境，比如開源的一些軟件平臺：

Carla

AirSim

LGSVL

這里列出Uber ATG發表的一系列仿真建模論文：

“LiDARsim: Realistic LiDAR Simulation by Leveraging the Real World“

”S3: Neural Shape, Skeleton, and Skinning Fields for 3D Human Modeling“

”SceneGen: Learning to Generate Realistic Traffic Scenes“

”TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors“

”GeoSim: Realistic Video Simulation via Geometry-Aware Composition for Self-Driving“

“AdvSim: Generating Safety-Critical Scenarios for Self-Driving Vehicles“

另外谷歌Waymo最近推出的傳感器仿真工作：

”SurfelGAN: Synthesizing Realistic Sensor Data for Autonomous Driving“

二是封閉場地的實車測試檢驗。各大車企都有自己的測試基地，現在自動駕駛方面也可使用。其開銷遠大于仿真系統。

谷歌waymo測試場

GM的自動駕駛公司Cruise在舊金山測試

最后是用戶的測試檢驗。這個是特斯拉特有的影子模式，以及FSD beta版本測試的志愿者模式。

特斯拉的“Operation Vacation”模式

如圖是英偉達報告描述的車隊級別的模型部署閉環：

6 相關的機器學習技術

最后，談一下數據閉環所采用的機器學習技術，其實就是選擇什么訓練數據和如何迭代更新模型的策略。主要有以下幾點：

主動學習
OOD檢測和Corner Case檢測
數據增強/對抗學習
遷移學習/域自適應
自動機器學習（AutoML?）/元學習（學習如何學習）
半監督學習
自監督學習
少樣本/?零樣本學習
持續學習/開放世界

下面分別討論：

1）主動學習

主動學習（active learning）的目標是找到有效的方法從無標記數據池中選擇要標記的數據，最大限度地提高準確性。主動學習通常是一個迭代過程，在每次迭代中學習模型，使用一些啟發式方法從未標記數據池中選擇一組數據進行標記。因此，有必要在每次迭代中為了大子集查詢所需標簽，這樣即使對大小適中的子集，也會產生相關樣本。

如圖是一個主動學習閉環示意圖：在無標注數據中查詢、標注所選擇數據、添加標注數據到訓練集和模型訓練。

一些方法把標注和無標注數據放在一起，故此采用監督學習和半監督學習進行訓練。

貝葉斯主動學習方法通常使用非參數模型（如高斯過程）來估計每個查詢的預期進步或一組查詢后的預期錯誤。

基于不確定性主動學習方法嘗試使用啟發式方法，比如最高熵，和決策邊界的幾何距離等來尋找困難例子（hard examples）。

如圖是英偉達基于主動學習的挖掘數據方法：

還有其他的主動學習實例方法：

“Deep Active Learning for Efficient Training of a LiDAR 3D Object Detector“

“Consistency-based Active Learning for Object Detection“

2）OOD檢測和Corner Case檢測

機器學習模型往往會在out-of-distribution（OOD) 數據上失敗。檢測OOD是確定不確定性（Uncertainty）的手段，既可以安全報警，也可以發現有價值的數據樣本。

不確定性有兩種來源：任意（aleatoric）不確定性和認知（epistemic）不確定性。

導致預測不確定性的數據不可減（Irreducible）不確定性，是一種任意不確定性（也稱為數據不確定性）。任意不確定性有兩種類型：同方差（homo-scedastic）和異方差（hetero-scedastic）。

另一類不確定性是由于知識和數據不適當造成的認知不確定性（也稱為知識/模型不確定性）。

最常用的不確定性估計方法是貝葉斯近似（Bayesian approximation）法和集成學習（ensemble learning）法。

一類 OOD 識別方法基于貝葉斯神經網絡推理，包括基于 dropout 的變分推理（variational inference）、馬爾可夫鏈蒙特卡羅 (MCMC) 和蒙特卡羅 dropout等。

另一類OOD識別方法包括 (1) ?輔助損失或NN 架構修改等訓練方法，以及 (2) 事后統計（post hoc statistics）方法。

數據樣本中有偏離正常的意外情況，即所謂的corner case。可靠地檢測此類corner case，在開發過程中，在線和離線應用都是必要的。

在線應用可以用作安全監控和警告系統，在corner case情況發生時進行識別。離線應用將corner case檢測器應用于大量收集的數據，選擇合適的訓練和相關測試數據。

最近的一些實例工作有：

“Towards Corner Case Detection for Autonomous Driving“

“Out-of-Distribution Detection for Automotive Perception“

“Corner Cases for Visual Perception in Automated Driving: Some Guidance on Detection Approaches“

3）數據增強/對抗學習

過擬合（Overfitting）是指當機器學習模型學習高方差的函數完美地對訓練數據建模時出現的現象。數據增強（Data Augmentation）增強訓練數據集的大小和質量，克服過擬合，從而構建更好的機器學習模型。

圖像數據增強算法包括幾何變換、色彩空間增強、內核過濾器、混合圖像、隨機擦除、特征空間增強、對抗訓練（adversarial training）、生成對抗網絡（generative adversarial networks，GAN）、神經風格遷移（neural style transfer）和元學習（meta-learning）。

激光雷達點云數據的增強方法還有特別的一些：全局變換（旋轉、平移、尺度化）、局部變換（旋轉、平移、尺度化）和3-D濾波。

對抗性訓練可以成為尋找增強方向的有效方法。通過限制對抗網絡（adversarial network）可用的增強和畸變變換集，通過學習得到導致錯誤的增強方式。這些增強對于加強機器學習模型中的弱點很有價值。

值得一提的是，CycleGAN?引入了一個額外的 Cycle-Consistency 損失函數，穩定 GAN 訓練，應用于圖像到圖像轉換（image-to-image translation）。實際上CycleGAN 學習從一個圖像域轉換到另一個域。

機器學習模型錯誤背后的一個常見原因是一種稱為數據集偏差或域漂移（dataset bias?/?domain shift）的現象。域適應方法試圖減輕域漂移的有害作用。對抗訓練方法引入到域適應，比如對抗鑒別域適應方法(Adversarial Discriminative Domain Adaptation，ADDA)。

最近出現的一些新實例方法：

“AutoAugment: Learning Augmentation Strategies from Data“

“Classmix: Segmentation-based Data Augmentation For Semi-supervised Learning“

“Data Augmentation for Object Detection via Differentiable Neural Rendering“

“LiDAR-Aug: A General Rendering-based Augmentation Framework for 3D Object Detection“

“Adaptive Object Detection with Dual Multi-Label Prediction“

“Taking A Closer Look at Domain Shift: Category-level Adversaries for Semantics Consistent Domain Adaptation“

4）遷移學習/域適應

遷移學習(transfer learning，TL)不需要訓練數據和測試數據是獨立同分布(independent and identically distributed，i.i.d)，目標域的模型不需要從頭開始訓練，可以減少目標域訓練數據和時間的需求。

深度學習的遷移技術基本分為兩種類型，即非對抗性的（傳統）和對抗性的。

域適應 (domain adaptation，DA) 是TL的一種特殊情況，利用一個或多個相關源域（source domains）的標記數據在目標域（target domain）執行新任務。

DA方法分為兩類：基于實例的和基于特征的。

最近出現的一些新實例方法：

“Multi-Target Domain Adaptation via Unsupervised Domain Classification for Weather Invariant Object Detection“

“Uncertainty-Aware Consistency Regularization for Cross-Domain Semantic Segmentation“

“SF-UDA3D: Source-Free Unsupervised Domain Adaptation for LiDAR-Based 3D Object Detection“

“LiDARNet: A Boundary-Aware Domain Adaptation Model for Point Cloud Semantic Segmentation“

5）自動機器學習（AutoML）/元學習（學習如何學習）

一個機器學習建模的工程還有幾個方面需要人工干預和可解釋性，即機器學習落地流水線的兩個主要組件：預-建模和后-建模（如圖）。

預-建模影響算法選擇和超參數優化過程的結果。預-建模步驟包括多個步驟，包括數據理解、數據準備和數據驗證。

后-建模模塊涵蓋了其他重要方面，包括機器學習模型的管理和部署。

為了降低這些繁重的開發成本，出現了自動化整個機器學習流水線的新概念，即開發自動機器學習（automated machine learning，AutoML) 方法。AutoML 旨在減少對數據科學家的需求，并使領域專家能夠自動構建機器學習應用程序，而無需太多統計和機器學習知識。

值得特別一提的是谷歌方法“神經架構搜索”（Neural Architecture Search，NAS），其目標是通過在預定義搜索空間中選擇和組合不同的基本組件來生成穩健且性能良好的神經網絡架構。

NAS的分布式訓練實現

NAS的總結從兩個角度了解：模型結構類型和采用超參數優化（hyperparameter optimization，HPO）的模型結構設計。最廣泛使用的 HPO 方法利用強化學習 (RL)、基于進化的算法 (EA)、梯度下降 (GD) 和貝葉斯優化 (BO)方法。

如圖是AutoML在機器學習平臺的應用實例：

注：在谷歌云、微軟云Azure和亞馬遜云AWS都支持AutoML。

深度學習（DL）專注于樣本內預測，元學習（meta learning）關注樣本外預測的模型適應問題。元學習作為附加在原始 DL 模型的泛化部分。

元學習尋求模型適應與訓練任務大不相同的未見過的任務（unseen tasks）。元強化學習 (meta-RL) 考慮代理與不斷變化的環境之間的交互過程。元模仿學習 (Meta-IL) 將過去類似的經驗應用于只有稀疏獎勵的新任務。

元學習與?AutoML?密切相關，二者有相同的研究目標，即學習工具和學習問題。現有的元學習技術根據在 AutoML 的應用可分為三類：

1）用于配置評估（對于評估者）；
2）用于配置生成（用于優化器）；
3) 用于動態配置的自適應。

元學習促進配置生成，例如，針對特定學習問題的配置、生成或選擇配置策略或細化搜索空間。元學習檢測概念漂移（concept drift）并動態調整學習工具實現自動化機器學習（AutoML）過程。

6）半監督學習

半監督學習（semi-supervised learning）是利用未標記數據生成具有可訓練模型參數的預測函數，目標是比用標記數據獲得的預測函數更準確。由于混合監督和無監督方法，半監督學習的損失函數可以具有多種形狀。一種常見的方法是添加一個監督學習的損失項和一個無監督學習的損失項。

已經有一些經典的半監督學習方法：

“Pseudo-label: The simple and efficient semi-supervised learning method for deep neural networks”
“Mean teachers are better role models: Weight-averaged consistency targets improve semi-supervised deep learning results“
“Self-training with Noisy Student improves ImageNet classification“

最近出現一些新實例方法：

“Unbiased Teacher for Semi-Supervised Object Detection“

“Pseudoseg: Designing Pseudo Labels For Semantic Segmentation“

“Semantic Segmentation of 3D LiDAR Data in Dynamic Scene Using Semi-supervised Learning“

“ST3D: Self-training for Unsupervised Domain Adaptation on 3D Object Detection“

“3DIoUMatch: Leveraging IoU Prediction for Semi-Supervised 3D Object Detection“

7）自監督學習

自監督學習（self supervised learning）算是無監督學習的一個分支，其目的是恢復，而不是發現。自監督學習基本分為：生成（generative）類, 對比（contrastive）類和生成-對比（generative-contrastive）混合類，即對抗（adversarial）類。

自監督使用借口任務（pretext task）來學習未標記數據的表示。借口任務是無監督的，但學習的表示通常不能直接給下游任務（downstream task），必須進行微調。因此，自監督學習可以被解釋為一種無監督、半監督或自定義策略。下游任務的性能用于評估學習特征的質量。

一些著名的自監督學習方法有：

“SimCLR-A Simple framework for contrastive learning of visual representations“
“Momentum Contrast for Unsupervised Visual Representation Learning“
“Bootstrap Your Own Latent: A New Approach to Self-Supervised Learning“
“Deep Clustering for Unsupervised Learning of Visual Features“
“Unsupervised Learning of Visual Features by Contrasting Cluster Assignments“

注意最近的一些新方法：

“DetCo: Unsupervised Contrastive Learning for Object Detection“

“PointContrast: Unsupervised Pre-training for 3D Point Cloud Understanding“

“MonoRUn: Monocular 3D Object Detection by Reconstruction and Uncertainty Propagation“

“Weakly Supervised Semantic Point Cloud Segmentation: Towards 10x Fewer Labels“

8）少樣本/零樣本學習

零樣本學習（Zero-shot learning，ZSL）旨在識別在訓練期間可能未見過實例的目標。雖然大多數ZSL方法都使用判別性損失（discriminative losses）進行學習，但少數生成模型（generative models）將每個類別表示為概率分布。

對于未見類（unseen classes），ZSL除了無法訪問其視覺或輔助信息的inductive設置之外，transductive方法無需訪問標簽信息，直接用已見類（seen classes）和未見類一起的視覺或語義信息。

ZSL屬于遷移學習（TL），源特征空間為訓練實例，目標特征空間為測試實例，二者特征空間一樣。但對于已見類和未見類，標簽空間是不同的。

為了從有限的監督信息中學習，一個新的機器學習方向稱為少樣本學習 (Few-Shot Learning?，FSL)。基于如何使用先驗知識，FSL可分為三個類：1）用數據先驗知識來增強監督經驗，2）通過模型先驗知識約束假設空間，和3）用算法先驗知識改變假設空間中最佳參數的搜索方式。

FSL 可以是監督學習、半監督學習和強化學習（RL），取決于除了有限的監督信息之外還有哪些數據可用。許多 FSL 方法是元學習（meta learning）方法，以此作為先驗知識。

最近的一些實例方法：

“Don’t Even Look Once: Synthesizing Features for Zero-Shot Detection“

“Zero-Shot Semantic Segmentation“

“Zero-Shot Learning on 3D Point Cloud Objects and Beyond“

“Few-Shot Object Detection and Viewpoint Estimation for Objects in the Wild“

“Self-Supervised Few-Shot Learning on Point Clouds“

“Few-shot 3D Point Cloud Semantic Segmentation“

9）持續學習/開放世界

持續學習（ continual learning）可以不斷積累不同任務得到的知識，而無需從頭開始重新訓練。其困難是如何克服災難遺忘（catastrophic forgetting）。

如圖是持續學習的方法分類：經驗重放（ER）、正則化和參數孤立三個方向。

開放集識別（Open set recognition，OSR），是在訓練時存在不完整的世界知識，在測試中可以將未知類提交給算法，要求分類器不僅要準確地對所見類進行分類，還要有效處理未見類。開放世界學習（Open world learning）可以看作是持續學習的一個子任務。

以下給出最近的一些實例方法：

“Lifelong Object Detection“

“Incremental Few-Shot Object Detection“

“Towards Open World Object Detection“

"OpenGAN: Open-Set Recognition via Open Data Generation"

“Large-Scale Long-Tailed Recognition in an Open World“

數據閉環的關鍵是數據，同時采用數據驅動的訓練模型是基礎。決定了整個自動駕駛迭代升級系統的走向是：

數據的模式（攝像頭/激光雷達/雷達，無/導航/高清地圖，姿態定位精度，時間同步標記）；
數據驅動模型（模塊/端到端）；
模型的架構（AutoML）；
模型訓練的策略（數據選擇）。

總結

以上是生活随笔為你收集整理的深度解析，教你如何打造自动驾驶的数据闭环的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： excel实战应用案例100讲（四）-E
下一篇：用户画像是怎么生成出来的？