當前位置：首頁 > 人工智能 > 目标检测 >内容正文

目标检测

目标又多又密？多轮迭代的方式进行密集目标检测

發布時間：2025/1/21 目标检测 157 豆豆

生活随笔收集整理的這篇文章主要介紹了目标又多又密？多轮迭代的方式进行密集目标检测小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

點擊上方“AI搞事情”關注我們

論文：IterDet: Iterative Scheme for ObjectDetection in Crowded Environments
代碼：https://github.com/saic-vul/iterdet

簡介

2020年5月莫斯科三星AI研究院提出的文章，針對密集目標進行檢測，密集目標檢測的難點在于既要檢測出不同的目標，又要抑制重復目標框的產生。作者提出了一種「迭代檢測」的方案，不論單步檢測器還是多步檢測器，只需要在訓練和推理上做很少的修改，就能簡單高效地檢測出密集目標。

迭代檢測，不用保證每次迭代的召回率，早期，檢測部分目標子集，后期將檢測的結果和圖像再一次輸入網絡，使檢出的目標不再被檢測到，迭代檢測出復雜的目標子集。

黃色框為二次迭代檢測結果

方法

模型結構

如何迭代

，輸入圖像：，history map?為空，檢測器? 將輸入和映射為一系列邊框。

「history map 映射方式」：每個像素點的目標個數。?

，輸入圖像：，history map? 由映射而得，檢測器將輸入和映射為一系列邊框；

結束標志：以此類推，直到達到迭代次數或當前迭代未檢測到新目標，即時，結束迭代。

那么最后的檢測結果就是每次迭代檢測出的目標的全集，即：

要想實現上述方案，有兩點必須解決：1）如何將一個檢測器轉換為對歷史檢測敏感的新檢測器；2）如何讓新檢測器在不同的迭代下檢測出不同的目標子集。

訓練過程

隨機地將標注目標框分為：和兩個集合，且，將制作為history map?，使得模型訓練來利用已有的目標框信息，預測缺失的目標框集合，同時，通過不同隨機劃分和，還可以達到了數據增強的效果。

數據集：

AdaptIS：包含兩個子集Toy V1和Toy V2，用于實力分割任務而生成的數據集，現有標注可以使其用于目標檢測，且每張圖片平均有30個目標，大部分有重疊情況，絕對是一個密集目標檢測的數據集。
「Toy V1」：訓練集、驗證集分別有2000和10000張圖像，大小為：96×96。
「Toy V2」：訓練集、驗證集和測試集分別有25000, 1000和1000張，圖片大小為128×128。

樣例數據

「CrowdHuman」：訓練集、驗證集和測試集分別有15000, 4370和5000張圖片，平均每張圖的人物數量達到了22.64個，遠大于其他主流的人體檢測數據集，其中，每個目標有三個標注框：full body, visible body 和 head。官網：www.crowdhuman.org

同人體檢測數據集的容量、密度和多樣性（為了公平比較，只顯示訓練子集的統計信息）圖片樣例

「WiderPerson」：訓練集、驗證集和測試集分別有8000,1000和4382張圖片，共5個類別：pedestrians, riders, partially visible persons, crowd 和 ignored regions。作者在訓練和測試時，將后四類合并為了一類。
官網：www.cbsr.ia.ac.cn/users/sfzhang/WiderPerson

不同場景和密度的樣例

實現細節

采用香港中文大學-商湯科技聯合實驗室開源的基于Pytorch實現的深度學習目標檢測工具箱mmdetection，倉庫地址：
https://github.com/open-mmlab/mmdetection
，預訓練模型包含單步檢測器的RetinaNet和兩步檢測器FasterRCNN，兩者的BackBone均采用ResNet-50的默認訓練參數，優化器采用Adam，學習率learning rate為0.0001 。

此外，作者修改了兩個個地方：1）FPN中每個卷積層之后添加了Batch Normalization；2）未凍結ResNet的第一個block，因為在這個block之前添加了歷史映射和可訓練的卷積層。

實驗指標與結果如下：

AdaptIS數據集指標CrowdHuman數據集指標WiderPerson數據集指標

實驗結果

搞事情

今年5月，2020 CrowdHuman人體檢測大賽啟動上線，本屆比賽是CrowdHuman人體檢測賽的第二期，數據集應該就是論文中的CrowdHuman數據集。官方基于上述論文方法公布了baseline，具體可見：【Ranking第7名，2020 CrowdHuman大賽Baseline發布】

git地址：https://github.com/thuwyh/BAAI-2020-CrowdHuman-Baseline
一些檢測結果：

往期推薦

DeepHSV：號稱可以商用的計算機筆跡鑒別算法
CVPR 2019筆跡識別論文：逆鑒別網絡+八路Attention
PolarMask：單階段實例分割框架，FCOS進階！
真正意義的Anchor-Free，FCOS目標檢測算法了解一下
眨眼算什么，讓蒙娜麗莎像你一樣嘮上嗑才算硬核
抖音同款白眼特效，DeepWarp讓蒙拉麗莎對你眨眨眼

長按二維碼關注我們

有趣的靈魂在等你

總結

以上是生活随笔為你收集整理的目标又多又密？多轮迭代的方式进行密集目标检测的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：利用python分析了下乘风破浪的姐姐
下一篇：你看我还有机会吗？这么GAN让我秃然荒了