目标又多又密?多轮迭代的方式进行密集目标检测
點擊上方“AI搞事情”關注我們
?
論文:IterDet: Iterative Scheme for ObjectDetection in Crowded Environments
代碼:https://github.com/saic-vul/iterdet
簡介
2020年5月莫斯科三星AI研究院提出的文章,針對密集目標進行檢測,密集目標檢測的難點在于既要檢測出不同的目標,又要抑制重復目標框的產生。作者提出了一種「迭代檢測」的方案,不論單步檢測器還是多步檢測器,只需要在訓練和推理上做很少的修改,就能簡單高效地檢測出密集目標。
迭代檢測,不用保證每次迭代的召回率,早期,檢測部分目標子集,后期將檢測的結果和圖像再一次輸入網絡,使檢出的目標不再被檢測到,迭代檢測出復雜的目標子集。
黃色框為二次迭代檢測結果方法
模型結構如何迭代
,輸入圖像:,history map?為空,檢測器? 將輸入和映射為一系列邊框。
「history map 映射方式」:每個像素點的目標個數。?
,輸入圖像:,history map? 由映射而得,檢測器將輸入和映射為一系列邊框;
結束標志:以此類推,直到達到迭代次數或當前迭代未檢測到新目標,即時,結束迭代。
那么最后的檢測結果就是每次迭代檢測出的目標的全集,即:
要想實現上述方案,有兩點必須解決:1)如何將一個檢測器轉換為對歷史檢測敏感的新檢測器;2)如何讓新檢測器在不同的迭代下檢測出不同的目標子集。
訓練過程
隨機地將標注目標框分為:和兩個集合,且,將制作為history map?,使得模型訓練來利用已有的目標框信息,預測缺失的目標框集合,同時,通過不同隨機劃分和,還可以達到了數據增強的效果。
數據集:
AdaptIS:包含兩個子集Toy V1和Toy V2,用于實力分割任務而生成的數據集,現有標注可以使其用于目標檢測,且每張圖片平均有30個目標,大部分有重疊情況,絕對是一個密集目標檢測的數據集。
「Toy V1」:訓練集、驗證集分別有2000和10000張圖像,大小為:96×96。
「Toy V2」:訓練集、驗證集和測試集分別有25000, 1000和1000張,圖片大小為128×128。
「CrowdHuman」:訓練集、驗證集和測試集分別有15000, 4370和5000張圖片,平均每張圖的人物數量達到了22.64個,遠大于其他主流的人體檢測數據集,其中,每個目標有三個標注框:full body, visible body 和 head。官網:www.crowdhuman.org
同人體檢測數據集的容量、密度和多樣性 (為了公平比較,只顯示訓練子集的統計信息)圖片樣例「WiderPerson」:訓練集、驗證集和測試集分別有8000,1000和4382張圖片,共5個類別:pedestrians, riders, partially visible persons, crowd 和 ignored regions。作者在訓練和測試時,將后四類合并為了一類。
官網:www.cbsr.ia.ac.cn/users/sfzhang/WiderPerson
實現細節
采用香港中文大學-商湯科技聯合實驗室開源的基于Pytorch實現的深度學習目標檢測工具箱mmdetection,倉庫地址:
https://github.com/open-mmlab/mmdetection
,預訓練模型包含單步檢測器的RetinaNet和兩步檢測器FasterRCNN,兩者的BackBone均采用ResNet-50的默認訓練參數,優化器采用Adam,學習率learning rate為0.0001 。
此外,作者修改了兩個個地方:1)FPN中每個卷積層之后添加了Batch Normalization;2)未凍結ResNet的第一個block,因為在這個block之前添加了歷史映射和可訓練的卷積層。
實驗指標與結果如下:
搞事情
今年5月,2020 CrowdHuman人體檢測大賽啟動上線,本屆比賽是CrowdHuman人體檢測賽的第二期,數據集應該就是論文中的CrowdHuman數據集。官方基于上述論文方法公布了baseline,具體可見:【Ranking第7名,2020 CrowdHuman大賽Baseline發布】
git地址:https://github.com/thuwyh/BAAI-2020-CrowdHuman-Baseline
一些檢測結果:
往期推薦
DeepHSV:號稱可以商用的計算機筆跡鑒別算法
CVPR 2019筆跡識別論文:逆鑒別網絡+八路Attention
PolarMask:單階段實例分割框架,FCOS進階!
真正意義的Anchor-Free,FCOS目標檢測算法了解一下
眨眼算什么,讓蒙娜麗莎像你一樣嘮上嗑才算硬核
抖音同款白眼特效,DeepWarp讓蒙拉麗莎對你眨眨眼
長按二維碼關注我們
有趣的靈魂在等你
總結
以上是生活随笔為你收集整理的目标又多又密?多轮迭代的方式进行密集目标检测的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 利用python分析了下乘风破浪的姐姐
- 下一篇: 你看我还有机会吗?这么GAN让我秃然荒了