目标检测近5年发展历程概述(转)
目標(biāo)檢測近5年發(fā)展歷程概述,從R-CNN到RFBNet(2013--2018)(轉(zhuǎn))
2018年09月24日 12:32:02?C小C?【時(shí)間】2018.09.24
【題目】目標(biāo)檢測近5年發(fā)展歷程概述,從R-CNN到RFBNet(2013--2018)
目錄
概述
一、目標(biāo)檢測相關(guān)背景
1.1 目標(biāo)檢測的類別
1 .2 目標(biāo)檢測遇到的主要難題
1.3 過去二十年的進(jìn)展
二、 框架
2.1框架發(fā)展歷程
2.2一些里程碑式的框架
三、基礎(chǔ)性子問題
3.1 基于 DCNN 的目標(biāo)表示
3.2 形境建模
3.3 檢測提議 (detection proposal)方法
3.4? 訓(xùn)練策略和處理類別不平衡問題
四、數(shù)據(jù)集和表現(xiàn)評(píng)估
4.1用于目標(biāo)識(shí)別的常用數(shù)據(jù)庫
4.2常用指標(biāo)匯總
五、總結(jié)
概述
? ? 今天,看到了《Deep Learning for Generic Object Detection: A Survey》這一篇論文, 對用于一般目標(biāo)檢測的深度學(xué)習(xí)技術(shù)進(jìn)行了全面系統(tǒng)的總結(jié)。本文是對論文的相關(guān)內(nèi)容的梗概,希望以此作為自己在目標(biāo)識(shí)別方面的學(xué)習(xí)歷程和方向的指引。本文主要作為各種相關(guān)知識(shí)的索引,如若想要了解相關(guān)細(xì)節(jié),請閱讀原文,或者通過此索引獲得關(guān)鍵詞,再進(jìn)行相關(guān)內(nèi)容的搜索。
論文鏈接:https://arxiv.org/abs/1809.02165
? 此外,來自首爾國立大學(xué)的 Lee hoseong 在近期開源了「deep learning object detection」GitHub 項(xiàng)目,正是參考該論文開發(fā)的。項(xiàng)目鏈接是:?https://github.com/hoya012/deep_learning_object_detection#2014
?
一、目標(biāo)檢測相關(guān)背景
1.1 目標(biāo)檢測的類別
一般目標(biāo)檢測(即一般目標(biāo)類別檢測)也被稱為目標(biāo)類別檢測 [240] 或目標(biāo)分類檢測,其定義如下。給定一張圖像,確定其中是否存在多個(gè)預(yù)定義類別的任何目標(biāo)實(shí)例;如果存在,就返回每個(gè)實(shí)例的空間位置和覆蓋范圍。
圖3、與通用目標(biāo)檢測相關(guān)的識(shí)別問題(A)圖像級(jí)對象分類,(B)包圍框級(jí)通用對象檢測,(C)像素級(jí)語義分割,(D)實(shí)例級(jí)語義分割。
1?.2 目標(biāo)檢測遇到的主要難題
圖5。同一類圖像的外觀隨成像條件的變化而變化(a-g)。一個(gè)對象類(H)的含義有一個(gè)驚人的變化。相反,(I)中的四幅圖像看起來非常相似,但實(shí)際上是來自四種不同的對象類別。來自ImageNet[179]和Coco女士[129]的圖像。
1.3 過去二十年的進(jìn)展
圖2、目標(biāo)檢測和識(shí)別的里程碑,包括特征表示 [37, 42, 79, 109, 114, 139, 140, 166, 191, 194, 200, 213, 215]、檢測框架 [56, 65, 183, 209, 213] 和數(shù)據(jù)集 [53, 129, 179]。在 2012 年之前,主導(dǎo)方法都還是人工設(shè)計(jì)的特征。我們看到,隨著 Krizhevsky et al. [109] 為圖像分類開發(fā)出了 DCNN,2012 年迎來了轉(zhuǎn)折。這里列出的大多數(shù)方法都得到了大量引用并至少贏得了一個(gè) ICCV 或 CVPR 的主要獎(jiǎng)項(xiàng)。詳見 2.3 節(jié)。
?
?
二、 框架
2.1框架發(fā)展歷程
在這一節(jié),我們會(huì)回顧一般目標(biāo)檢測領(lǐng)域在深度學(xué)習(xí)進(jìn)入這一領(lǐng)域后出現(xiàn)的里程碑檢測框架,如圖 6 所示,?詳細(xì)情況總結(jié)在表 10 中(請看原論文最后一頁)。整體而言,這些檢測器可以分為兩大主要類別:
1. 兩級(jí)式檢測框架,包含一個(gè)用于區(qū)域提議的預(yù)處理步驟,使得整體流程是兩級(jí)式的。
2. 單級(jí)式檢測框架,即無區(qū)域提議的框架,這是一種單獨(dú)提出的方法,不會(huì)將檢測提議分開,使得整個(gè)流程是單級(jí)式的。
圖 6:一般目標(biāo)檢測的里程碑,基于第一個(gè) arXiv 版本的時(shí)間點(diǎn)
2.2一些里程碑式的框架
?
圖 7:里程碑檢測框架 RCNN [65, 67] 的細(xì)節(jié)圖示
?
圖 8:用于一般目標(biāo)檢測的領(lǐng)先框架的高層面示意圖。表 10 總結(jié)了這些方法的特性。
?
三、基礎(chǔ)性子問題
3.1 基于 DCNN 的目標(biāo)表示
作為任何測器的主要組件之一,優(yōu)良的特征表示在目標(biāo)檢測中至關(guān)重要。
? ? ? ? ??
?
表 2:常用于一般目標(biāo)檢測的 DCNN 架構(gòu)。對于 #Paras 和 #Layers 的統(tǒng)計(jì)數(shù)據(jù),我們沒有考慮最后的 FC 預(yù)測層。「Test Error」一列給出了在 ImageNet1000 上的 Top 5 分類測試誤差。解釋:OverFeat(準(zhǔn)確的模型)、DenseNet201(Growth Rate 32, DenseNet-BC)以及 ResNeXt50(32*4d)。
? ? ???
表 3:在改進(jìn)用于一般目標(biāo)檢測的 DCNN 特征表示中的表征方法的特性總結(jié)。詳細(xì)討論參見 4.1.2 節(jié)。縮寫:Selective Search(SS)、EdgeBoxes(EB)、InceptionResNet(IRN)。mAP@IoU=0.5 時(shí),在 VOC07、VOC12 和 COCO 上報(bào)告的檢測結(jié)果;另一列在 COCO 上的結(jié)果是在一個(gè)新指標(biāo) mAP@IoU=[0.5 : 0.05 : 0.95] 上報(bào)告的,這是在從 0.5 到 0.95(寫成 [0.5:0.95])的不同 IoU 閾值上平均求取 mAP。訓(xùn)練數(shù)據(jù):07 表示 VOC2007 trainval,12 表示 VOC2012 trainval,07+12 表示 VOC07 和 VOC12 trainval 的并集,07++12 表示 VOC07 trainval、VOC07 test 和 VOC12 trainval 的并集,07++12+CO 表示 VOC07 trainval、VOC07 test、VOC12 trainval 和 COCO trainval 的并集。COCO 檢測結(jié)果是在 COCO2015 Test-Dev 上報(bào)告的,只有 MPN [233] 除外,其結(jié)果基于 COCO2015 Test-Standard。
?
3.2 形境建模
在物理世界中,視覺目標(biāo)通常會(huì)出現(xiàn)在特定的環(huán)境中,并且通常與其它相關(guān)目標(biāo)共同存在,而且有強(qiáng)大的心理學(xué)證據(jù) [13, 9] 表明形境在人類目標(biāo)識(shí)別中發(fā)揮著關(guān)鍵性的作用。形境大致可分為這三大類 [13, 59]:
1. 形義形境:目標(biāo)出現(xiàn)在某些場景而非其它場景中的可能性;
2. 空間形境:在場景中目標(biāo)與其它物體存在某些位置關(guān)系而非其它位置關(guān)系的可能性;
3. 尺寸形境:在場景中目標(biāo)相對其它物體所存在的尺寸限制。
表 4:使用了形境信息的檢測器匯總,類似表 3
圖 13:能探索局部周圍形境特征的代表性方法:MRCNN [62]、GBDNet [235, 236]、ACCNN [123] 和 CoupleNet [251],參見表 4
3.3 檢測提議?(detection proposal)方法
檢測提議(detection proposal)通常被用作一個(gè)預(yù)處理步驟,以通過限制需要檢測器評(píng)估的區(qū)域的數(shù)量來降低計(jì)算的復(fù)雜性。一個(gè)優(yōu)良的檢測提議應(yīng)當(dāng)具備以下特點(diǎn):
1. 高召回率,只使用少量提議就可以實(shí)現(xiàn);
2. 提議盡可能準(zhǔn)確地匹配目標(biāo);
3. 高效率。
表 5:使用 DCNN 的目標(biāo)提議方法匯總。藍(lán)色數(shù)字表示目標(biāo)提議的數(shù)量。除非另有說明,在 COCO 上的檢測結(jié)果都使用了 mAP@IoU[0.5, 0.95]。
?
圖 14:[175] 中提出的區(qū)域提議網(wǎng)絡(luò)(RPN)圖示
3.4? 訓(xùn)練策略和處理類別不平衡問題
四、數(shù)據(jù)集和表現(xiàn)評(píng)估
4.1用于目標(biāo)識(shí)別的常用數(shù)據(jù)庫
?
表 7:用于目標(biāo)識(shí)別的常用數(shù)據(jù)庫
圖15、常用數(shù)據(jù)庫的一些例子
4.2常用指標(biāo)匯總
表 9:用于評(píng)估目標(biāo)檢測器的常用指標(biāo)匯總
五、總結(jié)
一般目標(biāo)檢測是計(jì)算機(jī)視覺領(lǐng)域內(nèi)一個(gè)重要且有挑戰(zhàn)性的問題,并且已經(jīng)得到了相當(dāng)大的關(guān)注。盡管過去幾年取得了巨大的成功(比如檢測準(zhǔn)確度從 ILSVRC2013 的 23% 顯著提升至了 ILSVRC2017 的 73%),但當(dāng)前最佳方法的表現(xiàn)與人類水平仍有巨大差距,尤其是在開放世界學(xué)習(xí)任務(wù)上。還有很多研究工作有待完成,我們可以看到研究者的關(guān)注重點(diǎn)主要集中在以下八個(gè)領(lǐng)域:
1. 開放世界學(xué)習(xí)(?Open World Learning)
2. 更好更高效的檢測框架(Better and More Efficient Detection Frameworks)
3. 緊湊高效的深度 CNN 特征(CompactandEfficientDeepCNNFeatures)
4. 穩(wěn)健的目標(biāo)表征(RobustObjectRepresentations)
5. 形境推理(?Context Reasoning)
6. 目標(biāo)實(shí)例分割(?Object Instance Segmentation)
7. 弱監(jiān)督或無監(jiān)督學(xué)習(xí)() Weakly Supervised or Unsupervised Learning)
8. 三維目標(biāo)檢測(3D Object Detection)
轉(zhuǎn)載于:https://www.cnblogs.com/ciao/articles/10892921.html
總結(jié)
以上是生活随笔為你收集整理的目标检测近5年发展历程概述(转)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 大数据技术原理与应用 第1章 大数据概述
- 下一篇: 目标检测的图像特征提取之(一)Hog特征