Cascade R-CNN的一些记录
Cascade R-CNN的一些記錄
《Cascade R-CNN: Delving into High Quality Object Detection》CVPR2018的一篇文章
論文鏈接:https://arxiv.org/abs/1712.00726?
代碼鏈接:https://github.com/zhaoweicai/cascade-rcnn
參考鏈接:https://blog.csdn.net/qq_21949357/article/details/80046867
本文主要針對(duì)的是目標(biāo)檢測(cè)問(wèn)題中的IoU閾值選取問(wèn)題,眾所周知,閾值選取越大就越容易得到高質(zhì)量的樣本,但是一味選取高的閾值會(huì)引發(fā)兩個(gè)問(wèn)題:
- 樣本減少引發(fā)的過(guò)擬合
- 在train和inference使用不一樣的閾值很容易導(dǎo)致mismatch。(只有輸入的region proposal自身的IOU值和訓(xùn)練器訓(xùn)練用的設(shè)定IOU閾值較為接近的時(shí)候,訓(xùn)練器輸出的IOU值才會(huì)高即性能才好)
為了解決上述兩個(gè)問(wèn)題就提出了一種基于Faster-RCNN的muti-stage的architecture,核心就是利用不斷提高的閾值,在保證正例樣本數(shù)不減少的情況下訓(xùn)練出高質(zhì)量的檢測(cè)器
Abstract
1 Introduction
2 Related Work
RetinaNet解決密集物體檢測(cè),前景和背景極端不平衡問(wèn)題,并取得了比兩步的目標(biāo)檢測(cè)更好的效果。
3、Object Detection
基于Faster-RCNN,第一步proposal subnetwork(RPN網(wǎng)絡(luò))生成候選框H0,第二步是ROI池化層H1,將不同大小候選框在特征圖上的映射patch,把映射的patch采樣成固定大小的特征,和SPP類似,但只是用一個(gè)尺度(一個(gè)patch不論大小就劃分為4個(gè)部分)進(jìn)行劃分。分類器是C,邊界框是B
3.1 Bounding box regression
邊界框b=(bx,by,bw,bh),邊界框回歸f(x,b)的作用是從候選邊界框中選出目標(biāo)邊界框,邊界框的損失函數(shù)在faster-RCNN中是L1損失函數(shù),并通常用均值和方差正則化處理。在FatserRCNN中一個(gè)單獨(dú)的邊界框回歸器f不能解決精確定位的問(wèn)題,所以使用Bbox,但是Bbox中IOU的值固定(單一閾值即使用的是完全相同的級(jí)聯(lián)結(jié)構(gòu)),所以IOU的值不一定一直是最優(yōu)的,并且邊界框的分布隨每次迭代變化很大。
(C0的結(jié)果是anchor中有目標(biāo)或者沒(méi)有目標(biāo))
3.2 Classification
分類器的函數(shù)是h(x),h(x)是后驗(yàn)概率的M+1維估計(jì),hk(x) = p(y = k|x),通過(guò)最小化交叉熵?fù)p失來(lái)學(xué)習(xí),
3.3 Detection Quality
如果IOU的值大于給定閾值,則認(rèn)為這個(gè)patch是這個(gè)類中的一個(gè)。
當(dāng)給定的IOU閾值大時(shí),正例中包含很少的背景,但是正例數(shù)量會(huì)很少;當(dāng)小時(shí),容易產(chǎn)生接近但不正確的判斷(假陽(yáng)率高)。解決方法:傳統(tǒng)最容易想到的是使用分類器的集成,如圖c,Iterative Loss實(shí)際上沒(méi)有級(jí)聯(lián)結(jié)構(gòu),從c圖可以看出來(lái),它只是使用了不同的閾值來(lái)進(jìn)行分類,然后融合他們的結(jié)果進(jìn)行分類推理,并沒(méi)有同時(shí)進(jìn)行BBox reg,因此沒(méi)有解決 不同數(shù)量的正例數(shù)應(yīng)對(duì)應(yīng)不同的損失 的問(wèn)題。
?
4、Cascade R-CNN
與Bbox不同的是,級(jí)聯(lián)RCnn通過(guò)重采樣改變了不同階段的輸入假設(shè)分布,并且通過(guò)重采樣保證了每個(gè)階段有足夠固定數(shù)量的正例樣本數(shù)。這就實(shí)現(xiàn)了沒(méi)有過(guò)擬合和更深層的訓(xùn)練階段可以有更高的IOU閾值.
- cascaded regression通過(guò)調(diào)整閾值的方式重采樣,不斷改變候選框region proposal的分布,而且cascaded重采樣后的每個(gè)檢測(cè)器,都對(duì)重采樣后的樣本proposals是最優(yōu)的,沒(méi)有mismatch問(wèn)題。
- cascaded在train和inference時(shí)都會(huì)使用,因此并沒(méi)有偏差問(wèn)題。
其實(shí)像我這樣的入門者有很多不懂之處,歡迎指正。
總結(jié)
以上是生活随笔為你收集整理的Cascade R-CNN的一些记录的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Faster-RCNN的一些记录。
- 下一篇: AUC、Precision、Recall