當(dāng)前位置：首頁(yè) >

Cascade R-CNN的一些记录

發(fā)布時(shí)間：2025/3/16 43 豆豆

生活随笔收集整理的這篇文章主要介紹了 Cascade R-CNN的一些记录小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

Cascade R-CNN的一些記錄

《Cascade R-CNN: Delving into High Quality Object Detection》CVPR2018的一篇文章

論文鏈接：https://arxiv.org/abs/1712.00726?
代碼鏈接：https://github.com/zhaoweicai/cascade-rcnn

參考鏈接：https://blog.csdn.net/qq_21949357/article/details/80046867

本文主要針對(duì)的是目標(biāo)檢測(cè)問(wèn)題中的IoU閾值選取問(wèn)題，眾所周知，閾值選取越大就越容易得到高質(zhì)量的樣本，但是一味選取高的閾值會(huì)引發(fā)兩個(gè)問(wèn)題：

樣本減少引發(fā)的過(guò)擬合
在train和inference使用不一樣的閾值很容易導(dǎo)致mismatch。(只有輸入的region proposal自身的IOU值和訓(xùn)練器訓(xùn)練用的設(shè)定IOU閾值較為接近的時(shí)候，訓(xùn)練器輸出的IOU值才會(huì)高即性能才好)

為了解決上述兩個(gè)問(wèn)題就提出了一種基于Faster-RCNN的muti-stage的architecture，核心就是利用不斷提高的閾值，在保證正例樣本數(shù)不減少的情況下訓(xùn)練出高質(zhì)量的檢測(cè)器

Abstract

在目標(biāo)檢測(cè)中需要一個(gè)IOU值來(lái)區(qū)分樣本的正負(fù)樣例，檢測(cè)器使用較低的IOU值訓(xùn)練時(shí)會(huì)產(chǎn)生噪聲監(jiān)測(cè)，但是使用的IOU閾值變大時(shí)會(huì)造成檢測(cè)效果下降，這主要由兩個(gè)原因造成，IOU值變大時(shí)正例樣本指數(shù)級(jí)消失導(dǎo)致過(guò)擬合和在train和inference使用不一樣的閾值很容易導(dǎo)致mismatch。

級(jí)聯(lián)RCNN包括一系列IOU逐漸增大的檢測(cè)器，并且是一步一步訓(xùn)練，上一個(gè)檢測(cè)器的輸出作為下一個(gè)檢測(cè)器的輸入，因?yàn)閷?duì)一個(gè)檢測(cè)器來(lái)說(shuō)輸出的IOU值會(huì)比輸入的IOU更高。

1 Introduction

目標(biāo)檢測(cè)兩個(gè)主要問(wèn)題：識(shí)別分類問(wèn)題，從背景中識(shí)別前景物體并正確分類；定位問(wèn)題，給不同的目標(biāo)準(zhǔn)確的邊界框。

級(jí)聯(lián)R-CNN的來(lái)源：一個(gè)檢測(cè)器只能在一個(gè)質(zhì)量水平（quality level）上表現(xiàn)的很好，這是從代價(jià)敏感學(xué)習(xí)中得出的：ROC曲線不同點(diǎn)的優(yōu)化需要不同的損失函數(shù)，不同的是論文中是優(yōu)化IOU閾值而不是假陽(yáng)率。

從圖中看出，如果提供高質(zhì)量（高IOU）的輸入則檢測(cè)器也有較好的效果，但是隨著輸入數(shù)據(jù)的IOU的持續(xù)升高，檢測(cè)器效果會(huì)下降（因?yàn)檫^(guò)擬合），

級(jí)聯(lián)R-CNN可以用任意的兩步階段結(jié)構(gòu)的R-CNN建立。

2 Related Work

RetinaNet解決密集物體檢測(cè)，前景和背景極端不平衡問(wèn)題，并取得了比兩步的目標(biāo)檢測(cè)更好的效果。

3、Object Detection

基于Faster-RCNN，第一步proposal subnetwork（RPN網(wǎng)絡(luò)）生成候選框H0，第二步是ROI池化層H1，將不同大小候選框在特征圖上的映射patch，把映射的patch采樣成固定大小的特征，和SPP類似，但只是用一個(gè)尺度（一個(gè)patch不論大小就劃分為4個(gè)部分）進(jìn)行劃分。分類器是C，邊界框是B

3.1 Bounding box regression

邊界框b=（bx,by,bw,bh）,邊界框回歸f(x,b)的作用是從候選邊界框中選出目標(biāo)邊界框，邊界框的損失函數(shù)在faster-RCNN中是L1損失函數(shù)，并通常用均值和方差正則化處理。在FatserRCNN中一個(gè)單獨(dú)的邊界框回歸器f不能解決精確定位的問(wèn)題，所以使用Bbox，但是Bbox中IOU的值固定（單一閾值即使用的是完全相同的級(jí)聯(lián)結(jié)構(gòu)），所以IOU的值不一定一直是最優(yōu)的，并且邊界框的分布隨每次迭代變化很大。

(C0的結(jié)果是anchor中有目標(biāo)或者沒(méi)有目標(biāo))

3.2 Classification

分類器的函數(shù)是h（x），h（x）是后驗(yàn)概率的M+1維估計(jì)，hk(x) = p(y = k|x)，通過(guò)最小化交叉熵?fù)p失來(lái)學(xué)習(xí)，

3.3 Detection Quality

如果IOU的值大于給定閾值，則認(rèn)為這個(gè)patch是這個(gè)類中的一個(gè)。

當(dāng)給定的IOU閾值大時(shí)，正例中包含很少的背景，但是正例數(shù)量會(huì)很少；當(dāng)小時(shí)，容易產(chǎn)生接近但不正確的判斷（假陽(yáng)率高）。解決方法：傳統(tǒng)最容易想到的是使用分類器的集成，如圖c，Iterative Loss實(shí)際上沒(méi)有級(jí)聯(lián)結(jié)構(gòu)，從c圖可以看出來(lái)，它只是使用了不同的閾值來(lái)進(jìn)行分類，然后融合他們的結(jié)果進(jìn)行分類推理，并沒(méi)有同時(shí)進(jìn)行BBox reg，因此沒(méi)有解決不同數(shù)量的正例數(shù)應(yīng)對(duì)應(yīng)不同的損失的問(wèn)題。

4、Cascade R-CNN

與Bbox不同的是，級(jí)聯(lián)RCnn通過(guò)重采樣改變了不同階段的輸入假設(shè)分布，并且通過(guò)重采樣保證了每個(gè)階段有足夠固定數(shù)量的正例樣本數(shù)。這就實(shí)現(xiàn)了沒(méi)有過(guò)擬合和更深層的訓(xùn)練階段可以有更高的IOU閾值.

cascaded regression通過(guò)調(diào)整閾值的方式重采樣，不斷改變候選框region proposal的分布，而且cascaded重采樣后的每個(gè)檢測(cè)器，都對(duì)重采樣后的樣本proposals是最優(yōu)的，沒(méi)有mismatch問(wèn)題。
cascaded在train和inference時(shí)都會(huì)使用，因此并沒(méi)有偏差問(wèn)題。

其實(shí)像我這樣的入門者有很多不懂之處，歡迎指正。

總結(jié)

以上是生活随笔為你收集整理的Cascade R-CNN的一些记录的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

CNN
Cascade

上一篇： Faster-RCNN的一些记录。
下一篇： AUC、Precision、Recall

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

Cascade R-CNN的一些记录

Cascade R-CNN的一些記錄

《Cascade R-CNN: Delving into High Quality Object Detection》CVPR2018的一篇文章

總結(jié)