日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) >

Cascade R-CNN的一些记录

發(fā)布時(shí)間:2025/3/16 43 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Cascade R-CNN的一些记录 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

Cascade R-CNN的一些記錄

《Cascade R-CNN: Delving into High Quality Object Detection》CVPR2018的一篇文章

論文鏈接:https://arxiv.org/abs/1712.00726?
代碼鏈接:https://github.com/zhaoweicai/cascade-rcnn

參考鏈接:https://blog.csdn.net/qq_21949357/article/details/80046867

本文主要針對(duì)的是目標(biāo)檢測(cè)問(wèn)題中的IoU閾值選取問(wèn)題,眾所周知,閾值選取越大就越容易得到高質(zhì)量的樣本,但是一味選取高的閾值會(huì)引發(fā)兩個(gè)問(wèn)題:

  • 樣本減少引發(fā)的過(guò)擬合
  • 在train和inference使用不一樣的閾值很容易導(dǎo)致mismatch。(只有輸入的region proposal自身的IOU值和訓(xùn)練器訓(xùn)練用的設(shè)定IOU閾值較為接近的時(shí)候,訓(xùn)練器輸出的IOU值才會(huì)高即性能才好)

為了解決上述兩個(gè)問(wèn)題就提出了一種基于Faster-RCNN的muti-stage的architecture,核心就是利用不斷提高的閾值,在保證正例樣本數(shù)不減少的情況下訓(xùn)練出高質(zhì)量的檢測(cè)器

Abstract

  • 在目標(biāo)檢測(cè)中需要一個(gè)IOU值來(lái)區(qū)分樣本的正負(fù)樣例,檢測(cè)器使用較低的IOU值訓(xùn)練時(shí)會(huì)產(chǎn)生噪聲監(jiān)測(cè),但是使用的IOU閾值變大時(shí)會(huì)造成檢測(cè)效果下降,這主要由兩個(gè)原因造成,IOU值變大時(shí)正例樣本指數(shù)級(jí)消失導(dǎo)致過(guò)擬合在train和inference使用不一樣的閾值很容易導(dǎo)致mismatch
  • 級(jí)聯(lián)RCNN包括一系列IOU逐漸增大的檢測(cè)器,并且是一步一步訓(xùn)練,上一個(gè)檢測(cè)器的輸出作為下一個(gè)檢測(cè)器的輸入,因?yàn)閷?duì)一個(gè)檢測(cè)器來(lái)說(shuō)輸出的IOU值會(huì)比輸入的IOU更高。
  • 1 Introduction

  • 目標(biāo)檢測(cè)兩個(gè)主要問(wèn)題:識(shí)別分類問(wèn)題,從背景中識(shí)別前景物體并正確分類;定位問(wèn)題,給不同的目標(biāo)準(zhǔn)確的邊界框。
  • 級(jí)聯(lián)R-CNN的來(lái)源:一個(gè)檢測(cè)器只能在一個(gè)質(zhì)量水平(quality level)上表現(xiàn)的很好,這是從代價(jià)敏感學(xué)習(xí)中得出的:ROC曲線不同點(diǎn)的優(yōu)化需要不同的損失函數(shù),不同的是論文中是優(yōu)化IOU閾值而不是假陽(yáng)率。
  • 從圖中看出,如果提供高質(zhì)量(高IOU)的輸入則檢測(cè)器也有較好的效果,但是隨著輸入數(shù)據(jù)的IOU的持續(xù)升高,檢測(cè)器效果會(huì)下降(因?yàn)檫^(guò)擬合),
  • 級(jí)聯(lián)R-CNN可以用任意的兩步階段結(jié)構(gòu)的R-CNN建立。
  • 2 Related Work

    RetinaNet解決密集物體檢測(cè),前景和背景極端不平衡問(wèn)題,并取得了比兩步的目標(biāo)檢測(cè)更好的效果。

    3、Object Detection

    基于Faster-RCNN,第一步proposal subnetwork(RPN網(wǎng)絡(luò))生成候選框H0,第二步是ROI池化層H1,將不同大小候選框在特征圖上的映射patch,把映射的patch采樣成固定大小的特征,和SPP類似,但只是用一個(gè)尺度(一個(gè)patch不論大小就劃分為4個(gè)部分)進(jìn)行劃分。分類器是C,邊界框是B

    3.1 Bounding box regression

    邊界框b=(bx,by,bw,bh),邊界框回歸f(x,b)的作用是從候選邊界框中選出目標(biāo)邊界框,邊界框的損失函數(shù)在faster-RCNN中是L1損失函數(shù),并通常用均值和方差正則化處理。在FatserRCNN中一個(gè)單獨(dú)的邊界框回歸器f不能解決精確定位的問(wèn)題,所以使用Bbox,但是Bbox中IOU的值固定(單一閾值即使用的是完全相同的級(jí)聯(lián)結(jié)構(gòu)),所以IOU的值不一定一直是最優(yōu)的,并且邊界框的分布隨每次迭代變化很大。

    (C0的結(jié)果是anchor中有目標(biāo)或者沒(méi)有目標(biāo))

    3.2 Classification

    分類器的函數(shù)是h(x),h(x)是后驗(yàn)概率的M+1維估計(jì),hk(x) = p(y = k|x),通過(guò)最小化交叉熵?fù)p失來(lái)學(xué)習(xí),

    3.3 Detection Quality

    如果IOU的值大于給定閾值,則認(rèn)為這個(gè)patch是這個(gè)類中的一個(gè)。

    當(dāng)給定的IOU閾值大時(shí),正例中包含很少的背景,但是正例數(shù)量會(huì)很少;當(dāng)小時(shí),容易產(chǎn)生接近但不正確的判斷(假陽(yáng)率高)。解決方法:傳統(tǒng)最容易想到的是使用分類器的集成,如圖c,Iterative Loss實(shí)際上沒(méi)有級(jí)聯(lián)結(jié)構(gòu),從c圖可以看出來(lái),它只是使用了不同的閾值來(lái)進(jìn)行分類,然后融合他們的結(jié)果進(jìn)行分類推理,并沒(méi)有同時(shí)進(jìn)行BBox reg,因此沒(méi)有解決 不同數(shù)量的正例數(shù)應(yīng)對(duì)應(yīng)不同的損失 的問(wèn)題。

    ?

    4、Cascade R-CNN

    與Bbox不同的是,級(jí)聯(lián)RCnn通過(guò)重采樣改變了不同階段的輸入假設(shè)分布,并且通過(guò)重采樣保證了每個(gè)階段有足夠固定數(shù)量的正例樣本數(shù)。這就實(shí)現(xiàn)了沒(méi)有過(guò)擬合和更深層的訓(xùn)練階段可以有更高的IOU閾值.

    • cascaded regression通過(guò)調(diào)整閾值的方式重采樣,不斷改變候選框region proposal的分布,而且cascaded重采樣后的每個(gè)檢測(cè)器,都對(duì)重采樣后的樣本proposals是最優(yōu)的,沒(méi)有mismatch問(wèn)題。
    • cascaded在train和inference時(shí)都會(huì)使用,因此并沒(méi)有偏差問(wèn)題。

      其實(shí)像我這樣的入門者有很多不懂之處,歡迎指正。

    總結(jié)

    以上是生活随笔為你收集整理的Cascade R-CNN的一些记录的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

    如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。