日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 >

Fater R-CNN 整体把握

發(fā)布時間:2024/7/23 65 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Fater R-CNN 整体把握 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

在R-CNN中提到過,候選區(qū)域的提取和之后的目標(biāo)檢測其實是獨(dú)立的,所以我們可以使用任意的算法如SS。Fast-RCNN改進(jìn)的是目標(biāo)檢測部分,但是其實候選區(qū)域的提取也挺費(fèi)時的,Faster R-CNN就把改進(jìn)方向放在了這里。

我們已經(jīng)領(lǐng)略到了CNN的強(qiáng)大,所以Faster R-CNN把提取候選框的任務(wù)也交給神經(jīng)網(wǎng)絡(luò)來做。我們把完成這一任務(wù)的神經(jīng)網(wǎng)絡(luò)叫做Region Proposal Network(RPN)。

可以看到在Faster R-CNN中候選框的提取不再是第一步。在RPN之前已經(jīng)有一個CNN用于生成feature map,CNN中包括一系列卷積(Conv+Relu)和池化(Pooling)操作,卷積層的操作由RPN和Fast RCNN共享(提升速度)。在CNN最后一個卷積層后面才是RPN,RPN在feature map上得到候選區(qū)域。RPN引入了多尺度Anchor。通過Softmax對anchors屬于目標(biāo)(foreground)還是背景(background)進(jìn)行分類判決,并使用Bounding Box Regression對anchors進(jìn)行回歸預(yù)測,獲取Proposal的精確位置,并用于后續(xù)的目標(biāo)識別與檢測。簡單來說和之后的目標(biāo)檢測一樣,就是分類+回歸,不同的是這里的分類只需要判斷是目標(biāo)還是背景,不需要知道具體的類別。

除了CNNRPN。還有兩個重要部分:

RoIPooling,綜合卷積層特征feature maps和候選框proposal的信息,將propopal在輸入圖像中的坐標(biāo)映射到最后一層feature map(conv5-3)中,對feature map中的對應(yīng)區(qū)域進(jìn)行池化操作,得到固定大小(7×7)輸出的池化結(jié)果,并與后面的全連接層相連。池化的主要目的還是得到大小固定的向量,便于輸入神經(jīng)網(wǎng)絡(luò)。原始的對候選框中圖像進(jìn)行大小歸一化的方法是crop和warp。

可以看到兩種方法都有失真。所以我們換了一種思路,沒必要對圖像大小歸一化,只需要對它們形成的向量歸一化就好了。M×N尺度,將proposal的坐標(biāo)映射到M16×N16大小的conv5-3中,然后將Proposal在conv5-3的對應(yīng)區(qū)域水平和豎直均分為7等份,并對每一份進(jìn)行Max Pooling或Average Pooling處理,得到固定大小(7×7)輸出的池化結(jié)果,實現(xiàn)固定長度輸出(fixed-length output),如下圖所示。水平和豎直方向分別是7等分就可以,不必使得水平和豎直的每一塊大小都相同,最后使用最大池化或者平均池化,使得每一塊不管大小,都只有一個輸出,則得到了統(tǒng)一的7x7的大小。

Classificationand Regression: 全連接層后接兩個子連接層——分類層(cls)和回歸層(reg),分類層用于判斷Proposal的類別,回歸層則通過boundingbox regression預(yù)測Proposal的準(zhǔn)確位置。https://blog.csdn.net/Zachary_Co/article/details/78890768

還沒有仔細(xì)了解一下ss方法,現(xiàn)在先來看一下RPN。RPN使用一個3x3的卷積核,在feature map上滑動窗口。但是Anchor不是指這個3x3的核,而是3x3卷積核在滑動的過程中,將核中心位置映射回輸入圖像,生成的3種尺度(scale 邊長為128,256,512的正方形),3種長寬比(aspect ratio 1:1,1:2,2:1),共9種的候選框。特征圖conv5-3每個位置都對應(yīng)9個anchors,如果featuremap的大小為W×H,則一共有W×H×9個anchors,滑動窗口的方式保證能夠關(guān)聯(lián)conv5-3的全部特征空間,最后在原圖上得到多尺度多長寬比的anchors。


因為在候選框的提取RPN和目標(biāo)檢測Fast R-CNN中都需要進(jìn)行分類classification和回歸Regression,所以一共需要4個損失函數(shù)。

Reference:

1.??????https://www.cnblogs.com/skyfsm/p/6806246.html

2.??????https://blog.csdn.net/Zachary_Co/article/details/78890768

總結(jié)

以上是生活随笔為你收集整理的Fater R-CNN 整体把握的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。