日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

论文导读:DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution

發布時間:2024/3/24 54 豆豆
生活随笔 收集整理的這篇文章主要介紹了 论文导读:DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

論文導讀:DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution

Abstract

許多現在的目標檢測方法通過兩次尋找搜索展示卓越的性能,這篇文章的主要原理是在 目標檢測的backbone設計上。在宏觀層面,我們提出Recursive Feature Pyramid(遞歸特征金字塔):包括從FPN提出額外的反饋連接進入up-bottom backbone layers。從微觀層面,我們提出Switchable Atrous Convolution:conv 具有不同 atrous rate 的特征,并使用開關功能收集結果。

Introduction

許多有名的兩階段目標檢測器,像Faster R-CNN,首先輸出物體建議框,然后基于區域特征去提取檢測到到物體。沿著同樣的方向,Cascade R-CNN 建立了一個多階段檢測器,后續的檢測器heads與更多的選擇性實例進行訓練。
我們的方法,在宏觀層面:Recursive Feature Pyramid 基于FPN頂部,從FPN提出額外的反饋連接到up-bottom backbone layers。將遞歸結構展開為順序執。類似于Cascade R-CNN中的cascade檢測器,選擇性的運用實例進行訓練,我們的RFP遞歸加強FPN去創建更多強表達力的特征。像Deeply-Supervised Nets一樣,反饋連接生成的特征從檢測器頭部直接接收梯度到低級別的bottom-up backbone中,進而加快訓練速度和提高精度。
在微觀方面,我們提出Switchable Atrous Convolution(SAC),通過同樣輸入特征和不同的atrous rate進行卷積,并且在收集結果處添加了開關功能。這個開關功能依賴于空間性,每一個特征映射地區可以有不同的開關區控制SAC的輸出。在檢測器上使用SAC,我們轉化了bottom-up backbone中所有以3*3為基準的卷積層為SAC,大量的提高了檢測器的性能。一些之前的方法采取了有條件的卷積,例如結合不同結果的卷積層作為單個輸出,不像這些需要從頭開始的架構,SAC提出了提供一種簡便轉化預訓練模型的標準卷積網絡。此外,在SAC中使用了新的權重鎖定原理,除了可訓練的差異,不同atrous卷積的權重都相同。

Recursive Feature Pyramid

1.1 Recursive Feature Pyramid

回歸特征金字塔是在FPN的基礎上,采用反饋連接方式,將單次經過FPN的輸出特征作為輸入再次進入FPN(與ResNet相似)。

FPN結構如下圖所示,它包含了四種結構:bottom-up,up-down,lateral connection,feature fusion.
bottom-up : 原始的FPN結構是以resnet為backbone,將輸入圖片經過網絡結構輸出為不同大小的特征圖,C1,C2,C3,C4,C5在各自基礎上h_size/2,w_size/2.bottom-up目的是提取出含有更多語義信息的特征圖。

up-down: 將C5進行1x1卷積成P5,較少通道數(即減少了運算參數)。對P5進行最鄰近上采樣(h_size2,w_size2)成P4,P3,P2,目的是得到和對應的C4,C3,C2相同大小w*h尺寸矩陣。

lateral connection: 把C4,C3,C2進行1*1Conv后生成P4’,P3’,P2’,目的是得到和特征圖P4,P3,P2相同通道數的特征。

feature fusion: 把經過上采樣后的P4,P3,P2與經過11Conv后的P4’,P3’,P2’相加。得到的P4’‘,P3’‘,P2’‘。將相加后的結果進行33卷積,因為在簡單的進行對應通道的逐位置相加會出現特征堆疊的情況,用3*3卷積結果處理后可以有效的融合相加后的特征。

RFP是把經過FPN后的特征結果反饋連接到FPN的bottom-up層作為輸入的一部分,和ResNet相似,這樣可以有效的融合輸入特征,引導函數往更正確的方向前進,檢測提高了精度。

1.2 ASPP as the Connecting Module

原文鏈接:語義分割ASPP
空洞空間卷積池化金字塔(atrous spatial pyramid pooling (ASPP))對所給定的輸入以不同采樣率的空洞卷積并行采樣,相當于以多個比例捕捉圖像的上下文。


上圖為deeplab v2的ASPP模塊,deeplabv3中向ASPP中添加了BN層,其中空洞卷積的rate的意思是在普通卷積的基礎上,相鄰權重之間的間隔為rate-1, 普通卷積的rate默認為1,所以空洞卷積的實際大小為k + (k ? 1) ( rate ? 1) k+(k-1)(rate-1)k+(k?1)(rate?1),其中k為原始卷積核大小。
這篇文章是用ASPP(atrous spatial pyramid pooling)作為連接函數,如下圖:

不是簡單的將上層金字塔的輸出作為輸入進入下一層的迭代(這里把RFP看成由多個FPN組成的疊加網絡,宏觀上,每個圖像金字塔和特征金字塔可以看為一層),ASPP作為中間結點(上圖中綠點),通過空洞卷積函數將上層輸出做運算,轉化為下層輸入。原文結構不再詳解。如代碼鏈接:DetectoRS-github鏈接

1.3 Output Update by the Fusion Module

如上圖所示,Fusion Module是把上層輸出和本層輸出更好的融合起來,通過卷積和sigmoid激活函數。

2.Switchable Atrous Convolution


總結

以上是生活随笔為你收集整理的论文导读:DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。