當前位置：首頁 >

论文导读：DetectoRS： Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution

發布時間：2024/3/24 54 豆豆

生活随笔收集整理的這篇文章主要介紹了论文导读：DetectoRS： Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

論文導讀：DetectoRS： Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution

Abstract

許多現在的目標檢測方法通過兩次尋找搜索展示卓越的性能，這篇文章的主要原理是在目標檢測的backbone設計上。在宏觀層面，我們提出Recursive Feature Pyramid(遞歸特征金字塔):包括從FPN提出額外的反饋連接進入up-bottom backbone layers。從微觀層面，我們提出Switchable Atrous Convolution：conv 具有不同 atrous rate 的特征，并使用開關功能收集結果。

Introduction

許多有名的兩階段目標檢測器，像Faster R-CNN，首先輸出物體建議框，然后基于區域特征去提取檢測到到物體。沿著同樣的方向，Cascade R-CNN 建立了一個多階段檢測器，后續的檢測器heads與更多的選擇性實例進行訓練。
我們的方法，在宏觀層面：Recursive Feature Pyramid 基于FPN頂部，從FPN提出額外的反饋連接到up-bottom backbone layers。將遞歸結構展開為順序執。類似于Cascade R-CNN中的cascade檢測器，選擇性的運用實例進行訓練，我們的RFP遞歸加強FPN去創建更多強表達力的特征。像Deeply-Supervised Nets一樣，反饋連接生成的特征從檢測器頭部直接接收梯度到低級別的bottom-up backbone中，進而加快訓練速度和提高精度。
在微觀方面，我們提出Switchable Atrous Convolution(SAC)，通過同樣輸入特征和不同的atrous rate進行卷積，并且在收集結果處添加了開關功能。這個開關功能依賴于空間性，每一個特征映射地區可以有不同的開關區控制SAC的輸出。在檢測器上使用SAC，我們轉化了bottom-up backbone中所有以3*3為基準的卷積層為SAC，大量的提高了檢測器的性能。一些之前的方法采取了有條件的卷積，例如結合不同結果的卷積層作為單個輸出，不像這些需要從頭開始的架構，SAC提出了提供一種簡便轉化預訓練模型的標準卷積網絡。此外，在SAC中使用了新的權重鎖定原理，除了可訓練的差異，不同atrous卷積的權重都相同。

Recursive Feature Pyramid

1.1 Recursive Feature Pyramid

回歸特征金字塔是在FPN的基礎上，采用反饋連接方式，將單次經過FPN的輸出特征作為輸入再次進入FPN(與ResNet相似)。

FPN結構如下圖所示，它包含了四種結構：bottom-up,up-down,lateral connection,feature fusion.
bottom-up : 原始的FPN結構是以resnet為backbone，將輸入圖片經過網絡結構輸出為不同大小的特征圖，C1,C2,C3,C4,C5在各自基礎上h_size/2,w_size/2.bottom-up目的是提取出含有更多語義信息的特征圖。

up-down: 將C5進行1x1卷積成P5，較少通道數（即減少了運算參數）。對P5進行最鄰近上采樣(h_size2,w_size2)成P4,P3,P2,目的是得到和對應的C4,C3,C2相同大小w*h尺寸矩陣。

lateral connection: 把C4,C3,C2進行1*1Conv后生成P4’,P3’,P2’,目的是得到和特征圖P4,P3,P2相同通道數的特征。

feature fusion：把經過上采樣后的P4,P3,P2與經過11Conv后的P4’,P3’,P2’相加。得到的P4’‘，P3’‘，P2’‘。將相加后的結果進行33卷積，因為在簡單的進行對應通道的逐位置相加會出現特征堆疊的情況，用3*3卷積結果處理后可以有效的融合相加后的特征。

RFP是把經過FPN后的特征結果反饋連接到FPN的bottom-up層作為輸入的一部分，和ResNet相似，這樣可以有效的融合輸入特征，引導函數往更正確的方向前進，檢測提高了精度。

1.2 ASPP as the Connecting Module

原文鏈接：語義分割ASPP
空洞空間卷積池化金字塔(atrous spatial pyramid pooling (ASPP))對所給定的輸入以不同采樣率的空洞卷積并行采樣，相當于以多個比例捕捉圖像的上下文。

上圖為deeplab v2的ASPP模塊，deeplabv3中向ASPP中添加了BN層，其中空洞卷積的rate的意思是在普通卷積的基礎上，相鄰權重之間的間隔為rate-1, 普通卷積的rate默認為1，所以空洞卷積的實際大小為k + (k ? 1) ( rate ? 1) k+(k-1)(rate-1)k+(k?1)(rate?1)，其中k為原始卷積核大小。
這篇文章是用ASPP(atrous spatial pyramid pooling)作為連接函數，如下圖：

不是簡單的將上層金字塔的輸出作為輸入進入下一層的迭代（這里把RFP看成由多個FPN組成的疊加網絡，宏觀上，每個圖像金字塔和特征金字塔可以看為一層），ASPP作為中間結點(上圖中綠點）,通過空洞卷積函數將上層輸出做運算，轉化為下層輸入。原文結構不再詳解。如代碼鏈接：DetectoRS-github鏈接

1.3 Output Update by the Fusion Module

如上圖所示，Fusion Module是把上層輸出和本層輸出更好的融合起來，通過卷積和sigmoid激活函數。

2.Switchable Atrous Convolution

總結

以上是生活随笔為你收集整理的论文导读：DetectoRS： Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： sounds音标软件Android,So
下一篇： 360路由上线：周红衣和他的小盒子们