當前位置：首頁 >

【深度学习】用于小目标检测的一个简单高效的网络

發(fā)布時間：2025/3/12 81 豆豆

生活随笔收集整理的這篇文章主要介紹了【深度学习】用于小目标检测的一个简单高效的网络小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

導(dǎo)讀

以Tiny YOLOV3的速度達到Y(jié)OLOV3的效果。

1. 介紹

本文提出一種專門用于檢測小目標的框架，框架結(jié)構(gòu)如下圖：

我們探索了可以提高小目標檢測能力的3個方面：Dilated模塊，特征融合以及passthrough模塊。

Dilated Module：上下文信息對于檢測小目標是很重要的，一種方法是重復(fù)的上采樣來恢復(fù)丟失的信息，同時下采樣來擴大感受野。但是，這個過程中信息丟失是難免的，受dilated卷積的啟發(fā)，我們提出了Dilated Module，在不損失分辨率的情況下，提升感受野。

特征融合：不同層的特征圖包含不同的特征，淺層特征包含細節(jié)信息，深層特征包含語義信息，兩者對于檢測小目標都很重要，所以，對于不同的Dilated Module出來的特征圖，我們進行拼接，全部用來檢測小目標。

Passthrough Module：位置信息對于小目標也是至關(guān)重要的，我們提出了Passthrough Module從結(jié)合淺層特征圖和深層特征圖一起得到準確的位置信息。

本文的主要貢獻：

（1）提出了Dilated Module來擴大感受野，提出了Passthrough Module來利用上下文信息和小目標的位置信息。考慮到小目標的特點，用特征融合來同時獲取細節(jié)特征和語義信息，為了模型加速，使用了1x1卷積來降維。

（2）基于VEDAI數(shù)據(jù)集和DOTA 數(shù)據(jù)集，我們制作了一個small vehicle數(shù)據(jù)集，同時，分析了每個數(shù)據(jù)集的分布。

（3）我們在VEDAI數(shù)據(jù)集和DOTA 數(shù)據(jù)集上進行了訓(xùn)練和評估，結(jié)果表明，我們的網(wǎng)絡(luò)非常的簡單，快速和高效。

2. 方法

2.1 DILATED模塊

使用Dilated卷積可以在不降低分辨率的情況下，指數(shù)的增加感受野，如圖2所示：

我們使用Dilated卷積作為基本單元，構(gòu)建Dilated Module，為了重復(fù)使用之前層的特征，我們把之前層的特征通過拼接合并起來，然后使用1x1的卷積來降維，模塊結(jié)構(gòu)如下：

2.2 PASSTHROUGH模塊

為了可以利用到之前的層的信息，我們使用了stride為2的passthrough層，這個passthrough層將特征圖從2N×2N×C轉(zhuǎn)換為N×N×4C，過程如圖4，左邊是passthrough層的輸入，右邊是passthrough層的輸出：

我們使用passthrough層作為基本單元，構(gòu)建了passthrough module，具體結(jié)構(gòu)見圖5，LayerA表示之前的層，LayerB表示當前的更深一點的層：

2.3 特征融合

本文使用拼接的方式來融合淺層特征和深層特征，框架里有2種特征融合的方法，一種是在不同的Dilated Module之間進行特征融合，此時，特征圖的分辨率是相同的，直接拼接就可以。見圖6。還有一種是類似passthrough module，中間有降采樣的過程，特征圖的分辨率已經(jīng)改變了，如果要拼接的話，就需要進行通過passthrough層或者上采樣層。這里選用了passthrough層來進行融合。

2.4 網(wǎng)絡(luò)結(jié)構(gòu)

我們這個網(wǎng)絡(luò)的目標是檢測小目標，太多的下采樣層對于檢測小目標并不好，但是，下采樣層的個數(shù)又直接影響到感受野的大小。所以，這里，我們使用了2個dilated模塊（Dilated module A 和 Dilated module B ?），特征圖下采樣2次，然后和使用passthrough module下采樣3次的特征圖進行融合，為了加速，每次拼接之后，使用1x1卷積進行降維。最后一層進行結(jié)果的預(yù)測，尺寸為，這里，為每個網(wǎng)格點預(yù)測的框的數(shù)量，默認是3。

感受野的計算公式：

如表3所示，使用了2個Dilated卷積的網(wǎng)絡(luò)，只下采樣3次，感受野和下采樣4次的網(wǎng)絡(luò)一樣。

3. 實驗

我們分析了VEDAI數(shù)據(jù)集和DOTA 數(shù)據(jù)集的數(shù)據(jù)分布：

在VEDAI數(shù)據(jù)集上，設(shè)計了2種實驗，實驗1是將‘car’, ‘pick-up’和 ‘van’ ?合并成了1個類別，實驗2是使用了原來的9個類別，結(jié)果如下，結(jié)果明顯好于YOLOv2和Tiny YOLOv3，但是低于YOLOv3：

在DOTA數(shù)據(jù)集上的比較：

不同網(wǎng)絡(luò)的速度的比較：

可以看到，模型速度和Tiny YOLOv3相當，準確率大大超過Tiny YOLOv3，僅僅比YOLOv3略低。

—END—

往期精彩回顧適合初學(xué)者入門人工智能的路線及資料下載機器學(xué)習(xí)及深度學(xué)習(xí)筆記等資料打印機器學(xué)習(xí)在線手冊深度學(xué)習(xí)筆記專輯《統(tǒng)計學(xué)習(xí)方法》的代碼復(fù)現(xiàn)專輯 AI基礎(chǔ)下載機器學(xué)習(xí)的數(shù)學(xué)基礎(chǔ)專輯黃海廣老師《機器學(xué)習(xí)課程》課件合集本站qq群851320808，加入微信群請掃碼：

總結(jié)

以上是生活随笔為你收集整理的【深度学习】用于小目标检测的一个简单高效的网络的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：如何实现RTSP/RTMP流接入到RTS
下一篇：【深度学习】什么是目标检测中的平均精度均