【深度学习】用于小目标检测的一个简单高效的网络
導讀
以Tiny YOLOV3的速度達到YOLOV3的效果。
1. 介紹
本文提出一種專門用于檢測小目標的框架,框架結構如下圖:
我們探索了可以提高小目標檢測能力的3個方面:Dilated模塊,特征融合以及passthrough模塊。
Dilated Module:上下文信息對于檢測小目標是很重要的,一種方法是重復的上采樣來恢復丟失的信息,同時下采樣來擴大感受野。但是,這個過程中信息丟失是難免的,受dilated卷積的啟發,我們提出了Dilated Module,在不損失分辨率的情況下,提升感受野。
特征融合:不同層的特征圖包含不同的特征,淺層特征包含細節信息,深層特征包含語義信息,兩者對于檢測小目標都很重要,所以,對于不同的Dilated Module出來的特征圖,我們進行拼接,全部用來檢測小目標。
Passthrough Module:位置信息對于小目標也是至關重要的,我們提出了Passthrough Module從結合淺層特征圖和深層特征圖一起得到準確的位置信息。
本文的主要貢獻:
(1)提出了Dilated Module來擴大感受野,提出了Passthrough Module來利用上下文信息和小目標的位置信息??紤]到小目標的特點,用特征融合來同時獲取細節特征和語義信息,為了模型加速,使用了1x1卷積來降維。
(2)基于VEDAI數據集和DOTA 數據集,我們制作了一個small vehicle數據集,同時,分析了每個數據集的分布。
(3)我們在VEDAI數據集和DOTA 數據集上進行了訓練和評估,結果表明,我們的網絡非常的簡單,快速和高效。
2. 方法
2.1 DILATED模塊
使用Dilated卷積可以在不降低分辨率的情況下,指數的增加感受野,如圖2所示:
我們使用Dilated卷積作為基本單元,構建Dilated Module,為了重復使用之前層的特征,我們把之前層的特征通過拼接合并起來,然后使用1x1的卷積來降維,模塊結構如下:
2.2 PASSTHROUGH模塊
為了可以利用到之前的層的信息,我們使用了stride為2的passthrough層,這個passthrough層將特征圖從2N×2N×C轉換為N×N×4C,過程如圖4,左邊是passthrough層的輸入,右邊是passthrough層的輸出:
我們使用passthrough層作為基本單元,構建了passthrough module,具體結構見圖5,LayerA表示之前的層,LayerB表示當前的更深一點的層:
2.3 特征融合
本文使用拼接的方式來融合淺層特征和深層特征,框架里有2種特征融合的方法,一種是在不同的Dilated Module之間進行特征融合,此時,特征圖的分辨率是相同的,直接拼接就可以。見圖6。還有一種是類似passthrough module,中間有降采樣的過程,特征圖的分辨率已經改變了,如果要拼接的話,就需要進行通過passthrough層或者上采樣層。這里選用了passthrough層來進行融合。
2.4 網絡結構
我們這個網絡的目標是檢測小目標,太多的下采樣層對于檢測小目標并不好,但是,下采樣層的個數又直接影響到感受野的大小。所以,這里,我們使用了2個dilated模塊(Dilated module A 和 Dilated module B ?),特征圖下采樣2次,然后和使用passthrough module下采樣3次的特征圖進行融合,為了加速,每次拼接之后,使用1x1卷積進行降維。最后一層進行結果的預測,尺寸為,這里,為每個網格點預測的框的數量,默認是3。
感受野的計算公式:
如表3所示,使用了2個Dilated卷積的網絡,只下采樣3次,感受野和下采樣4次的網絡一樣。
3. 實驗
我們分析了VEDAI數據集和DOTA 數據集的數據分布:
在VEDAI數據集上,設計了2種實驗,實驗1是將‘car’, ‘pick-up’和 ‘van’ ?合并成了1個類別,實驗2是使用了原來的9個類別,結果如下,結果明顯好于YOLOv2和Tiny YOLOv3,但是低于YOLOv3:
在DOTA數據集上的比較:
不同網絡的速度的比較:
可以看到,模型速度和Tiny YOLOv3相當,準確率大大超過Tiny YOLOv3,僅僅比YOLOv3略低。
—END—
往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載機器學習的數學基礎專輯黃海廣老師《機器學習課程》課件合集 本站qq群851320808,加入微信群請掃碼:總結
以上是生活随笔為你收集整理的【深度学习】用于小目标检测的一个简单高效的网络的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何实现RTSP/RTMP流接入到RTS
- 下一篇: 【深度学习】什么是目标检测中的平均精度均