日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

【深度学习】用于小目标检测的一个简单高效的网络

發(fā)布時間:2025/3/12 81 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【深度学习】用于小目标检测的一个简单高效的网络 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

導(dǎo)讀

以Tiny YOLOV3的速度達到Y(jié)OLOV3的效果。

1. 介紹

本文提出一種專門用于檢測小目標的框架,框架結(jié)構(gòu)如下圖:

我們探索了可以提高小目標檢測能力的3個方面:Dilated模塊,特征融合以及passthrough模塊。

Dilated Module:上下文信息對于檢測小目標是很重要的,一種方法是重復(fù)的上采樣來恢復(fù)丟失的信息,同時下采樣來擴大感受野。但是,這個過程中信息丟失是難免的,受dilated卷積的啟發(fā),我們提出了Dilated Module,在不損失分辨率的情況下,提升感受野。

特征融合:不同層的特征圖包含不同的特征,淺層特征包含細節(jié)信息,深層特征包含語義信息,兩者對于檢測小目標都很重要,所以,對于不同的Dilated Module出來的特征圖,我們進行拼接,全部用來檢測小目標。

Passthrough Module:位置信息對于小目標也是至關(guān)重要的,我們提出了Passthrough Module從結(jié)合淺層特征圖和深層特征圖一起得到準確的位置信息。

本文的主要貢獻:

(1)提出了Dilated Module來擴大感受野,提出了Passthrough Module來利用上下文信息和小目標的位置信息。考慮到小目標的特點,用特征融合來同時獲取細節(jié)特征和語義信息,為了模型加速,使用了1x1卷積來降維。

(2)基于VEDAI數(shù)據(jù)集和DOTA 數(shù)據(jù)集,我們制作了一個small vehicle數(shù)據(jù)集,同時,分析了每個數(shù)據(jù)集的分布。

(3)我們在VEDAI數(shù)據(jù)集和DOTA 數(shù)據(jù)集上進行了訓(xùn)練和評估,結(jié)果表明,我們的網(wǎng)絡(luò)非常的簡單,快速和高效。

2. 方法

2.1 DILATED模塊

使用Dilated卷積可以在不降低分辨率的情況下,指數(shù)的增加感受野,如圖2所示:

我們使用Dilated卷積作為基本單元,構(gòu)建Dilated Module,為了重復(fù)使用之前層的特征,我們把之前層的特征通過拼接合并起來,然后使用1x1的卷積來降維,模塊結(jié)構(gòu)如下:

2.2 PASSTHROUGH模塊

為了可以利用到之前的層的信息,我們使用了stride為2的passthrough層,這個passthrough層將特征圖從2N×2N×C轉(zhuǎn)換為N×N×4C,過程如圖4,左邊是passthrough層的輸入,右邊是passthrough層的輸出:

我們使用passthrough層作為基本單元,構(gòu)建了passthrough module,具體結(jié)構(gòu)見圖5,LayerA表示之前的層,LayerB表示當前的更深一點的層:

2.3 特征融合

本文使用拼接的方式來融合淺層特征和深層特征,框架里有2種特征融合的方法,一種是在不同的Dilated Module之間進行特征融合,此時,特征圖的分辨率是相同的,直接拼接就可以。見圖6。還有一種是類似passthrough module,中間有降采樣的過程,特征圖的分辨率已經(jīng)改變了,如果要拼接的話,就需要進行通過passthrough層或者上采樣層。這里選用了passthrough層來進行融合。

2.4 網(wǎng)絡(luò)結(jié)構(gòu)

我們這個網(wǎng)絡(luò)的目標是檢測小目標,太多的下采樣層對于檢測小目標并不好,但是,下采樣層的個數(shù)又直接影響到感受野的大小。所以,這里,我們使用了2個dilated模塊(Dilated module A 和 Dilated module B ?),特征圖下采樣2次,然后和使用passthrough module下采樣3次的特征圖進行融合,為了加速,每次拼接之后,使用1x1卷積進行降維。最后一層進行結(jié)果的預(yù)測,尺寸為,這里,為每個網(wǎng)格點預(yù)測的框的數(shù)量,默認是3。

感受野的計算公式:

如表3所示,使用了2個Dilated卷積的網(wǎng)絡(luò),只下采樣3次,感受野和下采樣4次的網(wǎng)絡(luò)一樣。

3. 實驗

我們分析了VEDAI數(shù)據(jù)集和DOTA 數(shù)據(jù)集的數(shù)據(jù)分布:

在VEDAI數(shù)據(jù)集上,設(shè)計了2種實驗,實驗1是將‘car’, ‘pick-up’和 ‘van’ ?合并成了1個類別,實驗2是使用了原來的9個類別,結(jié)果如下,結(jié)果明顯好于YOLOv2和Tiny YOLOv3,但是低于YOLOv3:

在DOTA數(shù)據(jù)集上的比較:

不同網(wǎng)絡(luò)的速度的比較:

可以看到,模型速度和Tiny YOLOv3相當,準確率大大超過Tiny YOLOv3,僅僅比YOLOv3略低。

—END—

往期精彩回顧適合初學(xué)者入門人工智能的路線及資料下載機器學(xué)習(xí)及深度學(xué)習(xí)筆記等資料打印機器學(xué)習(xí)在線手冊深度學(xué)習(xí)筆記專輯《統(tǒng)計學(xué)習(xí)方法》的代碼復(fù)現(xiàn)專輯 AI基礎(chǔ)下載機器學(xué)習(xí)的數(shù)學(xué)基礎(chǔ)專輯黃海廣老師《機器學(xué)習(xí)課程》課件合集 本站qq群851320808,加入微信群請掃碼:

總結(jié)

以上是生活随笔為你收集整理的【深度学习】用于小目标检测的一个简单高效的网络的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。