日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 >

空间金字塔池化SPP

發(fā)布時間:2025/4/5 44 豆豆
生活随笔 收集整理的這篇文章主要介紹了 空间金字塔池化SPP 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

空間金字塔池化

1.提出的原因

下面這里是我們在網(wǎng)上反復(fù)可以看見的話(所以關(guān)鍵是理解這些內(nèi)容):
提出的原因:
在SPP提出之前,傳統(tǒng)的網(wǎng)絡(luò)具有它有兩大缺點:
1、通常需要輸入固定大小的圖片來進(jìn)行訓(xùn)練和測試。對于大小不一的圖片,需要經(jīng)過裁剪,或者縮放等一系列操作,將其變?yōu)榻y(tǒng)一的尺寸。但是這樣往往會降低識別檢測的精度。**
2、計算量較大,嚴(yán)重影響速度R-CNN預(yù)設(shè)1000~2000個候選區(qū)域 (采用Selective Search 方法),并分別在每個候選區(qū)域進(jìn)行特征提取。這個想想就害怕,因為圖片上有些區(qū)域會被重復(fù)采樣多次。

1.1兩點不足是和什么比較?

這里我們要首先理解傳統(tǒng)網(wǎng)絡(luò)是什么意思?他是干什么的?
之前的模型是指R-CNN,這個模型大約就是用于從圖片中提取出那些是一個特定的物體的區(qū)域,整個過程是:
1)首先,使用算法來找出各種候選的區(qū)域
2)之后,我們使用卷積網(wǎng)絡(luò)來對這些區(qū)域進(jìn)行特征提取
3)完成特征提取之后,我們要將其轉(zhuǎn)化為全連接層進(jìn)行處理(當(dāng)時還沒有FCN這種好東西)
4)最后,經(jīng)過全連接層才得出我們的結(jié)果。
R-CNN就是后面的2)3)4)

1.2理解第一個不足

在R-CNN模型中最關(guān)鍵的一個問題是,在模型當(dāng)中我們是對前面得出來的候選區(qū)域進(jìn)行特征提取,這些候選區(qū)域大小可是并不一樣啊。所以被迫全部的訓(xùn)練上一次。
那么這個原因里面說的其實和R-CNN沒有太大聯(lián)系,說的是秦始皇時代圖像識別模型定義好之后,只能對某一種確定大小的內(nèi)容進(jìn)行識別,這個就要求我們更改圖片,更改圖片的話:首先,會降低精度;其次,這個更改的過程憑空增加了很多的工作量。所以,也期待著有一種可以處理不同大小圖片的模型出現(xiàn)。

1.3理解第二個不足

因為R-CNN是對候選區(qū)域進(jìn)行驗證,每個大小又不一樣,所以我們被迫全部重新訓(xùn)練一次,所以訓(xùn)練次數(shù)就會非常爆炸,每次forward過程中就相當(dāng)于進(jìn)行了1000-2000次forward。
當(dāng)然這里的1000-2000是R-CNN自己規(guī)定的,但是你想精度差不多,這個數(shù)據(jù)也不能太小

2.金字塔池化

這個金字塔池化,一定可以找到下面的這個圖片


我們前面說過這個模型提出非常早,在2014年,那時候還沒有FCN這個東西,所以最后使用的是一個全連接,我們注意全連接這個東西最后必須是一個確定長度的輸入,不可以是可以變化的,所以圖片大小改變的話我們必須改變我們的模型。
這就要求我們必須是確定一種轉(zhuǎn)換方式將不同大小的圖片,轉(zhuǎn)化成相同大小的輸出,所以就有了金字塔法。這里論文當(dāng)中提出的方法是,按照比例分別將得到的不同大小的特征圖,分成相同個數(shù)的部分。
例如將一個圖片分成四個部分,或者將一個圖片分為兩個部分,這就可以獲得相同的長度的特征輸出。

3.給我們的啟發(fā)

1.再次使用當(dāng)時的模型的可能性不大,但是我們可以使用用比例劃分塊,產(chǎn)生相同個數(shù)的特征。

總結(jié)

以上是生活随笔為你收集整理的空间金字塔池化SPP的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。