當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

空间金字塔池化SPP

發布時間：2025/4/5 编程问答 21 豆豆

生活随笔收集整理的這篇文章主要介紹了空间金字塔池化SPP 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

空間金字塔池化

1.提出的原因

下面這里是我們在網上反復可以看見的話（所以關鍵是理解這些內容）：
提出的原因：
在SPP提出之前，傳統的網絡具有它有兩大缺點：
1、通常需要輸入固定大小的圖片來進行訓練和測試。對于大小不一的圖片，需要經過裁剪，或者縮放等一系列操作，將其變為統一的尺寸。但是這樣往往會降低識別檢測的精度。**
2、計算量較大，嚴重影響速度R-CNN預設1000~2000個候選區域（采用Selective Search 方法），并分別在每個候選區域進行特征提取。這個想想就害怕，因為圖片上有些區域會被重復采樣多次。

1.1兩點不足是和什么比較？

這里我們要首先理解傳統網絡是什么意思？他是干什么的？
之前的模型是指R-CNN，這個模型大約就是用于從圖片中提取出那些是一個特定的物體的區域，整個過程是：
1）首先，使用算法來找出各種候選的區域
2）之后，我們使用卷積網絡來對這些區域進行特征提取
3）完成特征提取之后，我們要將其轉化為全連接層進行處理（當時還沒有FCN這種好東西）
4）最后，經過全連接層才得出我們的結果。
R-CNN就是后面的2）3）4）

1.2理解第一個不足

在R-CNN模型中最關鍵的一個問題是，在模型當中我們是對前面得出來的候選區域進行特征提取，這些候選區域大小可是并不一樣啊。所以被迫全部的訓練上一次。
那么這個原因里面說的其實和R-CNN沒有太大聯系，說的是秦始皇時代圖像識別模型定義好之后，只能對某一種確定大小的內容進行識別，這個就要求我們更改圖片，更改圖片的話：首先，會降低精度；其次，這個更改的過程憑空增加了很多的工作量。所以，也期待著有一種可以處理不同大小圖片的模型出現。

1.3理解第二個不足

因為R-CNN是對候選區域進行驗證，每個大小又不一樣，所以我們被迫全部重新訓練一次，所以訓練次數就會非常爆炸，每次forward過程中就相當于進行了1000-2000次forward。
當然這里的1000-2000是R-CNN自己規定的，但是你想精度差不多，這個數據也不能太小

2.金字塔池化

這個金字塔池化，一定可以找到下面的這個圖片

我們前面說過這個模型提出非常早，在2014年，那時候還沒有FCN這個東西，所以最后使用的是一個全連接，我們注意全連接這個東西最后必須是一個確定長度的輸入，不可以是可以變化的，所以圖片大小改變的話我們必須改變我們的模型。
這就要求我們必須是確定一種轉換方式將不同大小的圖片，轉化成相同大小的輸出，所以就有了金字塔法。這里論文當中提出的方法是，按照比例分別將得到的不同大小的特征圖，分成相同個數的部分。
例如將一個圖片分成四個部分，或者將一個圖片分為兩個部分，這就可以獲得相同的長度的特征輸出。

3.給我們的啟發

1.再次使用當時的模型的可能性不大，但是我們可以使用用比例劃分塊，產生相同個數的特征。

總結

以上是生活随笔為你收集整理的空间金字塔池化SPP的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： DeepLab v2
下一篇：隐式马可夫模型（hidden marko