图像金字塔和特征金字塔
圖像金字塔
圖像金字塔是圖像多尺度表達的一種,是一種以多分辨率來解釋圖像的有效但概念簡單的結構。一幅圖像的金字塔是一系列以金字塔形狀排列的分辨率逐步降低,且來源于同一張原始圖的圖像集合。其通過梯次向下采樣獲得,直到達到某個終止條件才停止采樣。我們將一層一層的圖像比喻成金字塔,層級越高,則圖像越小,分辨率越低。
在OpenCV中,有關圖像金字塔的操作有pyrup()和pyrdown(),分別用來完成上采樣和下采樣,其實在OpenCV中有關于圖片縮放的更直接的函數(shù),即resize()。
圖像金字塔分為兩類:高斯圖像金字塔和拉普拉斯圖像金字塔
高斯金字塔是通過高斯平滑(用高斯函數(shù)生成的核進行濾波)和亞采樣(通過對進行過高斯平滑處理的圖像進行隔行隔列采樣而得到)獲得一些列下采樣圖像,也就是說第K層高斯金字塔通過平滑、亞采樣就可以獲得K+1層高斯圖像,每層是按從下到上編號的。
高斯金字塔的上采樣和下采樣是非線性處理,是不可逆的有損處理,因此,如果下采樣后的圖像想還原回原來的尺寸的話會丟失很多信息,使圖片變得模糊,為了解決這個問題,需要提前保存因下采樣而造成的缺失信息,拉普拉斯金字塔可以近似地做到這一點。
特征金字塔 Feature Pyramid Networks
為解決目標檢測在處理多尺度變化問題時的不足,現(xiàn)在的很多網(wǎng)絡都使用了利用單個高層特征(比如說Faster R-CNN利用下采樣四倍的卷積層——Conv4,進行后續(xù)的物體的分類和bounding box的回歸),但是這樣做有一個明顯的缺陷,即小物體本身具有的像素信息較少,在下采樣的過程中極易被丟失,為了處理這種物體大小差異十分明顯的檢測問題,經(jīng)典的方法是利用圖像金字塔的方式進行多尺度變化增強,但這樣會帶來極大的計算量。所以提出了特征金字塔的網(wǎng)絡結構,能在增加極小的計算量的情況下,處理好物體檢測中的多尺度變化問題。
FPN,使每一層不同尺度的特征圖都具有較強的語義信息。
這種網(wǎng)絡結構,能夠在增加較少計算量的前提下融合低分辨率語義信息較強的特征圖和高分辨率語義信息較弱但空間信息豐富的特征圖。
其實在這篇論文之前,也有人提到得出一張既具有高分辨率又具有較強語義信息的特征圖進行預測,但FPN的獨特之處在于,它是在以特征金字塔為基礎結構上,對每一層級的特征圖分別進行預測。
參考
圖像金字塔:圖像金字塔 - 簡書
特征金字塔:【論文筆記】FPN —— 特征金字塔 - 知乎
圖像金字塔、特征金字塔(FPN)_福爾摩斯帥雙的博客-CSDN博客_圖像金字塔和特征金字塔
總結
以上是生活随笔為你收集整理的图像金字塔和特征金字塔的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Excel文件的编辑限制密码,如何撤销?
- 下一篇: 数据的降维