當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

opencv图像金字塔的介绍

發(fā)布時間：2024/3/24 编程问答 57 豆豆

生活随笔收集整理的這篇文章主要介紹了 opencv图像金字塔的介绍小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

1.學(xué)習(xí)目標(biāo)：

掌握opencv圖像金字塔的原理

學(xué)習(xí)內(nèi)容：

1.什么是圖像金字塔？

2.圖像金字塔有什么用？

3.圖像金字塔實現(xiàn)方式

學(xué)習(xí)產(chǎn)出：

1. 什么是圖像金字塔？圖像金字塔（如圖 1 所示）是一種以多分辨率來解釋圖像的結(jié)構(gòu)，通過對原始圖像進(jìn)行多尺度像素采樣的方式，生成 N 個不同分辨率的圖像。把具有最高級別分辨率的圖像放在底部，以金字塔形狀排列，往上是一系列像素（尺寸）逐漸降低的圖像，一直到金字塔的頂部只包含一個像素點的圖像，這就構(gòu)成了傳統(tǒng)意義上的圖像金字塔。圖像金字塔底部是待處理的高分辨率圖像，也就是原始圖像，頂部是低分辨率的近似圖像。一般情況下，都是每向上移動一級，圖像的寬和高都降低為原來的 1/2 。金字塔高層圖片通過向上采樣得到底層圖片，底層圖片通過向下取樣得到高層圖片。

圖 1 圖像金字塔 2. 圖像金字塔有什么用？ (1) 圖像金字塔能夠幫助提取更多“有用”的特征，在進(jìn)行圖像處理時能夠幫助節(jié)省計算資源。特別地，在目標(biāo)檢測的場景中，由于不同攝像頭分辨率、設(shè)置位置不同，場景光線敏感程度都有差別，圖像中的物體通常很可能是遠(yuǎn)近不一，大小不一，由于圖像金字塔底層關(guān)注圖像細(xì)節(jié)，而高層注重圖像輪廓，此時就可以利用金字塔來檢測不同尺度下的物體。這種方法要比使用不同大小的 sliding window 在原圖上做檢測節(jié)省太多的算力，大大實驗增強(qiáng)效果，避免了大量噪聲圖片的輸入造成計算資源的浪費(fèi)。 (2) 圖像金字塔有助于避免模型過擬合。在某些圖像處理的算法中，圖像金字塔的多分辨率運(yùn)算可以避免陷入局部點或者過擬合狀態(tài)，增強(qiáng)模型魯棒性。 (3) 圖像金字塔可用于圖像融合。圖像拉普拉斯金字塔將源圖像分別分解到不同的空間頻帶上，而圖像融合過程就是在各空間頻率層上分別進(jìn)行的，這樣就可以針對不同分解層的不同頻帶上的特征與細(xì)節(jié)，采用不同的融合算子以達(dá)到突出特定頻帶上特征與細(xì)節(jié)的目的。即有可能將來自不同圖像的特征與細(xì)節(jié)融合在一起。 (4) 圖像縮放等等。 3. 圖像金字塔實現(xiàn)方式 1——resize 函數(shù) resize 函數(shù)主要實現(xiàn)的功能是將圖片縮放到目標(biāo)大小。resize 函數(shù)的主要特點是，它不會使圖像變得模糊。函數(shù)的構(gòu)成： resize(InputArray src, OutputArray dst, Size dsize, double fx = 0, double fy = 0, int interpolation = INTER_LINEAR)其中 src 代表原圖像，dst 代表輸出圖像，const Size & dstsize 設(shè)置輸出圖像的大小，fx,fy 設(shè)定 x 和 y 方向上的縮放比例，interpolation 指定了默認(rèn)插值方式為雙線性插值，雙線性插值的數(shù)學(xué)原理如下。

例：resize(img, dst, Size(),0.5,0.5);將原圖 img 長寬都變?yōu)樵瓉淼?0.5 倍，得到輸出圖像 dst 的分辨率變?yōu)樵瓉淼?1/4，重復(fù)以上操作我們就可以得到通過下采樣得到的多層金字塔圖片。 4. 圖像金字塔實現(xiàn)方式 2——高斯金字塔(Gaussianpyramid) 高斯金字塔是指通過高斯模糊濾波和下采樣不斷地將圖像的尺寸縮小，進(jìn)而在金字塔中包含多個分辨率的一組圖像。高斯金字塔的形式如下圖所示：

一般情況下，高斯金字塔的最底層為原圖像，每向上一層就會通過高斯模糊濾波+下采樣縮小一次圖像的尺寸。通常情況下，圖像的長與寬會縮小為原來的一半，由于每次圖像的長與寬都縮小為原來的一半，圖像的縮小速度非常快，因此常見的高斯金字塔的層數(shù)為 3~6。以圖為例，對應(yīng)分辨率 512*512 的原圖 O 首先做高斯變換得到相同尺寸的濾波圖像，然后將濾波圖像進(jìn)行下采樣就得到了第一次采樣圖片 D1，此時圖片的分辨率變?yōu)?256*256，重復(fù)以上的操作就能得到多次采樣后的高斯金字塔。設(shè) Gn 表示第 n 層高斯金字塔的圖像，則 G0 表示高斯金字塔的最底層（即原圖像）。為了得到 G n+1，首先需要對 Gn 進(jìn)行高斯核卷積，即做高斯低通濾波，然后刪除所有的偶數(shù)行和偶數(shù)列，從而得到 Gn+1。這個函數(shù)使用的高斯核如下：

高斯濾波其實是一種線性平滑濾波，適用于消除高斯噪聲，廣泛應(yīng)用于圖像處理的減噪過程。簡單來說就是整個圖像某個像素點的值與周圍像素點的值掛鉤，原圖像某一像素點的值其實是其本身和周圍像素點值的加權(quán)平均過程。之所以要先進(jìn)行高斯濾波，是為了在下采樣刪除偶數(shù)行和列的時候能盡量減少信息的丟失。高斯金字塔實現(xiàn)的函數(shù)：pyrDown，函數(shù)構(gòu)成： pyrDown(InputArray src, OutputArray dst, const Size & dstsize = Size(), int borderType =BORDER_DEFAULT) 參數(shù)解析： InputArray src：源圖像，Mat 類的對象 OutputArray dst：輸出圖像 const Size & dstsize：輸出圖像的大小 borderType：邊界處理方式，處理的方法參照官網(wǎng)的說明為：“gfedcb | abcdefgh| gfedcba”。之所以會有邊界處理方式，是因為在進(jìn)行高斯濾波圖像做卷積時，處于邊界的像素點在被選定為中心點時不能直接卷積，需要在原圖邊界添加像素點作為補(bǔ)充。另一方面，我們可以通過上采樣的方法實現(xiàn)高斯金字塔，上采樣的過程包括：（1）將圖像在每個方向放大為原來的兩倍，新增的行和列用 0 填充；（2）使用向下采樣時所使用的的高斯濾波器對補(bǔ)零后的圖像進(jìn)行濾波處理，以獲取向上采樣的結(jié)果圖像；（3）如上步驟，下采樣后圖片擴(kuò)大為原圖的 4 倍，重復(fù)上訴步驟得到高斯金字塔。實現(xiàn)函數(shù)為：pyrUp 函數(shù)，函數(shù) 構(gòu)成為：pyrUp( InputArray src, OutputArray dst,const Size& dstsize = Size(), int borderType = BORDER_DEFAULT )，參數(shù)的釋義參照 pyrDown 函數(shù)。但值得注意的是在進(jìn)行步驟（2）時所用的高斯核為下采樣金字塔所用高斯核的 1/4，因為 RGB 圖像像素值的范圍是[0, 255]，由于其中添 0 后圖像中四分之三的像素點的值都是為零，如果直接使用高斯濾波器對其進(jìn)行卷積計算，會導(dǎo)致像素值的范圍變?yōu)閇0, 255*1/4]。所以，要將所使用的高斯濾波器系數(shù)乘以 4，以保證得到像素值的范圍仍舊在[0, 255]內(nèi)。 5. 圖像金字塔實現(xiàn)方式 3——拉普拉斯金字塔(Laplacianpyramid) 拉普拉斯金字塔: 用來從金字塔低層圖像重建上層未采樣圖像，在數(shù)字圖像處理中也即是預(yù)測殘差，可以對圖像進(jìn)行最大程度的還原，配合高斯金字塔一起使用。首先對高斯金字塔原始圖像 Gi 進(jìn)行向下取樣，然后向上采用，最后與原始圖像相減，就得到了拉普拉斯金字塔圖像。要從高斯金字塔第 i 層生成第 i+1 層(即 G_i+1)，首先要用高斯核對 G_1 進(jìn)行卷積，然后刪除所有偶數(shù)行和偶數(shù)列，新得到圖像面積會變?yōu)樵磮D像的四分之一。按上述過程對輸入圖像 G_0 執(zhí) 行操作就可產(chǎn)生出整個高斯金字塔。圖像金字塔中的向上和向下采樣分別通過 OpenCV 函數(shù)pyrUp 和 pyrDown 實現(xiàn)。因為用 pyrDown 做下采樣操作的時候會有像素信息損失，做高斯模糊時會濾掉高頻像素點。拉普拉斯圖像可以幫助提取出圖像的高分辨率的像素點和下采樣丟掉的點。假設(shè)我們已經(jīng)有一個高斯圖像金字塔，對于其中的第 i 層圖像（高斯金字塔最下面為第 0 層），首先通過下采樣得到一尺寸縮小一半的圖像，即高斯金字塔中的第 i+1 層或者不在高斯金字塔中，之后對這張圖像再進(jìn)行上采樣，將圖像尺寸恢復(fù)到第 i 層圖像的大小，最后求取高斯金字塔第 i 層圖像與經(jīng)過上采樣后得到的圖像的差值圖像，這個差值圖像就是拉普拉斯金字塔的第 i 層圖像，整個過程的流程如圖所示。計算公式：Li = Gi -PyrUp( PyrDown(Gi) )。

上圖中第一列圖片為高斯下采樣得到的高斯金字塔圖片；第二列圖片為高斯金字塔第 Gi 層圖片與高斯金字塔第 Gi+1 層圖片上采樣之后兩者作差得到的拉普拉斯金字塔 Li；第三列圖片為通過拉普拉斯金字塔恢復(fù)出來的圖片。參考文章： OpenCV官方文檔_w3cschool opencv學(xué)習(xí)筆記（十一）：圖像金字塔 - 知乎

總結(jié)

以上是生活随笔為你收集整理的opencv图像金字塔的介绍的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：常见的Java内存溢出情况和实例
下一篇： es6,js 数组截取并保留原数组