日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

局部特征(4)——SIFT和SURF的比较

發(fā)布時間:2025/3/21 编程问答 25 豆豆
生活随笔 收集整理的這篇文章主要介紹了 局部特征(4)——SIFT和SURF的比较 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
局部特征系列:
  • 局部特征(1)——入門篇
  • 局部特征(2)——Harris角點
  • 局部特征(3)——SURF特征總結(jié)
  • 局部特征(4)——SIFT和SURF的比較
  • 局部特征(5)——如何利用彩色信息 Color Descriptors
  • 局部特征(6)——局部特征描述匯總

?--------------------------------------------------------------

  • 共同點:

SIFT/SURF為了實現(xiàn)不同圖像中相同場景的匹配,主要包括三個步驟:

1、尺度空間的建立;

2、特征點的提取;

3、利用特征點周圍鄰域的信息生成特征描述子

4、特征點匹配。

? ? ? ? 從博客上看到一片文章,http://blog.csdn.net/cy513/archive/2009/08/05/4414352.aspx,這一段的大部分內(nèi)容源于這篇文章,推薦大家去看看。

? ? ? ? 如果兩幅圖像中的物體一般只是旋轉(zhuǎn)和縮放的關系,加上圖像的亮度及對比度的不同,要在這些條件下要實現(xiàn)物體之間的匹配,SIFT算法的先驅(qū)及其發(fā)明者想到只要找到多于三對物體間的匹配點就可以通過射影幾何的理論建立它們的一一對應。

? ? ? ? 如何找到這樣的匹配點呢?SIFT/SURF作者的想法是首先找到圖像中的一些“穩(wěn)定點”,這些點是一些特殊的點,不會因為視角的改變、光照的變化、噪音的干擾而消失,比如角點、邊緣點、暗區(qū)域的亮點以及亮區(qū)域的暗點。這樣如果兩幅圖像中有相同的景物,那么這些穩(wěn)定點就會在兩幅圖像的相同景物上同時出現(xiàn),這樣就能實現(xiàn)匹配。因此,SIFT/SURF算法的基礎是穩(wěn)定點。

? ? ? ? SIFT/SURF提取的穩(wěn)定點,首先都要求是局部極值。但是,當兩個物體的大小比例不一樣時,大圖像的局部極值點在小圖像的對應位置上有可能不是極值點。于是SIFT/SURF都采用圖像金字塔的方法,每一個截面與原圖像相似,這樣兩個金字塔中就有可能包含大小最近似的兩個截面了。

? ? ? ? 這樣找到的特征點會比較多,經(jīng)過一些處理后濾掉一些相對不穩(wěn)定的點。

? ? ? ? 接下來如何去匹配相同物體上對應的點呢?SIFT/SURF的作者都想到以特征點為中心,在周圍鄰域內(nèi)統(tǒng)計特征,將特征附加到穩(wěn)定點上,生成特征描述子。在遇到旋轉(zhuǎn)的情況下,作者們都決定找出一個主方向,然后以這個方向為參考坐標進行后面的特征統(tǒng)計,就解決了旋轉(zhuǎn)的問題。


?

  • 共同的大問題有以下幾個:

1、為什么選用高斯金字塔來作特征提取?

? ? ? 為什么是DOG的金字塔?因為它接近LOG,而LOG的極值點提供了最穩(wěn)定的特征,而且DOG方便計算(只要做減法。)

? ? ? 為什么LOG的極值點提供的特征最穩(wěn)定,有參考文獻,未看。

???? (7.12補充:)直觀理解:特征明顯的點經(jīng)過不同尺度的高斯濾波器進行濾波后,差別較大,所以用到的是DOG。

? ? ? 但是直觀上怎么理解?如果相鄰Octave的sigma不是兩倍關系還好理解:如果兩幅圖像只是縮放的關系,那么假設第一個Octave找到了小一倍圖像的極值點,那么大一倍圖像的極值點會在下一個Octave找到相似的。但是現(xiàn)在,如果把大一倍圖像進行一次下采樣(這樣和小的圖像就完全一樣了),進行Gauss濾波時,兩個圖像濾波系數(shù)(sigma)是不一樣的,不就找不到一樣的極值點了么?不理解。

2、Hessian矩陣為什么能用來篩選極值點?

? ? ? SIFT先利用非極大抑制,再用到Hessian矩陣進行濾除。SURF先用Hessian矩陣,再進行非極大抑制。SURF的順序可以加快篩選速度么?(Hessian矩陣濾除的點更多?)

? ? ? 至于SURF先用Hessian矩陣,再進行非極大抑制的原因,是不管先極大值抑制還是判斷Hessian矩陣的行列式,金字塔上的點的行列式都是要計算出來的。先判斷是否大于0只要進行1次判斷,而判斷是否是極大值點或者極小值點要與周圍26個點比較,只比較1次肯定快。

? ? ? 而在SIFT中,構建的高斯金字塔只有一座(不想SURF是有3座),要進行非極大抑制可以直接用金字塔的結(jié)果進行比較。而如果計算Hessian矩陣的行列式,還要再計算Dxx、Dxy、Dyy。因此先進行非極大抑制。這兩個步驟的先后與SIFT/SURF的實際計算情況有關的,都是當前算法下的最佳順序,而不是說哪種先計算一定更好。

3、為什么采用梯度特征作為局部不變特征?

? ? ? 這與人的視覺神經(jīng)相關。采用梯度作為描述子的原因是,人的視覺皮層上的神經(jīng)元對特定方向和空間頻率的梯度相應很敏感,經(jīng)過SIFT作者的一些實驗驗證,用梯度的方法進行匹配效果很好。

4、為什么可以采用某些特征點的局部不變特征進行整幅圖像的匹配?

? ? ? 我在一份博客上找到這樣一句話:(http://apps.hi.baidu.com/share/detail/32318290,大家可以看看這篇文章。)

從直觀的人類視覺印象來看,人類視覺對物體的描述也是局部化的,基于局部不變特征的圖像識別方法十分接近于人類視覺機理,通過局部化的特征組合,形成對目標物體的整體印象,這就為局部不變特征提取方法提供了生物學上的解釋,因此局部不變特征也得到了廣泛應用。

? ? ? 還有:

? ? ? 圖像中的每個局部區(qū)域的重要性和影響范圍并非同等重要,即特征不是同等顯著的,其主要理論來源是Marr的計算機視覺理論和Treisman的特征整合理論,一般也稱為“原子論”。該理論認為視覺的過程開始于對物體的特征性質(zhì)和簡單組成部分的分析,是從局部性質(zhì)到大范圍性質(zhì)。

? ? ? SIFT/SURF都是對特征點的局部區(qū)域的描述,這些特征點應該是影響重要的點,對這些點的分析更加重要。所以在局部不變特征的提取和描述時也遵循與人眼視覺注意選擇原理相類似的機制,所以SIFT/SURF用于匹配有效果。

?

?

  • 不同點的比較:

從博客上看到一個總結(jié),我修改了一些內(nèi)容。大家可以參看以下鏈接:

http://blog.csdn.net/ijuliet/archive/2009/10/07/4640624.aspx

?

SIFT

SURF

尺度空間

DOG與不同尺度的圖片卷積

不同尺度的box filters與原圖片卷積

特征點檢測

先進行非極大抑制,再去除低對比度的點。再通過Hessian矩陣去除邊緣的點

先利用Hessian矩陣確定候選點,然后進行非極大抑制

方向

在正方形區(qū)域內(nèi)統(tǒng)計梯度的幅值的直方圖,找max對應的方向。可以有多個方向。

在圓形區(qū)域內(nèi),計算各個扇形范圍內(nèi)x、y方向的haar小波響應,找模最大的扇形方向

特征描述子

16*16的采樣點劃分為4*4的區(qū)域,計算每個區(qū)域的采樣點的梯度方向和幅值,統(tǒng)計成8bin直方圖,一共4*4*8=128維

(2013.5.9 note: 不一定要是16?× 16,區(qū)域也可以不用是 4?× 4)

20*20s的區(qū)域劃分為4*4的子區(qū)域,每個子區(qū)域找5*5個采樣點,計算采樣點的haar小波響應,記錄∑dx,∑dy,∑|dx|,∑|dy|,一共4*4*4=64維

? ? ? ? SURF—金字塔僅僅是用來做特征點的檢測。在計算描述子的時候,haar小波響應是計算在原圖像(利用積分圖)。而SIFT是計算在高斯金字塔上(注意不是高斯差分金字塔。)

  • 性能的比較:

? ? ? ? 論文:A comparison of SIFT, PCA-SIFT and SURF?對三種方法給出了性能上的比較,源圖片來源于Graffiti dataset,對原圖像進行尺度、旋轉(zhuǎn)、模糊、亮度變化、仿射變換等變化后,再與原圖像進行匹配,統(tǒng)計匹配的效果。效果以可重復出現(xiàn)性為評價指標。

? ? ? ? 比較的結(jié)果如下:

method

Time

Scale

Rotation

Blur

Illumination

Affine

Sift

common

best

best

common

common

good

Pca-sift

good

good

good

best

good

best

Surf?

best

common

common

good

best

good

?

?

?

?

?

?

????


? ? ? ? 由此可見,SIFT在尺度和旋轉(zhuǎn)變換的情況下效果最好,SURF在亮度變化下匹配效果最好,在模糊方面優(yōu)于SIFT,而尺度和旋轉(zhuǎn)的變化不及SIFT,旋轉(zhuǎn)不變上比SIFT差很多。速度上看,SURF是SIFT速度的3倍。

?

-----------------------------------

jiang1st2010

原文地址:http://blog.csdn.net/jiang1st2010/article/details/6567452


總結(jié)

以上是生活随笔為你收集整理的局部特征(4)——SIFT和SURF的比较的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。