SIFT算法中概念简单解释
尺度空間
真實(shí)世界的物體只有在一定尺度上才有意義,例如我們能夠看到放在桌子上的水杯,但對(duì)于整個(gè)銀河系,這個(gè)水杯是不存在的。物體的這種多尺度的本質(zhì)在自然界中是普遍存在的。尺度空間就是試圖在數(shù)字圖像領(lǐng)域復(fù)制這個(gè)概念。又比如,對(duì)于某幅圖像,我們是想看到葉子還是想看到整棵樹,如果是樹,那么我們就應(yīng)該有意識(shí)的去除圖像的細(xì)節(jié)部分(如葉子、細(xì)枝等)。在去除細(xì)節(jié)部分的過程中,我們一定要確保不能引進(jìn)新的錯(cuò)誤的細(xì)節(jié)。因此在創(chuàng)建尺度空間的過程中,我們應(yīng)該對(duì)原始圖像逐漸的做模糊平滑處理。進(jìn)行該操作的唯一方法是高斯模糊處理,因?yàn)橐呀?jīng)被證實(shí),高斯函數(shù)是唯一可能的尺度空間核。
(我簡單的把尺度空間理解為,一副圖像通過縮小后,會(huì)產(chǎn)生很多尺度空間,給定的一副圖像我們只能進(jìn)行縮小;同一個(gè)組的圖像的分辨率相同,但是組內(nèi)的圖像依次看起來模糊,細(xì)節(jié)的部分被省略,盡大可能保留了圖像的主要信息,以便于后面的特征點(diǎn)檢測(cè);各個(gè)組之間圖像的分辨率依次減小;我們得到各類尺度空間的目的是為了檢測(cè)圖像中的特征點(diǎn),當(dāng)圖像模糊、進(jìn)一步縮小后,檢測(cè)到的特征點(diǎn)可能是原圖的一個(gè)區(qū)域,因此每個(gè)特征點(diǎn)會(huì)有半徑的屬性)
?
極值檢測(cè)
為了在連續(xù)的尺度下檢測(cè)圖像的特征點(diǎn),需要建立 DoG 金字塔,而 DoG 金字塔的建立又離不開高斯金字塔的建立,如下圖所示,左側(cè)為高斯金字塔,右側(cè)為 DoG 金字塔。
(下圖只顯示了兩組尺度空間圖像,兩組圖像的分辨率是一樣的,但是每組圖像里,上層圖像比下層圖像模糊,上面的那組圖像的分辨率要小于下面的那組圖像,上面的圖像進(jìn)行了縮小;右側(cè)每層的尺度空間圖像數(shù)目都比左側(cè)少一個(gè),因?yàn)樽髠?cè)的每相鄰的兩層圖像相減得到右側(cè)的一層圖像,)
?
極值點(diǎn)的搜索是在 DoG 金字塔內(nèi)進(jìn)行的,這些極值點(diǎn)就是候選的特征點(diǎn)。在搜索之前,我們需要在 DoG 金字塔內(nèi)剔除那些像素值過小的點(diǎn),因?yàn)檫@些像素具有較低的對(duì)比度,它們肯定不是穩(wěn)定的特征點(diǎn)。極值點(diǎn)的搜索不僅需要在它所在尺度空間圖像的鄰域內(nèi)進(jìn)行,還需要在它的相鄰尺度空間圖像內(nèi)進(jìn)行,如圖 2 所示。
?
?
特征點(diǎn)的定位
極值點(diǎn)的求取是在 DoG 尺度圖像內(nèi)進(jìn)行的, DoG 圖像的一個(gè)特點(diǎn)就是對(duì)圖像邊緣有很強(qiáng)的響應(yīng)。一旦特征點(diǎn)落在圖像的邊緣上,這些點(diǎn)就是不穩(wěn)定的點(diǎn)。這是因?yàn)橐环矫鎴D像邊緣上的點(diǎn)是很難定位的,具有定位的歧義性;另一方面這樣的點(diǎn)很容易受到噪聲的干擾而變得不穩(wěn)定。因此我們一定要把這些點(diǎn)找到并剔除掉。它的方法與 Harris 角點(diǎn)檢測(cè)算法相似,即一個(gè)平坦的 DoG 響應(yīng)峰值往往在橫跨邊緣的地方有較大的主曲率,而在垂直邊緣的方向上有較小的主曲率。
(這一個(gè)步驟主要是去掉檢測(cè)到的極值點(diǎn)中的圖像邊緣點(diǎn))
?
方向角度的確定
?????? (確定特征點(diǎn)方向角度時(shí),我們首先要確定該特征點(diǎn)的半徑,半徑和該圖像的尺度有關(guān),確定半徑后,統(tǒng)計(jì)特征點(diǎn)周圍各個(gè)方向半徑內(nèi)的像素梯度幅值和,10度為一個(gè)方向,方向統(tǒng)計(jì)和最大的表示該特征點(diǎn)的方向。)
?
特征點(diǎn)描述符生成
目前為止,我們已經(jīng)為關(guān)鍵點(diǎn)賦予了坐標(biāo)位置、尺度信息以及方向。現(xiàn)在我們需要一組向量將這個(gè)關(guān)鍵點(diǎn)表達(dá)出來,并且這組向量不單包括關(guān)鍵點(diǎn),還應(yīng)包括關(guān)鍵點(diǎn)周圍對(duì)其有貢獻(xiàn)的像素點(diǎn)。我們還期望這組向量對(duì)仿射變換、光照變換等具有一定的魯棒性,這些不變特性將會(huì)作為目標(biāo)匹配的依據(jù)。
描述子的基本思路:通過對(duì)關(guān)鍵點(diǎn)周圍圖像區(qū)域分塊,計(jì)算塊內(nèi)梯度直方圖,生成具有獨(dú)特性的向量,這個(gè)向量是該區(qū)域圖像信息的一種抽象,具有唯一性。
(特征點(diǎn)描述符表示這個(gè)特征點(diǎn)獨(dú)特性的地方,區(qū)別與其他特征點(diǎn)的地方,找出區(qū)別主要根據(jù)特征點(diǎn)周圍的像素值,計(jì)算特征點(diǎn)周圍的像素值的梯度直方圖,根據(jù)周圍像素直方圖來唯一描述特征點(diǎn),通常一個(gè)特征點(diǎn)需要計(jì)算周圍4*4個(gè)子區(qū)域,每個(gè)子區(qū)域涉及8個(gè)方向,所以每個(gè)特征點(diǎn)有4*4*8=128維)
?
參考自:
https://blog.csdn.net/dcrmg/article/details/52561656
http://blog.csdn.net/zhaocj/article/details/42124473
http://blog.csdn.net/liuheng0111/article/details/51234163
總結(jié)
以上是生活随笔為你收集整理的SIFT算法中概念简单解释的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 套接字介绍
- 下一篇: pandas基础知识