當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

SIFT算法中概念简单解释

發(fā)布時(shí)間：2024/7/23 编程问答 49 豆豆

生活随笔收集整理的這篇文章主要介紹了 SIFT算法中概念简单解释小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

尺度空間

真實(shí)世界的物體只有在一定尺度上才有意義，例如我們能夠看到放在桌子上的水杯，但對(duì)于整個(gè)銀河系，這個(gè)水杯是不存在的。物體的這種多尺度的本質(zhì)在自然界中是普遍存在的。尺度空間就是試圖在數(shù)字圖像領(lǐng)域復(fù)制這個(gè)概念。又比如，對(duì)于某幅圖像，我們是想看到葉子還是想看到整棵樹，如果是樹，那么我們就應(yīng)該有意識(shí)的去除圖像的細(xì)節(jié)部分（如葉子、細(xì)枝等）。在去除細(xì)節(jié)部分的過程中，我們一定要確保不能引進(jìn)新的錯(cuò)誤的細(xì)節(jié)。因此在創(chuàng)建尺度空間的過程中，我們應(yīng)該對(duì)原始圖像逐漸的做模糊平滑處理。進(jìn)行該操作的唯一方法是高斯模糊處理，因?yàn)橐呀?jīng)被證實(shí)，高斯函數(shù)是唯一可能的尺度空間核。

（我簡單的把尺度空間理解為，一副圖像通過縮小后，會(huì)產(chǎn)生很多尺度空間，給定的一副圖像我們只能進(jìn)行縮小；同一個(gè)組的圖像的分辨率相同，但是組內(nèi)的圖像依次看起來模糊，細(xì)節(jié)的部分被省略，盡大可能保留了圖像的主要信息，以便于后面的特征點(diǎn)檢測(cè)；各個(gè)組之間圖像的分辨率依次減小；我們得到各類尺度空間的目的是為了檢測(cè)圖像中的特征點(diǎn)，當(dāng)圖像模糊、進(jìn)一步縮小后，檢測(cè)到的特征點(diǎn)可能是原圖的一個(gè)區(qū)域，因此每個(gè)特征點(diǎn)會(huì)有半徑的屬性）

極值檢測(cè)

為了在連續(xù)的尺度下檢測(cè)圖像的特征點(diǎn)，需要建立 DoG 金字塔，而 DoG 金字塔的建立又離不開高斯金字塔的建立，如下圖所示，左側(cè)為高斯金字塔，右側(cè)為 DoG 金字塔。

（下圖只顯示了兩組尺度空間圖像，兩組圖像的分辨率是一樣的，但是每組圖像里，上層圖像比下層圖像模糊，上面的那組圖像的分辨率要小于下面的那組圖像，上面的圖像進(jìn)行了縮小；右側(cè)每層的尺度空間圖像數(shù)目都比左側(cè)少一個(gè)，因?yàn)樽髠?cè)的每相鄰的兩層圖像相減得到右側(cè)的一層圖像，）

極值點(diǎn)的搜索是在 DoG 金字塔內(nèi)進(jìn)行的，這些極值點(diǎn)就是候選的特征點(diǎn)。在搜索之前，我們需要在 DoG 金字塔內(nèi)剔除那些像素值過小的點(diǎn)，因?yàn)檫@些像素具有較低的對(duì)比度，它們肯定不是穩(wěn)定的特征點(diǎn)。極值點(diǎn)的搜索不僅需要在它所在尺度空間圖像的鄰域內(nèi)進(jìn)行，還需要在它的相鄰尺度空間圖像內(nèi)進(jìn)行，如圖 2 所示。

特征點(diǎn)的定位

極值點(diǎn)的求取是在 DoG 尺度圖像內(nèi)進(jìn)行的， DoG 圖像的一個(gè)特點(diǎn)就是對(duì)圖像邊緣有很強(qiáng)的響應(yīng)。一旦特征點(diǎn)落在圖像的邊緣上，這些點(diǎn)就是不穩(wěn)定的點(diǎn)。這是因?yàn)橐环矫鎴D像邊緣上的點(diǎn)是很難定位的，具有定位的歧義性；另一方面這樣的點(diǎn)很容易受到噪聲的干擾而變得不穩(wěn)定。因此我們一定要把這些點(diǎn)找到并剔除掉。它的方法與 Harris 角點(diǎn)檢測(cè)算法相似，即一個(gè)平坦的 DoG 響應(yīng)峰值往往在橫跨邊緣的地方有較大的主曲率，而在垂直邊緣的方向上有較小的主曲率。

（這一個(gè)步驟主要是去掉檢測(cè)到的極值點(diǎn)中的圖像邊緣點(diǎn)）

方向角度的確定

?????? （確定特征點(diǎn)方向角度時(shí)，我們首先要確定該特征點(diǎn)的半徑，半徑和該圖像的尺度有關(guān)，確定半徑后，統(tǒng)計(jì)特征點(diǎn)周圍各個(gè)方向半徑內(nèi)的像素梯度幅值和，10度為一個(gè)方向，方向統(tǒng)計(jì)和最大的表示該特征點(diǎn)的方向。）

特征點(diǎn)描述符生成

目前為止，我們已經(jīng)為關(guān)鍵點(diǎn)賦予了坐標(biāo)位置、尺度信息以及方向。現(xiàn)在我們需要一組向量將這個(gè)關(guān)鍵點(diǎn)表達(dá)出來，并且這組向量不單包括關(guān)鍵點(diǎn)，還應(yīng)包括關(guān)鍵點(diǎn)周圍對(duì)其有貢獻(xiàn)的像素點(diǎn)。我們還期望這組向量對(duì)仿射變換、光照變換等具有一定的魯棒性，這些不變特性將會(huì)作為目標(biāo)匹配的依據(jù)。

描述子的基本思路：通過對(duì)關(guān)鍵點(diǎn)周圍圖像區(qū)域分塊，計(jì)算塊內(nèi)梯度直方圖，生成具有獨(dú)特性的向量，這個(gè)向量是該區(qū)域圖像信息的一種抽象，具有唯一性。

（特征點(diǎn)描述符表示這個(gè)特征點(diǎn)獨(dú)特性的地方，區(qū)別與其他特征點(diǎn)的地方，找出區(qū)別主要根據(jù)特征點(diǎn)周圍的像素值，計(jì)算特征點(diǎn)周圍的像素值的梯度直方圖，根據(jù)周圍像素直方圖來唯一描述特征點(diǎn)，通常一個(gè)特征點(diǎn)需要計(jì)算周圍4*4個(gè)子區(qū)域，每個(gè)子區(qū)域涉及8個(gè)方向，所以每個(gè)特征點(diǎn)有4*4*8=128維）

參考自：

https://blog.csdn.net/dcrmg/article/details/52561656

http://blog.csdn.net/zhaocj/article/details/42124473

http://blog.csdn.net/liuheng0111/article/details/51234163

總結(jié)

以上是生活随笔為你收集整理的SIFT算法中概念简单解释的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

SIFT算法中概念简单解释

總結(jié)