當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

sift的java实现解述

發(fā)布時間：2025/3/21 编程问答 43 豆豆

生活随笔收集整理的這篇文章主要介紹了 sift的java实现解述小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

代碼已經(jīng)開源到github上，https://github.com/alibaba/simpleimage項目，其中的?analyze模塊中。

原始圖片為：

主要調(diào)用方法：

[java]?view plaincopy

BufferedImage?img?=?ImageIO.read(logoFile);??

?RenderImage?ri?=?new?RenderImage(img);??

?SIFT?sift?=?new?SIFT();??

?sift.detectFeatures(ri.toPixelFloatArray(null));??

?List<KDFeaturePoint>?al?=?sift.getGlobalKDFeaturePoints();??

同樣可以再讀另一個張圖得到另一個 List<KDFeaturePoint> al1,然后兩個List進行match

[java]?view plaincopy

List<Match>?ms?=?MatchKeys.findMatchesBBF(al,?al1);??

ms?=?MatchKeys.filterMore(ms);??

先從上面的調(diào)用入口，詳細講解圖sift的特征點生，至于match,有空再說。其中最難理解的是極值點的查找，主要對這部分講解。

一.構(gòu)建尺度空間，檢測極值點，獲得尺度不變性

ImagePixelArray就是保存一張圖片的象素點進行灰度化后的數(shù)組。在RenderImage的toPixelFloatArray方法中默認灰度處理只是簡單將rgb的值換成r,g,b的平均值并做歸一化處理(除以255);

從調(diào)用入口我們進入主類SIFT的用戶接口detectFeatures方法，它實際調(diào)用了detectFeaturesDownscaled(ImageMap img, int bothDimHi, double startScale) ，我們看隨了開始的幾行init工作，最后對圖片使用preprocSigma(1.5)的參數(shù)進行高斯模數(shù)預(yù)處理。

[java]?view plaincopy

????????if?(preprocSigma?>?0.0)?{??

????????????GaussianArray?gaussianPre?=?new?GaussianArray(preprocSigma);??

????????????img?=?gaussianPre.convolve(img);??

????????}??

進行高斯模糊的目的是為了使大片的灰度相近的點連成一片，而使一些比較突出的點更加區(qū)別于其它點，就象我們把一張灰度圖片使用“版畫”效果會把大量的連片點去掉只留下輪廓。

經(jīng)過上面的預(yù)處理效果為：

現(xiàn)在我們還看不出強烈的效果，僅是pre的處理了一下。再接著使用Pyramid的buildOctaves方法構(gòu)建8度金字塔，我們跟蹤到方法內(nèi)。

[java]?view plaincopy

public?int?buildOctaves(ImagePixelArray?source,?float?scale,?int?levelsPerOctave,?float?octaveSigm,?int?minSize)?{??

????this.octaves?=?new?ArrayList<OctaveSpace>();??

????OctaveSpace?downSpace?=?null;??

????ImagePixelArray?prev?=?source;??

????while?(prev?!=?null?&&?prev.width?>=?minSize?&&?prev.height?>=?minSize)?{??

????????OctaveSpace?osp?=?new?OctaveSpace();??

????????//?Create?both?the?gaussian?filtered?images?and?the?DOG?maps??

????????osp.makeGaussianImgs(prev,?scale,?levelsPerOctave,?octaveSigm);?//構(gòu)建當(dāng)前8度空間的高斯模糊圖像??

????????osp.makeGaussianDiffImgs();??

????????octaves.add(osp);??

????????prev?=?osp.getLastGaussianImg().halved();?//下一個8度空間的原始圖象??

????????if?(downSpace?!=?null)?downSpace.up?=?osp;??

????????osp.down?=?downSpace;??

????????downSpace?=?osp;??

????????scale?*=?2.0;??

????}??

????return?(octaves.size());??

}??

先不看????????????

osp.makeGaussianImgs(prev,?scale,?levelsPerOctave,?octaveSigm); osp.makeGaussianDiffImgs();

整個方法就是以原圖為基礎(chǔ)不斷地構(gòu)造圖層，這里也是高斯金字塔最微妙的地方。尺度空間概念不是簡單的不同大小尺寸組成的尖塔，也不是相同大小不同模糊因子處理過的直方塔，其實說是金字塔不太準確，更象中國傳統(tǒng)的寶塔。

它首先由原始圖象根據(jù)不同的模糊因子進行模糊（說成是平滑更確切，就是把比較相近的顏色值讓他們更相近以便突出反差很強的點），這是在同一尺寸上做的。這些相同尺寸不同高斯模糊因子處理過的圖像集合叫一個8度空間。相當(dāng)于寶塔中的一層，然后再向下采樣，即以其中一幅進行1/2縮小作為原圖再進行另一個8度空間的高斯模糊處理，直到圖層的width或hight小于minSize(32),這樣不斷模糊并向下采樣的構(gòu)成的所有8度空間的集合才叫高斯金字塔（高斯寶塔？）。這是為了能檢測到原圖的某一點在不同尺度上都有穩(wěn)定的特征。

????????????然后我們回頭來看osp.makeGaussianImgs方法。對1個8度空間原始圖象，以不同的 sigma 參數(shù)構(gòu)建多張高斯模糊圖。因為最底層的原圖最大，我選了塔中scale為2的那一個8度間空的smoothedImgs.

可以看出隨著模糊因子變化模糊程度在加大。在塔中的每一個8度空間得到了一個smoothedImgs?數(shù)組。這里一共生成6幅圖像，原因在方法內(nèi)部有注釋，我們最終要在3層的差分尺度中獲取極值點，而每個尺度獲取極值點都要在立體空間（這也是sift最區(qū)別于其它特征的革命性突破）上比較，即要比較它上一幅和下一幅的對應(yīng)點，那么3層的尺度至少要五幅差分圖像，而五幅差分圖像至少要6幅高斯模糊圖象才能生成。

然后對smoothedImgs中的圖象通過osp.makeGaussianDiffImgs();依次求差放入diffImags數(shù)組中。

對于使用不同參數(shù)進行模糊的兩張圖片，象素相近的連片部分差值極小，只有邊緣，轉(zhuǎn)角等特征的點表現(xiàn)出較大的差值:

先不要在意連片的黑色，因為求差后的值很小并已經(jīng)做了歸一化，我把它還原到圖片上時進行絕對值（可能為負）乘10然后模 255,以便清楚地顯示出來。可以看出這些圖片中特征強烈的點都是邊緣，轉(zhuǎn)角等地方。

二.特征點過濾并進行精確定位

現(xiàn)在回到detectFeaturesDownscaled，經(jīng)過是面的處理，金字塔中每個8度空間上都有一個OctaveSpace對象保存著一個差分圖象數(shù)組。下面的findPeaks其實就是從第2個圖象開始到倒數(shù)第二個圖象循環(huán)，當(dāng)前圖象上每一個點和周圍的點比較，如果是最大值或是最小值就視為極值點。（這里的周圍是立體的周圍，不僅和當(dāng)前圖像上點周圍的8個點比較，還要和他上一幅和下一幅對應(yīng)的9個點比較）

[java]?view plaincopy

checkMinMax(current,?c,?x,?y,?ref,?true);??

checkMinMax(below,?c,?x,?y,?ref,?false);??

checkMinMax(above,?c,?x,?y,?ref,?false);??

if?(ref.isMin?==?false?&&?ref.isMax?==?false)?continue;??

peaks.add(new?ScalePoint(x,?y,?curLev));??

回到detectFeaturesDownscaled，下面的filterAndLocalizePeaks方法主要是根據(jù)原始論文的page12/13的方法進行過慮和精確定位。

isTooEdgelike是對太象邊緣的點進行過慮，這個意思就是連續(xù)的線不是好的極值點，只有角點這樣的孤立的點才是極值點，為什么“太象邊緣”的連續(xù)的線不好呢？邊緣點的特點是沿邊緣方向的梯度很小，簡單說一條線的點差別不大，而和它相切的方向梯度很大。由于梯度大它們很容易成為極值點，但因為沿線的兩個點之間梯度又幾乎沒有區(qū)別，極值點本身是局部特征，所以邊緣線上兩個點對于某極值進行投射時根本無法區(qū)別是點1還是點2.所以要把這些“線性連續(xù)點去掉”。

在過慮掉“太象邊緣”的點后，下面的localizeIsWeak就精確化每個尺度空間上的極值點，因為極值點是在連續(xù)的尺度空間中計算出來的非常精確化的坐標比如（0.12345678，0.23456789），而原始圖象的點是以整數(shù)為坐標的，相對尺度空間的坐標而言是散列的。而極值點最終要映射到原始圖像的整數(shù)坐標上，所以要有一個調(diào)整過程。

根據(jù)極值點的坐標和sigma參數(shù)，主要是三元一，二價導(dǎo)數(shù)和亞象素計算。這樣精確匹配到原始點后會得到一個原始點的坐標，sigma參數(shù)和調(diào)整值 local.dValue，下面的過慮條件就簡單了:

??????????? if (Math.abs(peak.local.scaleAdjust) > scaleAdjustThresh) continue;

??????????? if (Math.abs(peak.local.dValue) <= dValueLoThresh) continue;

簡單說當(dāng)匹配到原始點在某一范圍之外的都過慮掉，注意原始論文上建議dValueLoThresh為0.03，這里實際是0.008。

三.為每個關(guān)鍵點指定方向參數(shù)

查找極值點的工作都完成了，下面就是對這些點和周轉(zhuǎn)的點比較生成一些向量：

在生成關(guān)鍵的方向和梯度時，我們用一個pretreatMagnitudeAndDirectionImgs方法把差分圖上所有點的梯度方向和梯度值先計算出來，因為特征點的方向最終是它周圍的64個點的梯度方向梯值加權(quán)計算出來的，這樣每一點可能被多個特征點作為“周圍點”，如果當(dāng)作為周圍點才計算某點的梯度方向梯值加，很多點會被多次計算，這樣計算的總次數(shù)會大于所有點計算一次。所以我們會把每個點先計算出來存在一個數(shù)組中。

詳見 makeFeaturePoint的注釋

四.生成關(guān)鍵點的描述子

createDescriptors中有詳細注釋。

from:?http://blog.csdn.net/axman/article/details/9243681

總結(jié)

以上是生活随笔為你收集整理的sift的java实现解述的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

JAVA
SIFT

上一篇：如何理解矩阵特征值？
下一篇： Office word中mathtype

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

sift的java实现解述

總結(jié)