VLAD教程和资料 All about VLAD
正如標題所示,這里將記錄VLAD的一切。VLAD本小子雖然也讀過幾篇這方面的paper,不過讀的時候一直理解的很粗糙。所以想借此機會開個帖子,一方面驅(qū)動自己去加深對它的理解,另一方面把這些自己對它的理解記錄下來,方便自己查閱。
VLAD初步
在進行理論分析之前,先來看看VLAD長個什么樣子,這里本小子分步展開VLAD是怎么得來的。
By counting the number of occurrences of visual words, BOW encodes the 0-order statistics of the distribution of descriptors. The Fisher vector extends the BOW by encoding high-order statistics (first and, optionally, second order).
BOW做的是描述子的0階統(tǒng)計分布,而FV則是擴展了的BOW的高階統(tǒng)計。這里引出來的FV是什么呢?VLAD是FV的特例,這里我們先不關(guān)注FV,我們只要借此推得VLAD是BOW的高階統(tǒng)計就行。
經(jīng)過上面三個步驟后,一幅圖像可以用一個1*(K*128)維的向量表示。為了初步驗證上面的過程是否正確,來看看上面那篇論文中VLAD的維數(shù)是否如這里所理解的是一個1*(K*128)維的向量,直接看實驗表:
上表中FV和VLAD的D表示維數(shù),我們看到D=K*64,這里為什么不是128呢?原因在于作者對SIFT進行了PCA降維處理,將128維降到了64維。
上面VLAD生成過程用文字描述起來不夠簡潔,直接把論文里計算VLAD的算法流圖扒過來了,算法流圖如下:
提取VLAD
在對VLAD有了初步的認識后,接下來我們可以動手提取VLAD,通過實驗來進一步了解VLAD。
(待續(xù))
參考:
總結(jié)
以上是生活随笔為你收集整理的VLAD教程和资料 All about VLAD的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: caffe配置中的一些问题
- 下一篇: 基于内容的图像检索 Database f