Learning Deep Similarity Models with Focus Ranking for Fabric Image Retrieval 学习笔记
在本文中,我們提出了一種新的嵌入方法,稱為焦點排序,可以很容易地統(tǒng)一成一個CNN,在細(xì)粒度織物圖像檢索的背景下,共同學(xué)習(xí)圖像表示和度量。
Focus ranking的目的是通過將排列在不同樣本之下的相似樣本的總成本最小化來懲罰排序障礙,從而使相似樣本的排名高于所有不同樣本。在培訓(xùn)階段,將培訓(xùn)樣本組織成重點排序單元,進(jìn)行有效優(yōu)化。我們建立了一個大規(guī)模的織物圖像檢索數(shù)據(jù)集(FIRD),其中包含4300種織物的25000幅圖像。
傳統(tǒng)的圖像檢索方法主要包括兩個關(guān)鍵部分:一是設(shè)計一種魯棒性和鑒別性的圖像表示方法;二是確定給定圖像表示的有效距離或相似度度量。傳統(tǒng)方法中使用的圖像再現(xiàn)語句通常是手工制作的,例如SIFT[1]、GIST[2,3]、Bag of Words (BoW)[4]、Fisher Vector (FV)[5,6]和VLAD[7]。這些方法雖然在圖像檢索中取得了合理的成功,但在很大程度上依賴于特征工程。更嚴(yán)重的是,這兩個組件分別設(shè)計或?qū)W習(xí),導(dǎo)致次優(yōu)解。
一種基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的圖像表示方法和距離或相似度度量方法[8,9],可以無縫地用于圖像檢索。具體來說,這些方法訓(xùn)練了一個帶有度量學(xué)習(xí)嵌入的CNN。兩種簡單而有效的度量學(xué)習(xí)嵌入方法是對嵌入和三重嵌入。
優(yōu)化了這兩種嵌入方法,將不同標(biāo)簽的樣本拉開,將相同標(biāo)簽的樣本推近。這些判別模型最重要的優(yōu)點是可以聯(lián)合學(xué)習(xí)圖像表示和語義有意義的度量,對類內(nèi)變化和類間混淆具有較強(qiáng)的魯棒性。
一個圖像檢索系統(tǒng)的目的是找出具有相同標(biāo)簽的樣本與許多負(fù)面的樣本。但是,成對和三重嵌入方法對一個不超過一個負(fù)圖像作為參考的度量建模,這是對實際設(shè)置的非常粗略的近似。本文提出了一種新的嵌入方法,即焦點排序法,可以方便地統(tǒng)一到CNN中進(jìn)行聯(lián)合優(yōu)化。特別是,所提出的模型旨在將標(biāo)簽相同的樣本(即匹配樣本)排在所有負(fù)樣本之上。因此,我們通過將匹配樣本的總成本降到低于任何負(fù)樣本的最低來懲罰排序混亂。在訓(xùn)練階段,我們將訓(xùn)練樣本組織成焦點排序單元,每個單元由探針樣本、匹配樣本和參考集組成,進(jìn)行有效的優(yōu)化。它學(xué)習(xí)將匹配的樣本排在參考集合中所有負(fù)樣本的頂部。
據(jù)我們所知,目前還沒有公開的織物圖像檢索數(shù)據(jù)集。建立了大規(guī)模的織物圖像檢索數(shù)據(jù)集(FIRD)。它包含4300種織物,每一種都有5到10個實例。我們將FIRD數(shù)據(jù)集分為兩部分,隨機(jī)選取一半的面料作為訓(xùn)練集,另一半面料作為測試集。
?
總結(jié)
以上是生活随笔為你收集整理的Learning Deep Similarity Models with Focus Ranking for Fabric Image Retrieval 学习笔记的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 6.#闲谈|小编一手腾讯课堂送花脚本 j
- 下一篇: 云蹦迪云广场舞软件开源源码