CVPR 2018 TRACA:《Context-aware Deep Feature Compression for High-speed Visual Tracking》论文笔记
? 理解出錯(cuò)之處望不吝指正。?
? 本文的模型叫做TRACA。模型中使用多個(gè)expert auto-encoder,在預(yù)訓(xùn)練階段,每個(gè)expert auto-encoder針對(duì)一個(gè)特定類進(jìn)行訓(xùn)練;在tracking階段,對(duì)于給定的跟蹤目標(biāo),只使用最優(yōu)的expert auto-encoder。
? 在expert auto-encoder的預(yù)訓(xùn)練階段,首先使用所有的訓(xùn)練樣本訓(xùn)練出,對(duì)所有樣本在上得到的compressed feature maps進(jìn)行聚類,得到個(gè)簇,針對(duì)每個(gè)簇,使用該簇對(duì)應(yīng)的樣本基于進(jìn)行訓(xùn)練得到個(gè)不同的expert auto-encoder。
? 在進(jìn)行聚類的時(shí)候,為了避免有一些簇過(guò)小,作者提出了一個(gè)two-step方法來(lái)進(jìn)行聚類。(1).在所有樣本通過(guò)上得到的compressed feature maps中進(jìn)行隨機(jī)抽樣得到個(gè)樣本,重復(fù)這個(gè)過(guò)程1000次,并且將其中與其他樣本具有最大歐幾里得距離的樣本作為初始的簇,然后使用k-means進(jìn)行聚類,得到2Ne個(gè)簇;(2).將簇中樣本數(shù)較少的個(gè)簇刪除,剩余的簇的中心作為上一段落中聚類的初始簇心。
? 為了使訓(xùn)練得到的更加魯棒,作者使用了兩種降噪方法。(1).隨機(jī)選擇一些通道,將其數(shù)值置為0;(2).互換特征圖中某些位置的值。
? Context-aware Network的目的是,針對(duì)某個(gè)tracking target,選擇出用哪個(gè)expert auto-encoder,故Context-aware Network的輸出值即為expert auto-encoder的標(biāo)號(hào)(簇的標(biāo)號(hào))。預(yù)訓(xùn)練過(guò)程很簡(jiǎn)單,使用如下的損失函數(shù)(為交叉熵?fù)p失、代表預(yù)測(cè)值、代表真實(shí)值):
???
?
? 以上都是預(yù)訓(xùn)練階段,接下來(lái)是tracking階段。
? 針對(duì)第一幀。
? 首先,使用高斯濾波和翻轉(zhuǎn)進(jìn)行數(shù)據(jù)增強(qiáng),得到7個(gè)樣本(初始1+高斯濾波4+翻轉(zhuǎn)2)。
? 然后,使用這7個(gè)樣本對(duì)選擇的expert auto-encoder進(jìn)行微調(diào),這里使用到了CF正交損失(代表的層數(shù)):
???
???
? 代表使用compressed feature map中的第k個(gè)channel通過(guò)下式得到的估計(jì)權(quán)值:
???
? 上式中,即為該通道的向量值,為向量形式的響應(yīng)圖,為共軛,為預(yù)設(shè)的正則系數(shù)。戴帽子的原因是傅里葉變換。
? 微調(diào)后,刪除那些在target bbox外有很大的響應(yīng)值的channel。
? 在第二幀及其以后。
? CF使用下式更新:
???
? 使用scaling factor 1.015和1/1.015來(lái)處理尺度變換。
? 當(dāng)出現(xiàn)“全遮擋”時(shí),要進(jìn)行re-detection(使用上一幀的CF作為re-detection CF),若下式成立則視為發(fā)生“全遮擋”:
???
? 其中:
???
???
???
總結(jié)
以上是生活随笔為你收集整理的CVPR 2018 TRACA:《Context-aware Deep Feature Compression for High-speed Visual Tracking》论文笔记的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: CVPR 2018 SINT++:《SI
- 下一篇: CVPR 2018 DEDT:《Effi