CVPR 2018 TRACA:《Context-aware Deep Feature Compression for High-speed Visual Tracking》论文笔记
? 理解出錯之處望不吝指正。?
? 本文的模型叫做TRACA。模型中使用多個expert auto-encoder,在預訓練階段,每個expert auto-encoder針對一個特定類進行訓練;在tracking階段,對于給定的跟蹤目標,只使用最優的expert auto-encoder。
? 在expert auto-encoder的預訓練階段,首先使用所有的訓練樣本訓練出,對所有樣本在上得到的compressed feature maps進行聚類,得到個簇,針對每個簇,使用該簇對應的樣本基于進行訓練得到個不同的expert auto-encoder。
? 在進行聚類的時候,為了避免有一些簇過小,作者提出了一個two-step方法來進行聚類。(1).在所有樣本通過上得到的compressed feature maps中進行隨機抽樣得到個樣本,重復這個過程1000次,并且將其中與其他樣本具有最大歐幾里得距離的樣本作為初始的簇,然后使用k-means進行聚類,得到2Ne個簇;(2).將簇中樣本數較少的個簇刪除,剩余的簇的中心作為上一段落中聚類的初始簇心。
? 為了使訓練得到的更加魯棒,作者使用了兩種降噪方法。(1).隨機選擇一些通道,將其數值置為0;(2).互換特征圖中某些位置的值。
? Context-aware Network的目的是,針對某個tracking target,選擇出用哪個expert auto-encoder,故Context-aware Network的輸出值即為expert auto-encoder的標號(簇的標號)。預訓練過程很簡單,使用如下的損失函數(為交叉熵損失、代表預測值、代表真實值):
???
?
? 以上都是預訓練階段,接下來是tracking階段。
? 針對第一幀。
? 首先,使用高斯濾波和翻轉進行數據增強,得到7個樣本(初始1+高斯濾波4+翻轉2)。
? 然后,使用這7個樣本對選擇的expert auto-encoder進行微調,這里使用到了CF正交損失(代表的層數):
???
???
? 代表使用compressed feature map中的第k個channel通過下式得到的估計權值:
???
? 上式中,即為該通道的向量值,為向量形式的響應圖,為共軛,為預設的正則系數。戴帽子的原因是傅里葉變換。
? 微調后,刪除那些在target bbox外有很大的響應值的channel。
? 在第二幀及其以后。
? CF使用下式更新:
???
? 使用scaling factor 1.015和1/1.015來處理尺度變換。
? 當出現“全遮擋”時,要進行re-detection(使用上一幀的CF作為re-detection CF),若下式成立則視為發生“全遮擋”:
???
? 其中:
???
???
???
總結
以上是生活随笔為你收集整理的CVPR 2018 TRACA:《Context-aware Deep Feature Compression for High-speed Visual Tracking》论文笔记的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: CVPR 2018 SINT++:《SI
- 下一篇: CVPR 2018 DEDT:《Effi