CVPR 2016 SINT:《Siamese Instance Search for Tracking》论文笔记
? 理解出錯之處望不吝指正。
? 本文模型叫做SINT,和Siamese-fc一樣,通過相似學習解決跟蹤問題(這篇論文的發表時間比Siamese-fc早)。模型的整體結構如下:
???
-
? 跟蹤過程
? 模型分為兩路,左側為“Query stream”(接收第一幀的bbox),右側為“Search stream”(接收第t幀的candidate boxes),在跟蹤的過程中,根據下式選出得分最高的candidate box作為跟蹤結果。
???
???
? 函數表示對于輸入進行特征提取、池化、正則化之后得到的數據表示形式。
?
-
? 訓練過程
? 模型的訓練集和驗證集選擇的是ALOV。訓練集合包括60000對幀,每一對幀中包括128對bbox。驗證集包括2000對幀,每對包括128對bbox。
? 訓練過程就是最小化損失函數:
???
???
? 式中代表訓練對是正樣本對or負樣本對,如果是正樣本對,則,否則。
? 論文中提到,跟蹤問題作為一個定位問題,不應使用過多的max pooling,過多的max pooling會導致定位不準確。但是max pooling的優勢在于對于輸入的局部形變具有不變性,也不能棄之不用,故設計為兩個max pooling層。
?
-
? 實驗
? 首先是網絡結構的選擇,下圖是在OTB-2013上的測試結果:
???
? 作者通過實驗發現,max pooling對于Siamese Alexnet是不必要的:
???
? 下圖是模型在OTB-2013上的測試結果(其中SINT+是基于SINT上使用更好的采樣策略和光流附加模塊的一個模型):
???
???
?
?
?
?
?
?
總結
以上是生活随笔為你收集整理的CVPR 2016 SINT:《Siamese Instance Search for Tracking》论文笔记的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Ubuntu复制相同的目录结构(不复制文
- 下一篇: ICCV 2015 《Understan