ECCV 2012 CSK:《Exploiting the circulantstructure of tracking-by-detection with kernels》论文笔记
? 理解出錯之處望不吝指正。
? 本文模型就是大名鼎鼎的CSK。
? 本文的貢獻:
??? (1)稠密采樣、循環移位;
??? (2)循環矩陣帶來的快速計算;
??? (3)計算了不同的核函數的封閉解。
.
-
? 稠密采樣、循環移位
???
? 如上圖所示,以往的方法中,采用的都是隨機采樣,作者說這會帶來很大的冗余,并且只使用到了bbox的局部特征。而作者提出的稠密采樣可以將整張圖片的特征都利用起來。
? 實際上,訓練樣本是通過循環移位產生的。首先,稠密采樣得到的樣本與循環移位產生的樣本很像,可以用循環移位來近似;其次,卷積(or互相關)運算在傅里葉域對應可以轉化為點乘,且循環矩陣經過傅里葉變換會對角化,這兩點都可以減小計算量。
?
-
? 循環矩陣帶來的快速計算
? 首先,我們要知道,對于tracking任務,可以形式化的描寫為下式:
???
? 這里的代表的是一個線性分類器.
? 作者使用的是RLS(Regularized Least Squares)損失:.
? 通過使用kernel trick,這里核函數使用表示。根據表示定理,我們可以得出:.
? 進一步,我們可以得出RLS with Kernels(KRLS)的封閉解:
???
? 這里為kernel martix,為單位矩陣。注意到這個公式中存在矩陣的求逆操作,這會帶來很大的計算量,作者接下來的目的就是簡化上式的計算量。
?
? 作者觀察到,一個向量通過循環移位可以得到一個循環矩陣:
???
? 若是將循環矩陣和矩陣相乘,即求,可以變換到傅里葉域進行快速計算:
???
? 同時作者在論文中提到,循環矩陣的和、點積、求逆都還是循環矩陣。接下來,就是將循環矩陣的性質應用到求解中。
?
? 對于一個給定的圖片,我們將其轉化為一個的向量,則采樣操作可以看為:
???
? 這里的矩陣是用來實現循環移位的置換矩陣。
? 接下來,作者證明了,若是一個unitarily invariant kernel,則由元素組成的kernel martix 是一個循環矩陣。這對于KRLS來說是滿足的(滿足的還有:高斯核函數、線性核函數、多項式核函數等)。則對于組成的向量,這里。參照的變換,可以得到的解:
???
? 至此,我們可以快速的計算出,訓練過程可以很快速的完成。
? 注意,我們通篇的目的實際上就是要求解,細心的朋友會問,那呢?論文中第四頁最下面有這樣一句話:“The bias term b is not important in practice, when finding the maximum response.”。
?
-
? 快速檢測過程
? 對于一個輸入圖像,response可以通過下式計算:
???
? 使用前文中提到的技巧,我們可以通過下式快速的得到response:
???
? 這里向量中的元素為.
? 到目前為止,基本上已經沒有矩陣運算了,不過為什么說基本上呢?因為還有一個地方需要矩陣運算,就是計算。接下來,作者對核矩陣的快速計算進行了推導,使上式中徹底沒有了矩陣運算,這里就不做介紹了。
?
-
? 本模型的缺點:
? (1)采用單通道的灰度特征,特征表達能力有限(KCF/DCF中解決);
? (2)循環矩陣會導致邊界效應(SRDCF中解決);
? (3)模型中沒有尺度更新,對尺度變換不敏感(DSST中解決)。
?
-
? 啥是邊界效應?
??? 訓練階段,目標中心移動到邊緣附近,此時應視為負樣本,在檢測階段,當目標移動到邊界附近,此時的目標和訓練時使用的負樣本是比較接近的,但是此時應當把此作為正樣本來檢測目標。實際算法會將其視為負樣本,所以經常會導致跟蹤失敗。
總結
以上是生活随笔為你收集整理的ECCV 2012 CSK:《Exploiting the circulantstructure of tracking-by-detection with kernels》论文笔记的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: CVPR 2010 MOSSE:《Vis
- 下一篇: ECCV 2012 KCF/DCF:《H