MOSSE论文笔记
MOSSE論文筆記
1.背景介紹
本文設計了一種新的相關濾波器,誤差最小平方和(MOSSE)濾波器,當初始化視頻中第一幀,就可以產生穩定的相關濾波器。在669fps的速度的時候,它對亮度,尺度,位姿和不嚴格的變形的魯棒性比較好。
2.算法實現
基于濾波的跟蹤就是用在模板圖片上訓練好的濾波器去對目標物體的外表建模。目標最初是基于以第一幀中的目標為中心的一個小跟蹤窗口來選擇的。從這點上來說,跟蹤和濾波器訓練是一起進行的。通過在下一幀圖片的搜索窗口中去進行濾波來跟蹤目標。濾波之后產生的最大值的地方就是目標的新位置。根據得到的新位置完成在線更新。
為了得到一個快速的跟蹤器,濾波過程在頻域下進行,首先,對圖片進行傅里葉變換處理:F=F(f),然后濾波器也進行傅里葉變換計算:H=F(h),在頻域上的卷積運算就變成了對應元素乘機的運算。頻域上的卷積運算公式如下所示,*表示復共軛,⊙表示頻域下的卷積運算。
得到的G通過反傅里葉變換映射回空間域。這個過程的核心就是計算傅里葉變換和反向傅里葉變換,這個過程的時間是O(PlogP),P是跟蹤窗口中像素的數量。
Preprocessing
傅里葉卷積算法的一個問題就是,圖片和濾波器經過傅里葉變換之后會被映射成類似花瓣的結構。在卷積的過程中,圖片通過環形空間旋轉,而不是像空間域中去平移。人工地連接圖片的邊緣會人為地影響輸出。通過下面的操作會降低這種影響:首先對每個像素的灰度值進行log運算來幫助低對比度的情況。像素灰度值再被規范化成平均值為0,方差為1。圖片再乘以一個余弦窗口來是圖片邊緣的值降為0。這也有一個好處,它把更多的重點放在接近目標的中心。
MOSSE Filters
???????? MOSSE是一種從少量訓練圖片來產生類似ASEF濾波器的算法。開始的時候,它需要一系列訓練圖片fi和訓練輸出gi。一般來說,gi可以是任何尺寸。在這種情況下,gi由ground true產生以便于它有一個(σ= 2.0)的二維高斯形狀的高峰集中在訓練圖像f的目標中間。在傅里葉域中進行訓練以便于可以利用輸入和輸出之間簡單的元素對應運算。
???????? 為了找到一個濾波器來使訓練圖片輸出接近于ground true,MOSSE來找一個H使得實際輸出和ground true輸出之間誤差平方和最小。問題如下:
???????? 解決這個優化問題不難但是需要考慮一些情況。首先,每個H(下標是w和v)可以被獨立地算出因為所有的地操作都是在頻域上進行的。上面問題由下面公式解決:
???????? 最后得到的濾波器就由下面公式算出:
Regularization of ASEF
ASEF采用了一種稍微不同的方法來最小化相關轉換后產生的誤差。它證明當有一個訓練圖片Fi和一個輸出圖片Gi,會有一個濾波器產生0誤差。這個濾波器被叫做精準濾波器并且可以被下面的公式計算出。
在一張圖片上訓練的精準濾波器幾乎總是過擬合。當這個濾波器應用到一個新的圖片上時,它就會失效。用平均方法來產生濾波器是普遍的。ASEF濾波器如下所示:
如果只有一張圖片用來訓練,MOSSE和ASEF都會產生一個精準濾波器。
Filter Initialization and Online Updates
上面的公式描述了濾波器如何通過在初始化階段被構造。用隨機的仿射變換去生成第一幀的跟蹤窗口的8個小的擾動(fi)。訓練輸出(gi)也由和目標中心相關的峰值生成。在追蹤階段,目標可能經常改變外觀。因此,濾波器需要快速地適應來跟上物體。進行平均運算用來解決這個問題。例如,從第i幀學習到的ASEF濾波器按如下公式計算:
從第i幀學習到的MOSSE濾波器按如下公式計算:
3.總結
MOSSE是一種非常簡單的跟蹤方法,但是這種匹配方法有一定的缺陷,準確度不夠,后面有多種方法進行改進
總結
- 上一篇: [dp]leetcode 1025. D
- 下一篇: 使用Shell脚本查询服务器硬件信息