Computing Trajectory Similarity in Linear Time: A Generic Seed-Guided Neural Metric Learning Appr...
Computing Trajectory Similarity in Linear Time: A Generic Seed-Guided Neural Metric Learning Appr...
? ? 摘要:現有的軌跡相似測度計算成本高,已成為尺度軌跡分析的關鍵瓶頸。雖然已經有很多關于降低復雜性的研究,但它們都是針對一種相似度度量,通常只能產生有限的加速。為了加快軌跡相似度計算,我們提出了NEUTRAJ算法。NEUTRAJ是通用的,以適應任何現有的軌跡測量,并快速計算一個給定的軌跡對的相似性在線性時間。此外,NEUTRAJ可以靈活地與所有基于空間的軌跡索引方法協作,減少搜索空間。NEUTRAJ從給定的數據庫中采樣大量的種子軌跡,然后使用它們的成對相似度作為指導,使用神經度量學習框架逼近相似函數。NEUTRAJ的兩個新模塊實現了相似函數的精確逼近:(1)空間注意記憶模塊,增強了現有的循環神經網絡的軌跡編碼;(2)距離加權排序損失,有效地從基于種子的指導中轉錄信息。使用這兩個模塊,NEUTRAJ可以在訓練數據較小的情況下產生較高的精度和較快的收斂速度。我們在兩個真實的數據集上進行的實驗表明,NEUTRAJ在Fr echet、Hausdorff、ERP和DTW測量上達到了80%以上的準確性,持續且顯著地優于當前最先進的基線。它獲得50x1000x加速比bruteforce方法和3 -500x加速比現有的近似算法,同時產生更精確的相似函數近似。
模型:我們提出了一個模型,大大加快了軌跡相似度計算的任何措施。我們提出的模型名為NEUTRAJ,是一種基于神經度量學習的近似方法。NEUTRAJ從數據庫中對種子軌跡庫進行采樣,并使用它們的配對相似性作為指導。具體來說,NEUTRAJ學習了一個神經網絡,該神經網絡聯合嵌入輸入軌跡并逼近距離函數。它具有以下吸引人的特點
1)?通用:與以往的方法不同,NEUTRAJ是通用的,可以支持任何現有的方法。因此,它可以用于加速大多數軌跡挖掘任務。
2)快速:給定一對特殊軌跡,NEUTRAJ能夠以O(L)時間復雜度計算它們的相似度,其中L是這對軌跡的長度和。在實踐中,我們觀察到它至少比精確的蠻力計算快50倍。
3)準確:NEUTRAJ在實踐中獲得卓越的逼近性能。在兩個真實軌跡數據集上,對Fr echet、Hausdorff、DTW和ERP的前10個相似軌跡搜索任務,NEUTRAJ的命中率在80%以上,平均誤差距離在50米以下。與目前最先進的軌跡相似度逼近方法[12]相比,該方法的命中率提高了2倍以上。
4)彈性:NEUTRAJ在不丟失空間信息的情況下嵌入軌跡,使其具有彈性,可以通過其他索引和修剪策略進行擴展。在不需要所有對相似性的任務中,減少計算空間。
NEUTRAJ的核心是一個深度度量學習框架,它使用循環神經網絡(rnn)生成軌跡嵌入。我們從數據庫中取樣種子軌跡庫,并計算它們的配對相似性。以計算出的種子相似度為指導,我們設計了一種兩兩損失來優化網絡以擬合種子相似度。NEUTRAJ的特點是兩個新穎的模塊,鼓勵網絡準確地逼近相似函數
(1)空間注意記憶。普通rnn及其現有變體(GRU、LSTM)只能對一個序列進行建模,而不考慮序列間的相關性。我們設計的SAM單元利用注意力機制記憶先前處理過的軌跡信息,并捕捉訓練軌跡之間的相關性,以產生更好的軌跡嵌入。(2)距離加權排序損失。利用種子軌跡的一個困難是效率和有效性之間的兩難。一方面,充分訓練網絡會更好地遍歷所有的軌跡對。另一方面,所有軌跡對的完整枚舉會導致昂貴的計算時間。為了解決這一難題,我們提出了一種距離加權抽樣策略,以聚焦于更有區別的訓練對。與加權采樣策略一樣,距離加權排序損失是一種從種子中學習網絡參數以適應引導的排序損失。利用這兩個模塊,NEUTRAJ可以在訓練數據較小的情況下獲得較高的精度和較快的收斂速度。
貢獻:
1)提出了一種基于神經度量學習的軌跡相似度加速計算方法。據我們所知,NEUTRAJ是第一種支持加速一般軌跡相似度量的方法,這使得它廣泛適用于許多應用。2)提出了一種空間注意記憶單元,用于基于注意網絡和外部記憶張量來模擬空間閉合軌跡之間的相關性。3)我們設計了一個加權采樣和學習模塊,充分釋放種子軌跡的力量。與現有架構相比,我們的學習模塊具有更快的收斂速度和更高的精度。4)我們在兩個真實的軌跡數據集和四個流行的軌跡相似度測度上進行了廣泛的實驗。結果表明,所提出的模型在準確性和效率方面始終優于最先進的基線。
問題定義:
我們考慮一個軌跡數據庫T和一個軌跡相似函數f(·,·)。每個軌跡T∈T是記錄運動物體軌跡的點序列。函數f(Ti,Tj)度量Ti和Tj之間的相似度。這里,f(·,·)可以是DTW相似度、Hausdorff距離、Fr′echet距離或任何其他軌跡相似度度量。我們的問題是在相似函數f(·,·)下計算從T開始的一對特殊軌跡的相似度。然而,對于大多數流行的相似度量,計算一對軌跡之間的相似度會產生二次時間復雜度。研究的問題是:如何學習一個近似相似函數g(·,·),使計算g(Ti,Tj)花費O(n)時間,同時最小化差值|f(Ti, Tj) g(Ti,Tj) |。
架構
它隨機地從T處采樣N條軌跡作為種子庫。為種子庫,計算對稱的N ×N距離矩陣D,然后將原始的距離矩陣轉換為歸一化的相似度矩陣S。利用矩陣S作為指導,NEUTRAJ進一步學習神經網絡,該神經網絡將任意長度的軌跡映射到低維空間,捕捉它們的相似度。更正式地說,對于任意兩個輸入軌跡Ti和Tj (i, j[1,…,N]), NEUTRAJ將它們分別投影到二維向量Ei和Ej。學習到的映射應該是保持相似的,即f(Ti,Tj) g(Ti,Tj)其中g(·,·)是Ei和Ej在嵌入空間中的相似度。它由空間注意記憶(SAM)增強RNN編碼器和種子引導度量學習方法兩大部分組成。
1.SAM Augmented RNN Encoder.? NEUTRAJ利用循環神經網絡(RNN)對軌跡進行建模,并以RNN的最后一個隱藏狀態作為嵌入向量。然而,如前所述,普通rnn及其變體(GRU, LSTM)分別獲取每個序列的信息。在軌跡相似度計算中,軌跡之間的相關性至關重要。重要的是利用之前看到的空間閉合軌跡的信息來指導度量學習過程。因此,我們在NEUTRAJ中設計了一個空間注意記憶模塊。它使用空間記憶張量來存儲先前處理過的軌跡的空間信息。記憶張量基于軟注意機制支撐整個空間的讀寫操作,這樣之前看到的軌跡信息就可以按需進行編碼和檢索。
2.?Seed-Guided Neural Metric Learning
? NEUTRAJ構建了一個種子引導的度量學習體系結構來消耗一對軌跡,并學習網絡來逼近相似矩陣s。現有的度量學習方法采用隨機抽樣的方法來產生訓練對,這意味著所有軌跡的權重都是均等的。但是這個假設并不適用于軌跡度量學習,因為它忽略了軌跡之間的空間接近性。特別地,我們提出了距離加權抽樣方法和排序損失目標來解決這一問題。
總結
以上是生活随笔為你收集整理的Computing Trajectory Similarity in Linear Time: A Generic Seed-Guided Neural Metric Learning Appr...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 企业各首席官以及工作介绍
- 下一篇: R语言Excel的读写