日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

PaperNotes(19)-Learning Lane Graph Representations for Motion Forecasting

發布時間:2023/12/13 编程问答 49 豆豆
生活随笔 收集整理的這篇文章主要介紹了 PaperNotes(19)-Learning Lane Graph Representations for Motion Forecasting 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Learning Lane Graph Representations for Motion Forecasting

    • 1.ActorNet
    • 2.MapNet
    • 3.FusionNet
    • 4.Prediction Header
    • 5.模型參數學習

自動駕駛論文閱讀筆記2
Uber–ECCV2020–論文文章代碼

模型的作用:Motion Forecasting (這個motion都包括什么呢?)
方法:模型由四個模塊組成–ActorNet、MapNet、FusionNet、Header

1.ActorNet

作用–編碼actor軌跡特征

  • 輸入:每一條actor的軌跡(3xT的輸入向量)(actor包括所有運動者?)
  • 操作:1D CNN + FPN(特征金字塔)(多尺度不斷上采樣融合特征)
  • 輸出:該軌跡的特征向量(多少維度呢?128維度么)
  • 軌跡表示–位移差
    {Δp?(T?1),...,Δp?1,Δp0}\{\Delta p_{-(T-1)},...,\Delta p_{-1},\Delta p_{0}\}{Δp?(T?1)?,...,Δp?1?,Δp0?}

    Δpt=(xt,yt)?(xt?1,yt?1)\Delta p_{t} = (x_t,y_t)-(x_{t-1},y_{t-1})Δpt?=(xt?,yt?)?(xt?1?,yt?1?)

    長度為T,不足T的padding 0,下面2xT的位移向量 拼接 1xT的padding標志向量(1-表示該位置的位移是padding的)

    ActorNet–3組1D卷積,每組包括兩個殘差塊;特征金字塔融合多尺度的特征(卷積 卷下去,上采樣,再和對應的尺度疊加)

    輸出-- The output of ActorNet is a temporal feature map,whose element at t = 0 is used as the actor feature.(不是很清楚這個時間序列是怎么回事?)

    2.MapNet

    作用–編碼地圖特征,主要是對車道的編碼

  • 構建lane graph(結點與連接的定義)
  • 利用LaneGCN獲取lane圖的特征
  • 2.1 構建lane Graph

  • lane node --車道中心線的一段,結點位置為兩端結點坐標的均值。==一條車?所有?==道線上的眾多結點可以表示為向量V∈RN×2V\in\mathbb{R}^{N\times 2}VRN×2(結點的二維特征表示)
  • 車道結點特征向量帶有4個連接矩陣{Ai}i∈{pre,suc,left,right}\{A_i\}_{i\in \{pre,suc,left,right\}}{Ai?}i{pre,suc,left,right}?,Ai∈RN×NA_i\in\mathbb{R}^{N\times N}Ai?RN×N, Ai,jk=1A_{i,jk}=1Ai,jk?=1表示結點jjj 存在一個類型iii的鄰居結點kkk
  • LaneConv Operator
    a). lane node 特征xix_ixi?–編碼形狀(長度方向),位置(空間坐標)信息,經過全聯接層處理后,輸出lane node特征xix_ixi?;構成結點特征矩陣XXX
    xi=MLPshape(viend?vistart)+MLPloc(vi)x_i=MLP_{shape}(v_i^{end}-v_i^{start})+MLP_{loc}(v_i)xi?=MLPshape?(viend??vistart?)+MLPloc?(vi?)
    b).LaneConv 為了獲得lane graph大規模拓撲信息(四個AiA_iAi?矩陣都用上)
    Y=XW0+∑i∈{pre,suc,left,right}AiXWiY=XW_0+\sum_{i\in\{pre,suc,left,right\}}A_iXW_iY=XW0?+i{pre,suc,left,right}?Ai?XWi?
    c).Dilated LaneConv 為了讓模型獲得車道線方向的長時依賴關系(速度快的物體位移大,只用到ApreA_{pre}Apre?AsucA_{suc}Asuc?)
    Y=XW0+AprekXWpre,k+AsuckXWsuc,kY=XW_0 + A^k_{pre}XW_{pre,k} + A^k_{suc}XW_{suc,k}Y=XW0?+Aprek?XWpre,k?+Asuck?XWsuc,k?
    d). LaneConv(k1,...,kc)LaneConv(k_1,...,k_c)LaneConv(k1?,...,kc?)=Dilated LaneConv + LaneConv - kck_ckc?為第ccc個dilation 尺寸
    Y=XW0+∑i∈{left,right}AiXWi+∑c=1C(AprekcXWpre,kc+AsuckcXWsuc,kc)Y=XW_0+\sum_{i\in\{left,right\}}A_iXW_i + \sum_{c=1}^C(A^{k_c}_{pre}XW_{pre,k_c}+A^{k_c}_{suc}XW_{suc,k_c})Y=XW0?+i{left,right}?Ai?XWi?+c=1C?(Aprekc??XWpre,kc??+Asuckc??XWsuc,kc??)
  • 2.2 LaneGCN操作
    LaneConv(k1,...,kc)LaneConv(k_1,...,k_c)LaneConv(k1?,...,kc?) + Linear Layer 構成殘差塊, 4個殘差塊堆疊,構成LaneGCN。

    注意點:
    每個結點與鄰居結點的連接關系,指明前后左右的結點。
    a). 結點A的前驅結點、后續結點:同一條車道線上,能夠到達A的結點和A能夠到達的結點
    b).結點A的左鄰居結點、右鄰居結點:鄰居車道線上空間距離l2l_2l2?最近的結點

    對車道結點圖不采用廣泛使用的圖卷積L=D?12(I+A)D?12(1)L=D^{-\frac{1}{2}}(I+A)D^{-\frac{1}{2}}(1)L=D?21?(I+A)D?21?(1)更新隱狀態的原因:
    a). 不知道結點特征會保存何種車道信息(可解釋性不強?)
    b). 該拉普拉斯矩陣操作沒法獲取結點的連接關系信息(沒有對AiA_iAi?矩陣的操作,(1)式中的A為結點的鄰接矩陣,與AiA_iAi?內涵不同)
    c). 無法解決長時依賴性的問題
    為了解決以上三個不足點,作者提出了LaneConv Operator操作。

    Dilated LaneConv 參考了dilated convolution,說是能夠沿著車道線傳遞k步的信息。

    3.FusionNet

    利用空間注意力機制(spatial attention)(用于構建A2L, L2A, A2A) 和LaneGCN(主要用來構建L2L網絡的)融合actor結點和lane結點的信息,
    四個信息融合模塊:

  • A2L-將實時交通信息傳達給lane node
  • L2L-依據實時交通信息,更新lane node 的特征
  • L2A-將更新后lane node 的特征返回給actor
  • A2A-解決actor之間的相互作用,并且actor特征給motion預測網絡
  • L2L 網絡結構-結點特征更新時的LaneGAN結構一致
    A2L, L2A, A2A網絡結構一致,采用空間注意力機制構成殘差塊。
    yi=xiW0+∑j?(concat(xj,Δi,j,xj)W1)W2y_i=x_iW_0 + \sum_j\phi(concat(x_j,\Delta_{i,j},x_j)W_1)W_2yi?=xi?W0?+j??(concat(xj?,Δi,j?,xj?)W1?)W2?

    4.Prediction Header

    Prediction Header包含兩路分支

  • 回歸分支- 回歸每一個actor的k種模態(速度?path?)的預測軌跡,每一條軌跡包括T個時間步長,pm,1kp_{m,1}^kpm,1k?軌跡的二維特征。
    Om,reg={(pm,1k,pm,2k,...,pm,Tk)}k∈[0,K?1]O_{m,reg}=\{(p_{m,1}^k,p_{m,2}^k,...,p_{m,T}^k)\}_{k\in[0,K-1]}Om,reg?={(pm,1k?,pm,2k?,...,pm,Tk?)}k[0,K?1]?

  • 分類分支-計算每個actor k種模態的置信度, 輸入特征:actor 特征 拼接 預測軌跡的偏移 embeding-pm,Tk?pm,1kp_{m,T}^k-p_{m,1}^kpm,Tk??pm,1k?

  • 5.模型參數學習

    end-to-end 學些過程,總的損失函數=分類損失+回歸損失
    L=Lcls+αLregL=L_{cls} + \alpha L_{reg}L=Lcls?+αLreg?
    分類損失:置信系數的max-margin loss
    Lcls=1M(K?1)∑m=1M∑k≠k^max?(0,cm,k+??cm,k^)L_{cls}=\frac{1}{M(K-1)}\sum_{m=1}^M\sum_{k\neq\hat{k}}\max(0, c_{m,k}+\epsilon-c_{m,\hat{k}})Lcls?=M(K?1)1?m=1M?k?=k^?max(0,cm,k?+??cm,k^?)
    回歸損失:正預測軌跡,逐結點smoth l1 loss
    Lreg=1MT∑m=1M∑t=1Treg(pm,tk^?pm,t?)L_{reg}=\frac{1}{MT}\sum_{m=1}^M\sum_{t=1}^Treg(p_{m,t}^{\hat{k}}-p_{m,t}^*)Lreg?=MT1?m=1M?t=1T?reg(pm,tk^??pm,t??)

    注:正軌跡k^\hat{k}k^,在最后一個時間結點處擁有最小的偏移誤差。


    參考博文:
    1.ECCV2020介紹Uber在GNN-based motion forecasting的兩篇研究論文–還介紹了另一篇文章
    2.2007-Learning Lane Graph Representations–提供代碼開源信息,贊!
    3.文獻閱讀報告-Learning Lane Graph Representations for Motion Forecasting–有和VectorNet的比較。

    總結

    以上是生活随笔為你收集整理的PaperNotes(19)-Learning Lane Graph Representations for Motion Forecasting的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。