日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

CVPR 2020 《Local-Global Video-Text Interactions for Temporal Grounding》论文笔记

發布時間:2025/3/15 29 豆豆
生活随笔 收集整理的這篇文章主要介紹了 CVPR 2020 《Local-Global Video-Text Interactions for Temporal Grounding》论文笔记 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

目錄

  • 簡介
  • 動機
  • 貢獻
  • 方法
  • 實驗

簡介

本文的作者來自浦項科技大學和首爾大學
下載鏈接

動機

在Grounding領域,早些的方法都可以歸結為scan-and-localize framework,主要包括兩個步驟:1. 生成proposals;2. 根據matching score進行選擇。但是這一類方法存在很大的弊端:獲得matching score的過程中,使用text query的全局特征,丟失了用于定位的細節信息。后續,有人對方法進行了改進,將此task視為注意力定位問題,通過回歸解決。弊端:局限于最具有判別力的短語,沒有對context進行全面的理解。

貢獻

  • 將text query分為多個短語,每個短語作為context,與video進行交互。
  • 從局部->全局,建模視頻片段和短語的關系。
  • 實驗結果,large margin。
  • 方法

    本文方法的整體框架如圖所示。

    實驗

    在Charades-STA數據集上的實驗結果:

    在ActivityNet Captions數據集上的實驗結果:

    在Charades-STA數據集上的消融實驗:

    總結

    以上是生活随笔為你收集整理的CVPR 2020 《Local-Global Video-Text Interactions for Temporal Grounding》论文笔记的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。