當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

2020-07-02 CVPR2020 VL论文讨论（3）笔记

發布時間：2025/3/15 编程问答 30 豆豆

生活随笔收集整理的這篇文章主要介紹了 2020-07-02 CVPR2020 VL论文讨论（3）笔记小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

[1] Bi-directional Relationship Inferring Network for Referring Image Segmentation
[2] A Real-Time Cross-modality Correlation Filtering Method for Referring Expression Comprehension
[3] Vision-Dialog Navigation by Exploring Cross-modal Memory
[4] VQA with No Questions-Answers Training
[5] Referring Image Segmentation via Cross-Modal Progressive Comprehension
[6] Local-Global Video-Text Interactions for Temporal Grounding
[7] Hypergraph Attention Networks for Multimodal Learning
總結

[1] Bi-directional Relationship Inferring Network for Referring Image Segmentation

盧湖川老師
已有方法：語言->視覺，沒有視覺->語言。（->：指導）

[2] A Real-Time Cross-modality Correlation Filtering Method for Referring Expression Comprehension

北航劉偲、中山李冠斌
現有方法：兩階段（生成proposals、選最優proposal）比較慢
將相關濾波引入跨模態領域，用language feature當做kernel，在image feature上做相關濾波，得到響應圖（bbox的中心），再回歸w和h。
像極了SiamRPN，只不過一個branch改成了另一個模態。

[3] Vision-Dialog Navigation by Exploring Cross-modal Memory

跨模態記憶問題？
導航：只基于對話歷史->加入視覺模塊

[4] VQA with No Questions-Answers Training

不用answer就可以訓練。
通過問題圖，生成問題，生成的問題的答案沒有意義。

[5] Referring Image Segmentation via Cross-Modal Progressive Comprehension

額，沒太聽懂。

[6] Local-Global Video-Text Interactions for Temporal Grounding

參考鏈接

[7] Hypergraph Attention Networks for Multimodal Learning

參考鏈接

總結

這次結束的超級快，一小時20分鐘。

總結

以上是生活随笔為你收集整理的2020-07-02 CVPR2020 VL论文讨论（3）笔记的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： CVPR 2020 《Local-Glo
下一篇： 2020-07-03 CVPR2020

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

生活随笔

生活随笔

编程问答

2020-07-02 CVPR2020 VL论文讨论（3）笔记

目錄

[1] Bi-directional Relationship Inferring Network for Referring Image Segmentation

[2] A Real-Time Cross-modality Correlation Filtering Method for Referring Expression Comprehension

[3] Vision-Dialog Navigation by Exploring Cross-modal Memory

[4] VQA with No Questions-Answers Training

[5] Referring Image Segmentation via Cross-Modal Progressive Comprehension

[6] Local-Global Video-Text Interactions for Temporal Grounding

[7] Hypergraph Attention Networks for Multimodal Learning

總結

總結

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

2020-07-02 CVPR2020 VL论文讨论（3） 笔记

目錄

[1] Bi-directional Relationship Inferring Network for Referring Image Segmentation

[2] A Real-Time Cross-modality Correlation Filtering Method for Referring Expression Comprehension

[3] Vision-Dialog Navigation by Exploring Cross-modal Memory

[4] VQA with No Questions-Answers Training

[5] Referring Image Segmentation via Cross-Modal Progressive Comprehension

[6] Local-Global Video-Text Interactions for Temporal Grounding

[7] Hypergraph Attention Networks for Multimodal Learning

總結

總結

2020-07-02 CVPR2020 VL论文讨论（3）笔记