日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

2020-07-02 CVPR2020 VL论文讨论(3) 笔记

發布時間:2025/3/15 编程问答 25 豆豆
生活随笔 收集整理的這篇文章主要介紹了 2020-07-02 CVPR2020 VL论文讨论(3) 笔记 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

目錄

  • [1] Bi-directional Relationship Inferring Network for Referring Image Segmentation
  • [2] A Real-Time Cross-modality Correlation Filtering Method for Referring Expression Comprehension
  • [3] Vision-Dialog Navigation by Exploring Cross-modal Memory
  • [4] VQA with No Questions-Answers Training
  • [5] Referring Image Segmentation via Cross-Modal Progressive Comprehension
  • [6] Local-Global Video-Text Interactions for Temporal Grounding
  • [7] Hypergraph Attention Networks for Multimodal Learning
  • 總結

[1] Bi-directional Relationship Inferring Network for Referring Image Segmentation

  • 盧湖川老師
  • 已有方法:語言->視覺,沒有視覺->語言。(->:指導)

[2] A Real-Time Cross-modality Correlation Filtering Method for Referring Expression Comprehension

  • 北航劉偲、中山李冠斌
  • 現有方法:兩階段(生成proposals、選最優proposal)比較慢
  • 將相關濾波引入跨模態領域,用language feature當做kernel,在image feature上做相關濾波,得到響應圖(bbox的中心),再回歸w和h。
  • 像極了SiamRPN,只不過一個branch改成了另一個模態。

[3] Vision-Dialog Navigation by Exploring Cross-modal Memory

  • 跨模態記憶問題?
  • 導航:只基于對話歷史->加入視覺模塊

[4] VQA with No Questions-Answers Training

  • 不用answer就可以訓練。
  • 通過問題圖,生成問題,生成的問題的答案沒有意義。

[5] Referring Image Segmentation via Cross-Modal Progressive Comprehension

  • 額,沒太聽懂。

[6] Local-Global Video-Text Interactions for Temporal Grounding

  • 參考鏈接

[7] Hypergraph Attention Networks for Multimodal Learning

  • 參考鏈接

總結

這次結束的超級快,一小時20分鐘。

總結

以上是生活随笔為你收集整理的2020-07-02 CVPR2020 VL论文讨论(3) 笔记的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。