日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

CVPR 2021 《Domain-robust VQA with diverse datasets and methods but no target labels》论文笔记

發布時間:2025/3/15 编程问答 16 豆豆
生活随笔 收集整理的這篇文章主要介紹了 CVPR 2021 《Domain-robust VQA with diverse datasets and methods but no target labels》论文笔记 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

目錄

  • 簡介
  • 動機
  • 方法
  • 實驗

簡介

論文鏈接

動機

由于cv中的方法通常會過擬合數據集,所以很多學者嘗試讓這些方法對“域變化”魯棒。但是,這些domain adaptation方法并不適用于VQA任務,主要由于三個原因:

  • VQA任務的輸入是多模態的;
  • VQA方法由不同的模塊構成了多個步驟,導致優化復雜;
  • 不同的VQA數據集的answer space是不同的。
  • 為了應對上述問題,作者主要做了以下三個方面的工作:

  • 量化不同VQA數據集之間的domain shift,并在image和question domain分別合成了新的數據。
  • 測試了不同類型的VQA方法的魯棒性。
  • 測試了現有的domain adaptation方法,并提出了一個新的更適用于VQA任務的方法。

  • 方法

    個人認為,本文主要的貢獻在于,作者通過分析不同方法的魯棒性,得出“NMNs方法較為魯棒”的結論,進一步做了“推理是和domain無關”的假設。根據這個假設,作者設計了適用于VQA領域的domain adaptation方法,也就是下圖中的Two-stage DA。核心思想就是,把Visual Encoder預訓練好,再去訓練VQA模型(此時保持Visual Encoder不更新)。也就是說:Training Stage 1學習表達,Training Stage 2學習推理,由于“推理和domain無關”,所以得到的模型更加魯棒。


    實驗

    下圖是作者測試了不同VQA數據集之間的domain gap:

    下表是不同類方法的domain adaptation性能測試(分別是image shift和question shift情況下):


    接下來,作者測試了本文提出的訓練策略和已有的domain adaptation方法的對比:


    總結

    以上是生活随笔為你收集整理的CVPR 2021 《Domain-robust VQA with diverse datasets and methods but no target labels》论文笔记的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。