日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

VD-BERT:用BERT搭建统一的视觉对话模型

發布時間:2024/10/8 编程问答 39 豆豆
生活随笔 收集整理的這篇文章主要介紹了 VD-BERT:用BERT搭建统一的视觉对话模型 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

論文標題:

VD-BERT: A Unified Vision and Dialog Transformer with BERT

論文作者:

Yue Wang, Shafiq Joty, Michael R. Lyu, Irwin King, Caiming Xiong, Steven C.H. Hoi

論文鏈接:

https://arxiv.org/abs/2004.13278


視覺對話(Visual Dialog)指的是給定一張圖、它的標題和問題,我們需要給出這個問題的答案,在VD中,對話往往有多輪,而后面的問題會和前面的對話相關。

本文提出統一的視覺對話VD-BERT模型,聯合編碼視覺信息和文本信息,既適用于判別式方法,也適用于生成式方法。VD-BERT在視覺對話數據集VisDial實現了單個模型和集成模型上的最佳效果。

視覺對話

人類感知世界是“多模態”的而非“單模態”,學習知識也是在多模態的條件下進行的。

在所有的感知模態中,視覺和文本(語言),是其中最為重要的兩類,而文本又是人類所獨有的能力。

通過將視覺感知到的內容轉換為文本信息,是我們了解世界的重要途徑。視覺對話任務就是在模擬這個過程。

給定一副圖片(或視頻等視覺內容)和一個問題,我們可以根據圖片內容去回答這個問題。

之后,我們還可以連續問若干問題,每個問題都有回答,如此根據圖片和之前的對話進行下一輪對話,就是視覺對話,而找到每個問題的答案,就是視覺對話的目標。

這可以形式化為:

其中是視覺信息,是視覺信息的說明(如標題),是第輪的問題,是第輪的回答。

有兩種方法可以找到,一是“判別式”——從給定的一些回答候選中選一個,二是“生成式”——直接生成回答。

從上式可以看到,視覺對話實際上有四個部分:視覺信息V,對話歷史H,當前問題Q和當前回答A。

過去對視覺對話的研究大都采用注意力的方法,讓回答A去關注Q,V和H。然而,這種方法不能直接讓V和H之間建立聯系,從而可能忽略過去的對話內容。

基于此,本文提出VD-BERT,用BERT去建模多個部分的聯系,任意兩個部分之間就可以通過自注意力完成交互,從而不丟失歷史對話信息,如下圖所示:

和BERT一樣,本文使用MLM和NSP兩個訓練任務去訓練VD-BERT,然后再通過Rank的方法微調VD-BERT,從而可以使用一個模型同時完成判別式和生成式兩種生成方法。

總的來說,本文貢獻如下:

  • 使用預訓練的BERT作為視覺對話模型,并通過MLM和NSP的訓練得到一個統一模型;

  • 在VisDial數據集上實現了單個模型和集成模型二者的最優結果;

  • 可以同時應用在判別式和生成式兩種生成方法上。

VD-BERT

VD-BERT的結構和流程十分簡單。下圖是VD-BERT的模型結構:

模型流程分為幾步:得到視覺表征,得到文本表征,模型訓練,模型微調。

視覺表征

本文使用Faster R-CNN得到36個對象視覺表征,用于編碼圖片的視覺信息,記為。這些特征將作為BERT的輸入的一部分。

文本表征

為了編碼文本信息并讓其和視覺信息充分結合,本文按照BERT,把歷史對話以[EOT]為分隔符拼接起來,作為VD-BERT的文本部分,從而得到,其中是一個候選回答。

模型訓練

在得到視覺輸入和文本輸入后,把這兩個再拼接起來作為VD-BERT整個的輸入,得到。注意到,我們使用了預訓練的BERT去初始化VD-BERT,讓它得到一些文本的先驗知識。

為了訓練VD-BERT,本文提出兩個,也是BERT所提出的訓練任務:MLM和NSP。MLM和BERT一致,隨機掩碼文本部分15%的詞,讓模型去預測它。

NSP有所不同,VD-BERT所做的是,讓模型的[CLS]去預測當前的候選回答是不是真正的回答,即輸出一個0-1之間的概率。

對于判別式方法,只需要從候選回答集中采樣一些回答,然后再用NSP去預測是否正確即可;對于生成式方法,只需要一步一步預測即可,類似自回歸模型。

模型微調

除了一個回答是否是正確答案之外(0或1),VisDial v1.0還為每個候選答案給出了相關性得分,用于評判每個答案和正確答案之間的語義相關性,得分范圍為0-1之間。于是,VD-BERT就可以使用NSP在此基礎上進一步微調,而在推理的時候,只需要選擇得分最大的那個答案即可。

實驗

本文在視覺對話數據集VisDial v0.9和VisDial v1.0上實驗,使用BERT-base作為VD-BERT骨干,使用Recall@K、MRR、Mean Rank和NDCG作為測評指標,其他實驗細節詳見原文。

下表是在VisDial v1.0上的結果,可以看到,VD-BERT在幾乎所有指標上都超越了之前的模型。

特別注意到,微調的VD-BERT(*)只在NDCG上表現更好,而在其他指標上表現更差,這是因為NDCG衡量的回答的相關度,微調可以提高其表現,但是反而降低了在其他指標上的效果。

下表是在VisDial v0.9上的結果,可以看到,無論是判別式方法還是生成式方法,VD-BERT都能取得一致更好的效果。

下面來看看視覺信息和文本信息的交互情況。從下圖可以看到,文本和圖片中的對象是對應的。motorcycle關注了5和8(都是motorcycle),而he關注了4(人),helmet關注了4和8。

小結

本文提出VD-BERT,使用預訓練的BERT作為統一的視覺對話模型,通過MLM和NSP的訓練,VD-BERT能夠很好建模視覺信息和文本信息及其之間的相互聯系。

VD-BERT簡單有效,不需要任何模型結構設計,也不需要多余的損失函數優化,更不需要額外的標注數據,就能實現SOTA表現。

多模態是近些年發展很快的一個領域,因為和人類獲取信息的過程更接近,多模態能夠更大地推動CV和NLP在現實的應用和落地。更好、更快的多模態模型是未來的一個持續性研究方向。

????

現在,在「知乎」也能找到我們了

進入知乎首頁搜索「PaperWeekly」

點擊「關注」訂閱我們的專欄吧

關于PaperWeekly

PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。

總結

以上是生活随笔為你收集整理的VD-BERT:用BERT搭建统一的视觉对话模型的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 自拍偷拍视频在线 | 校园伸入裙底揉捏1v1h | 国产精品久久久久不卡 | 国产白丝袜美女久久久久 | japanese强行粗暴 | 婷婷综合视频 | 亚洲欧美第一页 | 中国免费毛片 | av片网| 少妇又紧又深又湿又爽视频 | 神马午夜伦理影院 | 96国产精品 | 欧美爱爱爱| 天天超碰| 久久久国产精品久久久 | 日韩欧美国产精品综合嫩v 国产小毛片 | 精品一级| 日本美女久久 | 国产ts在线播放 | 色视屏| 特级av片 | 久久新网址 | 久久精品三级 | 国产午夜一级一片免费播放 | 激情综合网五月天 | 日韩经典在线观看 | 黄页网址大全免费观看 | 午夜理伦三级理论 | 好男人www | 国产人免费人成免费视频 | 一个色av | 午夜影院免费视频 | 三级黄色在线 | 一区二区在线免费看 | 97精品人妻麻豆一区二区 | 日韩一区二区三区av | 国产黄色一级 | 黄色工厂在线观看 | 黄色高潮视频 | 国产视频aaa | 日本免费不卡 | 日本h视频在线观看 | 国产又色又爽无遮挡免费动态图 | 青青草公开视频 | 国产日日日 | 国产高清免费 | 五月天福利视频 | 波多野结衣加勒比 | 欧美一级在线看 | 美日韩精品视频 | 91麻豆免费看 | 高清久久 | 国产毛片久久久 | 国产美女自拍视频 | 欧美91看片特黄aaaa | 精品成人久久 | 狠狠操2019| 依依激情网 | 久久这里只有精品首页 | 六月丁香综合网 | 成年人看片网站 | 色射色| 久久精品国产亚洲av无码娇色 | 密桃成熟时在线观看 | 亚洲一区二区三区麻豆 | 欧洲黄色片 | 成人天堂 | 天天影视色| 国产午夜大地久久 | 人体一级片 | 精品视频在线一区 | 春色校园激情 | 久久最新 | 亚洲成人激情在线 | 狂野欧美性猛交xxxx | 日本免费不卡一区二区 | 美女扒开尿口给男人桶 | 肉视频在线观看 | 久久r这里只有精品 | 春色网站 | 在线视频 中文字幕 | 午夜美女福利 | 麻豆传媒网站入口 | 国产日韩欧美一区二区东京热 | 高潮毛片又色又爽免费 | 福利视频在线看 | 狠狠人妻久久久久久综合 | 91蝌蚪91九色白浆 | 国产无毛av | 国内精品小视频 | 超碰成人在线免费观看 | 欧美性猛交xx乱大交 | 亚洲精品天堂在线观看 | 久久精品免费电影 | 日本久久综合网 | 日韩中文字幕在线不卡 | 久久免费一区 | 污视频在线播放 | 日韩在线影视 |