日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 人工智能 > ChatGpt >内容正文

ChatGpt

AAAI 2021 《Regularizing Attention Networks for Anomaly Detection in Visual Question Answering》论文笔记

發(fā)布時(shí)間:2025/3/15 ChatGpt 28 豆豆
生活随笔 收集整理的這篇文章主要介紹了 AAAI 2021 《Regularizing Attention Networks for Anomaly Detection in Visual Question Answering》论文笔记 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

目錄

  • 簡(jiǎn)介
  • 動(dòng)機(jī)
  • 方法
  • 實(shí)驗(yàn)

簡(jiǎn)介

本文是POSTECH和Kakao合作的一篇文章。
論文鏈接

動(dòng)機(jī)

異常檢測(cè)有助于提升模型的穩(wěn)定性和可靠性,也就是魯棒性,OOD問(wèn)題也可以視為一種異常。但是,單模態(tài)的異常檢測(cè)(MSP)并不能輕易的使用到VQA這種多模態(tài)任務(wù)中。作者提出了一種基于attention的方法(MAP),可以對(duì)VQA中的五種異常進(jìn)行檢測(cè)。

方法

首先,作者將VQA任務(wù)中的異常情況分為五種,也就是五個(gè)TASK。

  • TASK1~TASK3
    這三個(gè)TASK很好理解,就是在輸入的視覺信息VVV和語(yǔ)言信息QQQ中,至少有一類是來(lái)自于OOD的。
  • TASK4
    TASK4指的是:VVVQQQ不相關(guān)。即:難以建立兩個(gè)模態(tài)之間的關(guān)聯(lián)。
  • TASK5
    TASK5指的是:通過(guò)VVVQQQ得到的AAA是OOD的。即:答案AAA是未定義的。

結(jié)合下面這幾種異常示例,可以便于理解。

傳統(tǒng)的單模態(tài)異常檢測(cè)方法,使用softmax\text{softmax}softmax判斷模型輸出的置信度,當(dāng)置信度低于閾值時(shí),則認(rèn)為發(fā)生了異常。但是這種方法不適用于VQA任務(wù),主要有兩方面原因:① 置信度是基于p(a∣v,q)p(a|v,q)p(av,q)計(jì)算的,對(duì)前四種TASK無(wú)法區(qū)分;② 進(jìn)行多模態(tài)特征融合后,原本的OOD可能會(huì)消失,即:VVVQQQ的OOD在進(jìn)行特征融合后表現(xiàn)為ID。

所以,作者提出了基于attention的異常檢測(cè)方法。本質(zhì)是使用VVV中每個(gè)region和QQQ中每個(gè)word的加權(quán)attention計(jì)算score。為了防止attention對(duì)異常過(guò)于strong,作者添加了正則項(xiàng),顯式地finetune模型。

實(shí)驗(yàn)

提升了模型的魯棒性,但降低了精度。

對(duì)于OOD問(wèn)題(TASK1~TASK3),檢測(cè)能力具有大幅提升。

對(duì)于TASK4:

對(duì)于TASK5:

總結(jié)

以上是生活随笔為你收集整理的AAAI 2021 《Regularizing Attention Networks for Anomaly Detection in Visual Question Answering》论文笔记的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。