日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 人工智能 > ChatGpt >内容正文

ChatGpt

Allen AI提出MERLOT,视频理解领域新SOTA!

發(fā)布時間:2024/7/5 ChatGpt 41 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Allen AI提出MERLOT,视频理解领域新SOTA! 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

文 | Yimin_飯煲

2021年,多模態(tài)領(lǐng)域大概是人工智能研究者們關(guān)注者最多的一個領(lǐng)域了。隨著各種模態(tài)數(shù)據(jù)集的增長和算力的發(fā)展,研究者們開始不斷地嘗試在一個模型中融合來自各個模態(tài)的信息。

而在多模態(tài)領(lǐng)域的研究中,和視頻相關(guān)的任務(wù)被認(rèn)為是最復(fù)雜的。

一方面,高質(zhì)量的視頻數(shù)據(jù)集比圖像數(shù)據(jù)集更加困難,因此數(shù)據(jù)集的數(shù)量和質(zhì)量往往受限;另一方面,視頻數(shù)據(jù)集中含有文本、圖像、語音等多個模態(tài)的信息,還要考慮時間線,融合起來比單純的圖像-文本數(shù)據(jù)更加復(fù)雜。

在AI領(lǐng)域久負(fù)盛名的Allen研究所向這一復(fù)雜的問題發(fā)起了挑戰(zhàn),提出了MERLOT系列工作。

第一篇 MERLOT:Multimodal Neural Script Knowledge Models 發(fā)表于Neurips 2021, 使用了大量的視頻數(shù)據(jù)進行自監(jiān)督預(yù)訓(xùn)練,在12個視頻問答任務(wù)上取得了SOTA;

而第二篇 MERLOT Reserve:Neural Script Knowledge through Vision and Language and Sound 則于今年年初剛剛發(fā)布,進一步深度融合了視頻中的語音信息,在多個任務(wù)上又取得了明顯提升。下面,就讓我們一起來學(xué)習(xí)這兩篇十分Solid的工作吧~

論文鏈接:
MERLOT:
https://arxiv.org/pdf/2106.02636.pdf
MERLOT Reserve:
https://arxiv.org/pdf/2201.02639.pdf

主要方法

MERLOT這一工作使用了視覺編碼器、語言編碼器和聯(lián)合編碼器。作者們設(shè)計了三個任務(wù)來進行優(yōu)化。

第一個任務(wù)是Contrastive Frame-caption matching(標(biāo)題-幀匹配),作者們使用視覺編碼器編碼圖片得到的[CLS]表示和文本編碼器編碼句子得到的[CLS]表示進行對比學(xué)習(xí),使得圖像編碼器具備較好的表示學(xué)習(xí)性能。

第二個任務(wù)是Masked Language Modeling,對模型的語言建模能力進行優(yōu)化。

第三個任務(wù)是Temporal Reordering, 在40%的情況下, 隨機選擇一個整數(shù), 從視頻輸入中的所有幀中隨機選取幀并進行打亂,將位置編碼 (e.g. )替換為隨機且獨特的位置編碼(e.g.). 這些隨機的位置編碼和原有的位置編碼分別進行學(xué)習(xí),可以讓模型學(xué)到恢復(fù)被擾亂的幀順序的能力。

這個任務(wù)的損失函數(shù)是針對一對視頻幀拼接隱狀態(tài),使用兩層MLP分類器進行二分類(和的前后關(guān)系)。

MERLOT Reserve這一工作相比于MERLOT引入了新的模態(tài):語音。

為了更好的融合來自三個模態(tài)的信息,作者們提出了更通用,更統(tǒng)一的訓(xùn)練任務(wù)。

對于每一個Batch的輸入,只輸入視頻的幀和文本/語音中的一個(由于文本和語音的信息具有重復(fù)性), 并且MASK文本/語音中的一部分。作者們提出了對比區(qū)域匹配(Contrastive Span Matching)這一任務(wù), 給定匹配的視頻幀/文本/語音數(shù)據(jù),以文本為例,最小化交叉熵?fù)p失函數(shù):

其中為[MASK]位置的隱狀態(tài)表示,為[MASK]掉的信息的隱狀態(tài)表示,為Batch中其他樣本(負(fù)樣本)的隱狀態(tài)表示。同理定義了,定義:

同樣的,可以定義和。定義總體的損失函數(shù)為:

作者們還使用了一些技巧來提升得到的特征表示的質(zhì)量,感興趣的小伙伴可以去原文細(xì)讀~。

數(shù)據(jù)集

對于大規(guī)模的預(yù)訓(xùn)練工作,除開訓(xùn)練方法之外另一個值得關(guān)注的部分就是使用的數(shù)據(jù)集了。

MERLOT收集的數(shù)據(jù)集為YT-Temporal-180M,從600萬公開的YouTube視頻中抽取得到。

作者們選取的數(shù)據(jù)集比起HowTo100M和VLOG等局限于特定領(lǐng)域的數(shù)據(jù)集范圍更大,主題更廣

后來的實驗表明,如果僅使用HowTo100M這樣的數(shù)據(jù)集進行訓(xùn)練,會降低模型在下游任務(wù)上的性能。

在MERLOT Reserve這一工作中,作者們擴充了數(shù)據(jù)集,提出了YT-Temporal-1B數(shù)據(jù)集,包含2000萬Youtube視頻,進一步提升了數(shù)據(jù)集的多樣性,而模型強大的性能也說明了擴充數(shù)據(jù)的有效性。

結(jié)果

作者們通過大量的實驗證實了MERLOT和MERLOT Reserve的有效性。對于MERLOT模型,作者們在12個視頻問答數(shù)據(jù)集上開展了實驗,大幅度刷新了SOTA。

MERLOT Reserve模型同樣也有非常強大的表現(xiàn),在視頻常識推理數(shù)據(jù)集上取得了不小的性能提升,超過了許多使用了其他監(jiān)督信息的模型。

由于MERLOT Reserve使用了大量的數(shù)據(jù)進行了自監(jiān)督預(yù)訓(xùn)練,因此在零樣本學(xué)習(xí)上有著不錯的性能,在STAR數(shù)據(jù)集上相比于有監(jiān)督的SOTA都有著明顯的提升。

結(jié)語

多模態(tài)技術(shù)的發(fā)展和商業(yè)化,也許將會帶來人工智能應(yīng)用的新一輪爆發(fā)。以往的多模態(tài)應(yīng)用面臨著模型架構(gòu)復(fù)雜、缺少數(shù)據(jù)、缺少算力等一系列問題,而隨著Transformer結(jié)構(gòu)一統(tǒng)天下,互聯(lián)網(wǎng)上各模態(tài)數(shù)據(jù)的井噴式增長,計算資源越發(fā)普及,這些問題都在慢慢得到解決。

MERLOT系列工作刷新了我們認(rèn)知中視頻理解領(lǐng)域的上限,向我們展示了視頻、語音、文本多模態(tài)高效融合的一種可能性。未來,讓我們一起努力朝著多模態(tài)領(lǐng)域的"BERT"模型進發(fā)吧!

萌屋作者:Yimin_飯煲

在微軟NLC組搬磚的聯(lián)培博士生,愛好攝影和運動,希望賣萌屋早日開通視頻業(yè)務(wù),我來當(dāng)攝影師!

作品推薦

  • 學(xué)完文本知識,我就直接看懂圖片了!

  • 別再Prompt了!谷歌提出tuning新方法,強力釋放GPT-3潛力

  • 大模型煉丹無從下手?谷歌、OpenAI燒了幾百萬刀,總結(jié)出這些方法論…

  • 后臺回復(fù)關(guān)鍵詞【入群

    加入賣萌屋NLP/IR/Rec與求職討論群

    后臺回復(fù)關(guān)鍵詞【頂會

    獲取ACL、CIKM等各大頂會論文集!

    創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎勵來咯,堅持創(chuàng)作打卡瓜分現(xiàn)金大獎

    總結(jié)

    以上是生活随笔為你收集整理的Allen AI提出MERLOT,视频理解领域新SOTA!的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 国产精品午夜未成人免费观看 | 中文字幕乱码亚洲精品一区 | 麻豆网站免费观看 | 亚洲va在线∨a天堂va欧美va | 色七七视频 | 国产av自拍一区 | 天天综合网天天综合色 | 亚洲精品成a人在线观看 | 国产精品久久久久999 | 做爰视频毛片视频 | 国产一区二区三区四 | 久久久精品一区 | 伊人98 | 中文字幕日韩一级 | 久久机热| 黄色在线视频播放 | 久久久av网站 | 国产精品丝袜黑色高跟鞋的设计特点 | 国产成人在线视频 | 国产伦精品一区二区三区视频免费 | 成人免费看片98欧美 | 一区二区三区四区av | 亚洲经典久久 | 密色av| 国产精品久久久久国产a级 国产一区二区在线播放 | 性欧美4khd高清极品 | 丁香婷婷成人 | 欧美丝袜视频 | 日韩电影在线观看一区 | 午夜精品视频一区二区三区在线看 | 最近日本中文字幕 | av香蕉 | 黄频在线免费观看 | 丝袜调教91porn | 可以在线观看的黄色 | 久久久久久九九九九九 | 中文字幕免 | 国产福利精品视频 | 激情一区| 男人天堂综合网 | 91射区 | 九九热精品在线视频 | 久久影院中文字幕 | 污片在线观看 | 欧美香蕉视频 | 欧美一级片一区 | 国产传媒视频 | 麻豆网站在线播放 | 国产第三区 | 激情片网站 | 欧美在线观看一区二区 | 三级a视频 | 日日夜夜精品视频免费 | 欧美三级视频 | 免费人成年激情视频在线观看 | 国产ts在线视频 | 素人fc2av清纯18岁 | 日本激情视频一区二区三区 | 亚洲中文字幕在线观看 | 秋霞福利视频 | 日本成人精品在线 | 青青青在线视频免费观看 | 精品免费一区二区三区 | 久久久999国产 | 国产精品区在线 | 男人天堂网在线 | 又爽av| 三日本三级少妇三级99 | 天天爱夜夜操 | 欧美一级一区二区 | 国产高清一级片 | 日韩v在线| 久久123 | 桃色在线视频 | 中文无码熟妇人妻av在线 | 成人αv| 久久精品视频在线 | www.香蕉视频.com | 国产激情网址 | 日本伦理在线 | 日韩av一区二区三区 | 一区二区91 | 日本免费黄色片 | 欧美成人性生活 | 精品乱码一区二区三区 | 日本夫妻性生活视频 | 在线视频久 | 三级麻豆 | 久久av秘一区二区三区 | 国产cao| 欧州一级片 | 国产v片在线观看 | 亚洲码无人客一区二区三区 | 1000部国产精品成人观看 | 西野翔之公侵犯中文字幕 | 在线观看的av网址 | 国产福利在线免费观看 | 国产精品亚洲lv粉色 | 91精品国产精品 |