日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

REPT: Bridging Language Models and Machine Reading Comprehension via Retrieval-Based Pre-training 阅读

發布時間:2023/12/8 编程问答 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 REPT: Bridging Language Models and Machine Reading Comprehension via Retrieval-Based Pre-training 阅读 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

?發順豐

目錄

motivation

方法

預處理

任務定義

SSP任務

RMLM任務

模型

Query表示

SSP

RELM

優化函數

Fine tune階段

Multiple Choice QA


motivation

PLM更注重通用的語義表示,MRC需要從多個文檔或句子中抽取證據。

通過Surrounding Sentences Prediction(SSP) 和 Retrieval based Masked Language Modeling (RMLM)來彌補PLM和MRC之間的gap,增強PLM的證據抽取能力,在MRC任務上可以很好的遷移這些能力。

方法

預處理

數據集:英文維基百科,2020/5/1。用bert tokenized切成500個token一個segment。每個segment看成一個doc,切成句。句子token數小于5的拼到前面去。

每個doc,選30%最重要的句子作為query。實體或名詞出現的次數越多越重要,一個句子中包含的實體和名詞重要度的累加為句子重要度。將其中的被提到的實體或和名詞mask,防止模型學到shortcut

?

任務定義

前t個為從doc中抽取的query。

SSP任務

從doc中抽取幾個句子作為query,剩下的合并作為passage,模型預測每個query的前一句和后一句。為了避免學到shortcut,將query中重復出現的實體或名詞按比例mask掉。

BERT maask 90%實體 30%名詞,

ROBERTa mask?90%實體 30%名詞, 和90%實體 90%名詞兩份數據集,訓練的時候混合一起訓練。

預測query原先的位置,函數r是輸出query原先的順序。

SSP任務是要預測query的在原來的文檔中前一句和后一句

RMLM任務

還原mask掉的實體或名詞

模型

Query表示

在預訓練階段,復用了上述公式,

來生成任務特定的query表示,來緩解overfit

SSP

query在hidden上做singe-head attention,獲取證據信息,dense獲得每個句子對query的得分。

RELM

z表示query中被mask的token的index。

函數f是 normalized的兩層dense,

優化函數

a,b表示query對應的原始doc中的前一句和后一句index,其概率分布如下。

SSP的目標函數

RMLM中,query被mask的token 的index集合為,golden集合為

恢復mask的token概率為

x‘ 表示詞表中的token ,e(x)為x的word embeding。

目標函數為

Fine tune階段

對于multiple choice QA,把問題和選項拼起來最為query。每個example可以i變成

query的表示仍然使用Query表示部分的多頭注意力。證據抽取過程不同的任務不同。

Multiple Choice QA

每個句子的表示為

對于Multi-RC數據集,不定項選擇題,每個選項二分類

Span Extraction

?

實驗結果

BERT w.M 繼續用MLM任務,維基百科數據訓BERT

BERT-Q 加入多頭注意力機制獲取query表示

BERT-Q?w. R/S 在BERT-Q的基礎上,用SSP和RMLM任務pretrain

BERT-Q?w. R 用RMLM任務pretrain

相比于base,性能提升比較明顯。但是加入了兩個預訓練任務進行post train。

1. 只用多頭注意力機制獲取query表示性能提升不明顯甚至下降,必須配合預訓練任務,

2. 用MLMpost train,性能提升有限

3. 兩個任務一起使用性能好,只用一個效果不明顯,只用RMLM性能下降

在Span Extraction 任務上 Multi-RC

GRR 是Graph Recurrent Retriever

在SQuAD 2.0?

在Multi-RC上 證據抽取的準召率。

?

總結

以上是生活随笔為你收集整理的REPT: Bridging Language Models and Machine Reading Comprehension via Retrieval-Based Pre-training 阅读的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 日本免费无人高清 | 高潮毛片无遮挡免费看 | 黄色一级视频免费看 | 亚洲第一av网站 | 美女扒开尿口给男人桶 | 国产永久免费无遮挡 | 8x8ⅹ8成人免费视频观看 | 午夜精产品一区二区在线观看的 | 一区二区三区中文字幕在线观看 | 欧美少妇18p | 思思久久久 | 欧美日韩第一区 | 免费又黄又爽又猛大片午夜 | 免费看国产黄色片 | 男人把女人捅爽 | 亚洲熟女乱色一区二区三区久久久 | www.中文字幕 | 欧美国产视频一区 | 国产精品视频网 | 久草精品国产 | 亚洲片国产一区一级在线观看 | 97超碰97 | 青青草av| 国产精品第三页 | 日本污视频在线观看 | 一本一道久久综合 | 欧美黑人精品一区二区 | 欧美一区二区三区成人 | 久久久久一级 | 亚洲制服丝袜诱惑 | 欧美老女人性生活 | 男女瑟瑟网站 | 亚洲麻豆精品 | 国产在线xxxx | 欧美人妻精品一区二区 | 三上悠亚在线观看一区二区 | 骚虎av| 美女被爆操网站 | 啪啪网站免费 | 久久久久久久麻豆 | 91免费黄 | 国产青青操| 天降女子| 六月激情综合 | 国产网站黄色 | 亚洲图色av| 成人尹人 | 国产亚洲精品久久 | 成人中文在线 | 又黄又高潮的视频 | av五月天在线 | 欧美日韩资源 | 日韩成人三级 | 国产成人一区二区三区 | 米奇狠狠干 | 天天干天天爽 | 成人免费看片98 | 性欧美在线视频 | 国产乱人乱偷精品视频 | 性三级视频 | 久草视频福利在线 | 毛片基地在线观看 | 国产毛片aaa | 日韩精品电影 | 国产精品久久久久不卡 | 日本视频www | 欧美日韩中出 | 超碰在线小说 | 日日操夜夜操狠狠操 | 制服丝袜亚洲 | 欧美综合自拍亚洲综合图片区 | 一本久久综合亚洲鲁鲁五月天 | 女人扒开双腿让男人捅 | 欧美少妇xxxxx | 一级片少妇 | 日韩黄视频 | 草草影院欧美 | 免费成人毛片 | 妺妺窝人体色www婷婷 | 亚洲偷偷自拍 | 国产精品扒开腿做爽爽爽视频 | 国产精品福利一区 | 精品人妻一区二区三区四区在线 | 天天久久综合网 | 91黄色小视频 | 色偷偷影院 | 亚洲中文字幕久久无码 | 亚洲伦理久久 | 狼人综合av | 热re99久久精品国产99热 | 黄色在线观看视频网站 | 国产明星换脸xxxx色视频 | 91精品播放 | 国产又粗又长又黄视频 | 午夜精品久久久久久久99老熟妇 | 亚洲自拍小视频 | 9.1成人免费看片 | 米奇av | 91在线观看免费高清 |