日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

WSDM Cup 2020 引用意图识别赛道冠军解决方案(附答辩视频、PPT和代码)

發(fā)布時(shí)間:2025/3/8 编程问答 28 豆豆
生活随笔 收集整理的這篇文章主要介紹了 WSDM Cup 2020 引用意图识别赛道冠军解决方案(附答辩视频、PPT和代码) 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

新發(fā)現(xiàn)、新理論的研究論文發(fā)表數(shù)量呈指數(shù)型增長(zhǎng),并且論文被引用量(H-index)通常被學(xué)術(shù)界衡量論文的影響力貢獻(xiàn)程度。然而,隨著學(xué)術(shù)界的競(jìng)爭(zhēng)越來(lái)越激烈,部分期刊中出現(xiàn)了一種“強(qiáng)制引用”的情況,也是就論文作者需要引用該期刊的相關(guān)文章,以提高期刊的影響因子。這些行為是對(duì)任何科學(xué)家和技術(shù)人員所要求的最高誠(chéng)信的冒犯,并且如果任其發(fā)展,可能會(huì)破壞公眾的信任并阻礙科學(xué)技術(shù)的未來(lái)發(fā)展。該競(jìng)賽是該系列競(jìng)賽中的第一場(chǎng)競(jìng)賽,探討了網(wǎng)絡(luò)搜索和數(shù)據(jù)挖掘技術(shù)在多大程度上可以用來(lái)區(qū)分多余的引文和真實(shí)的引用識(shí)別。賽題詳解可參考:https://biendata.com/competition/wsdm2020/

冠軍方案

作者:應(yīng)承軒
學(xué)校:大連理工大學(xué)
個(gè)人網(wǎng)站:https://ying.cx/
研究方向:信息檢索
答辯視頻:

解決方案:https://github.com/chengsyuan/WSDM-Adhoc-Document-Retrieval

答辯視頻、PPT、論文:在「AI算法之心」公眾號(hào)后臺(tái)回復(fù)“「WSDM2020」

摘要

對(duì)語(yǔ)義檢索任務(wù)的最新研究表明,像BERT這樣的預(yù)訓(xùn)練語(yǔ)言模型具有令人印象深刻的重排序性能。在重排序過(guò)程中,將使用(查詢(xún),文檔)對(duì)來(lái)提供經(jīng)過(guò)微調(diào)的語(yǔ)言模型,并且整個(gè)時(shí)間復(fù)雜度與查詢(xún)大小和召回集大小均成正比。在本文中,我們基于置信度得分描述了一種簡(jiǎn)單而有效的提前停止策略。在我們的實(shí)驗(yàn)中,這種策略可以避免多達(dá)30%的不必要的推理計(jì)算成本,而不會(huì)犧牲太多的排名精度。
代碼:https://github.com/chengsyuan/WSDM-Adhoc-Document-Retrieval
「Our team dlutycx ranked first on the unleak track.」

方案

我們的方案主要分為三個(gè)主要階段:

  • 數(shù)據(jù)清洗:數(shù)據(jù)丟失的文檔將被刪除,與此任務(wù)無(wú)關(guān)的文本也將被刪除。

  • 召回階段:通過(guò)無(wú)監(jiān)督方式(例如BM25或文檔嵌入相似性)從整個(gè)候選文檔數(shù)據(jù)庫(kù)中檢索設(shè)置給定問(wèn)題的候選集。

  • 排序階段:這些文檔中的每一個(gè)都通過(guò)一種計(jì)算精準(zhǔn)度更高的方法進(jìn)行評(píng)分和排名。

數(shù)據(jù)清洗

在清理步驟中,我們僅刪除丟失的數(shù)據(jù)。然后,我們清除與主題不直接相關(guān)的文本。具體而言,我們刪除引文中每個(gè)句子不包含("「##」").

召回階段

在召回步驟中,我們使用Okapi BM25來(lái)衡量查詢(xún)和文檔之間的詞匯相似度。計(jì)算公式如下:

在驗(yàn)證集上進(jìn)行幾次實(shí)驗(yàn)后,我們?cè)O(shè)置和。

排序階段

在重排序步驟中,我們使用預(yù)先訓(xùn)練的BioBERT獲得相似性評(píng)分。然后,采用交叉熵?fù)p失來(lái)微調(diào)BioBERT:

image

其中是相關(guān)段落的索引集,是使用BM25檢索的前20個(gè)文檔中不相關(guān)段落的索引集。為了平衡正負(fù)比率,我們對(duì)正文檔19x進(jìn)行了過(guò)度采樣。

對(duì)BioBERT進(jìn)行微調(diào)后,在重新排序時(shí),我們將此模型用作固定評(píng)分器。在以下算法中,我們描述了廣泛使用的常規(guī)重排策略:如算法1所示,常規(guī)重排序策略是簡(jiǎn)單地遍歷召回集中的每個(gè)文檔。正如我們?cè)趫D2中可以看到的,真實(shí)文檔不是均勻分布的。它們聚集在最高位置。為了解決這個(gè)問(wèn)題,我們?cè)O(shè)計(jì)了一種早期停止策略。如算法2所示,當(dāng)重新排名(經(jīng)過(guò)微調(diào)的BERT模型)顯示高置信度時(shí),我們可以認(rèn)為此文檔是最相關(guān)的文檔。

如圖3所示,最高分的分布與圖2不同。如果在重排序過(guò)程中采用算法2,則如果不相關(guān)的文件的得分大于正數(shù),則我們可能會(huì)誤將不相關(guān)的文件檢索為正確文件。誤報(bào)文件高于閾值。為了緩解這種問(wèn)題,我們提出了一種自適應(yīng)的提前停止重新排序策略,如算法3所示。我們相信基于經(jīng)驗(yàn)的批處理大小????atch size可以減少假陽(yáng)性文檔,并獲得增益(排行榜的指標(biāo))。

更多詳細(xì)細(xì)節(jié)可以參考原始論文的解決方案:An Adaptive Early Stopping Strategy for Query-based Passage Re-ranking

http://www.wsdm-conference.org/2020/wsdm_cup_reports/Task1_dlutycx.pdf

往期精彩回顧適合初學(xué)者入門(mén)人工智能的路線及資料下載機(jī)器學(xué)習(xí)在線手冊(cè)深度學(xué)習(xí)在線手冊(cè)AI基礎(chǔ)下載(pdf更新到25集)本站qq群1003271085,加入微信群請(qǐng)回復(fù)“加群”獲取一折本站知識(shí)星球優(yōu)惠券,請(qǐng)回復(fù)“知識(shí)星球”喜歡文章,點(diǎn)個(gè)在看

總結(jié)

以上是生活随笔為你收集整理的WSDM Cup 2020 引用意图识别赛道冠军解决方案(附答辩视频、PPT和代码)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 一眉道姑 电影 | 国产精品人人妻人人爽 | av影院在线 | 波多野结衣不卡视频 | h片在线观看视频 | 国产综合一区二区 | 日日狠狠久久偷偷四色综合免费 | 光溜溜视频素材大全美女 | 日韩精品一区二区三区无码专区 | 99精品国产成人一区二区 | 久久电影一区二区 | 欧美日韩另类视频 | 老女人网站| 天堂中文在线资 | 日日摸日日碰夜夜爽无码 | 亚洲无吗一区二区三区 | 国产又粗又黄的视频 | ass精品国模裸体欣赏pics | 99伊人| 男女网站免费 | 香蕉钻洞视频 | 看a网站 | 日韩av成人在线 | 亚洲伦理中文字幕 | 久久依人| 亚洲成人自拍 | 波多野吉衣av在线 | 国产男女裸体做爰爽爽 | 色在线看 | 国产精品成人aaaa在线 | 欧美香蕉在线 | 久久久久久穴 | 好看的中文字幕电影 | 伦伦影院午夜理伦片 | 亚洲图片三区 | 一区二区有码 | 亚洲激情五月 | 欧美久久免费 | 久久久久久久久久久丰满 | 91香蕉黄| 欧美乱色 | 日本精品视频 | 亚洲精品乱码久久久久久麻豆不卡 | 激情午夜视频 | 一级片在线观看免费 | 日韩欧美手机在线 | 国产精品嫩草av | 香蕉视频日本 | 亚洲综合视频网 | 美国毛片av | 青青草原综合久久大伊人精品 | 99久久综合网 | 黄色国产精品 | xvideos成人免费视频 | 国产玖玖在线 | 欧美午夜精品久久久久久孕妇 | 国产三级漂亮女教师 | av在线播放地址 | 成人免费在线播放视频 | 污视频网站免费看 | 亚洲欧美视频在线观看 | 波多野结衣视频在线观看 | 国产第99页 | 亚洲成人a√ | 国产91啪 | 成人免费精品 | 欧美日韩1 | 亚洲精品国产精品国自产观看浪潮 | 免费的黄色一级片 | 日本大尺度吃奶做爰视频 | 日韩在线中文 | 欧美大片xxxx | 亚洲国产精品狼友在线观看 | 日韩av线 | 免费看日韩 | 人妻91麻豆一区二区三区 | 亚洲国产成人一区 | 女儿的朋友在线播放 | 中文字幕av片| 在线免费看黄视频 | 激情婷婷综合网 | 最好看的中文字幕国语电影mv | 免费av影视| 黄色免费在线观看视频 | 一本久道视频一本久道 | 欧美伊人影院 | gav成人| 亚洲69av | 亚洲视频久久 | 天堂男人在线 | 四虎影裤| 日韩一区二区在线看 | 性少妇videosexfre | 亚洲一区二区偷拍 | 亚洲午夜一区 | 高潮一区 | 葵司有码中文字幕二三区 | 成年人视频免费 | 性生交大片免费看 |