日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

三分熟博士生の阅读理解与问答数据集 | 论文集精选 #03

發(fā)布時間:2024/10/8 编程问答 36 豆豆
生活随笔 收集整理的這篇文章主要介紹了 三分熟博士生の阅读理解与问答数据集 | 论文集精选 #03 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

PaperWeekly 是一個 AI 學(xué)術(shù)分享社區(qū)。這里聚集了大批一線 AI 學(xué)者,他們用精煉妙語推薦各自發(fā)現(xiàn)的優(yōu)質(zhì)論文。點擊本文底部的閱讀原文」即刻加入社區(qū),創(chuàng)建屬于你的論文集。

這里是第 3 期論文集精選。

本期論文集由 PaperWeekly 社區(qū)用戶?@RamonYeung?創(chuàng)建,包含 20 份 QA機(jī)器閱讀理解數(shù)據(jù)集我們從中挑選了 9 份數(shù)據(jù)集進(jìn)行展示,如果有合你心意的,復(fù)制鏈接到瀏覽器即可進(jìn)行下載。

如果你想查看完整數(shù)據(jù)集列表,點擊本文底部的閱讀原文,就可以一鍵收藏啦。


On Generating Characteristic-rich Question Sets for QA Evaluation

@RamonYeung?推薦

#Question Answering

文章發(fā)表在 EMNLP 2016,本文詳細(xì)闡述了 GraphQuestions 這個數(shù)據(jù)集的構(gòu)造方法,強(qiáng)調(diào)這個數(shù)據(jù)集是富含特性的(Characteristic-rich)。

此數(shù)據(jù)集的主要特點是:

1. 基于 Freebase,有 5166 個問題,涉及 148 個不同領(lǐng)域;

2. 從知識圖譜中產(chǎn)生 Minimal Graph Queries,再將 Query 自動轉(zhuǎn)換成規(guī)范化的問題;

3. 由于 2,Logical Form 不需要人工標(biāo)注,也不存在無法用 Logical Form 表示的問題;

4. 使用人工標(biāo)注的辦法對問題進(jìn)行 paraphrasing,使得每個問題有多種表述方式(答案不變),主要是 Entity-level Paraphrasing,也有 sentence-level;

5. Characteristic-rich 指數(shù)據(jù)集提供了問題在下列維度的信息,使得研究者可以對問答系統(tǒng)進(jìn)行細(xì)粒度的分析, 找到研究工作的前進(jìn)方向:關(guān)系復(fù)雜度(Structure Complexity),普遍程度(Commonness),函數(shù)(Function),多重釋義(Paraphrasing),答案候選數(shù)(Answer Cardinality)。

論文鏈接

http://www.paperweekly.site/papers/906

數(shù)據(jù)集鏈接

https://github.com/ysu1989/GraphQuestions

LSDSem 2017 Shared Task: The Story Cloze Test

@RamonYeung?推薦

#Cloze

Story Cloze Test:人工合成的完形填空數(shù)據(jù)集。

論文鏈接

http://www.paperweekly.site/papers/917

數(shù)據(jù)集鏈接

http://cs.rochester.edu/nlp/rocstories/


Dataset and Neural Recurrent Sequence Labeling Model for Open-Domain Factoid Question Answering

@RamonYeung 推薦

#Question Answering

百度深度學(xué)習(xí)實驗室創(chuàng)建的中文開放域事實型問答數(shù)據(jù)集。

論文鏈接

http://www.paperweekly.site/papers/914

數(shù)據(jù)集鏈接

http://idl.baidu.com/WebQA.html


Program Induction by Rationale Generation : Learning to Solve and Explain Algebraic Word Problems

@RamonYeung 推薦

#Question Answering

DeepMind 和牛津大學(xué)共同打造的代數(shù)問題數(shù)據(jù)集 AQuA(Algebra Question Answering)。

論文鏈接

http://www.paperweekly.site/papers/913


數(shù)據(jù)集鏈接

https://github.com/deepmind/AQuA


Frames: A Corpus for Adding Memory to Goal-Oriented Dialogue Systems

@PaperWeekly 推薦

#Dialog Systems

Maluuba 放出的對話數(shù)據(jù)集。

論文鏈接

http://www.paperweekly.site/papers/407


數(shù)據(jù)集鏈接

http://datasets.maluuba.com/Frames


Teaching Machines to Read and Comprehend

@RamonYeung 推薦

#Machine Comprehension

DeepMind Q&A Dataset 是一個經(jīng)典的機(jī)器閱讀理解數(shù)據(jù)集,分為兩個部分:

1. CNN:~90k 美國有線電視新聞網(wǎng)(CNN)的新聞文章,~380k 問題;

2. Daily Mail:~197k DailyMail 新聞網(wǎng)的新聞文章(不是郵件正文),~879k 問題。

論文鏈接

http://www.paperweekly.site/papers/915


數(shù)據(jù)集鏈接

http://cs.nyu.edu/~kcho/DMQA/


Semantic Parsing on Freebase from Question-Answer Pairs

@RamonYeung 推薦

#Semantic Parsing

文章發(fā)表在 EMNLP-13,The Stanford NLP Group 是世界領(lǐng)先的 NLP 團(tuán)隊。他們在這篇文章中引入了 WebQuestions 這個著名的問答數(shù)據(jù)集,WebQuestion 主要是借助 Google Suggestion 構(gòu)造的,依靠 Freebase(一個大型知識圖譜)中的實體來回答,屬于事實型問答數(shù)據(jù)集(比起自然語言,容易評價結(jié)果優(yōu)劣)。有 6642 個問答對。

最初,他們構(gòu)造這個數(shù)據(jù)集是為了做 Semantic Parsing,以及發(fā)布自己的系統(tǒng) SEMPRE system。

論文鏈接

http://www.paperweekly.site/papers/827


數(shù)據(jù)集鏈接

http://t.cn/RWPdQQO


A Corpus and Evaluation Framework for Deeper Understanding of Commonsense Stories

@RamonYeung 推薦

#Machine Comprehension

ROCStories dataset for story cloze test.

論文鏈接

http://www.paperweekly.site/papers/918


數(shù)據(jù)集鏈接

http://cs.rochester.edu/nlp/rocstories/


MoleculeNet: A Benchmark for Molecular Machine Learning

@paperweekly 推薦

#Molecular Machine Learning

一個分子機(jī)器學(xué)習(xí) benchmark,最喜歡看到這種將機(jī)器學(xué)習(xí)應(yīng)用到傳統(tǒng)學(xué)科領(lǐng)域了。

論文鏈接

http://www.paperweekly.site/papers/862


數(shù)據(jù)集鏈接

http://t.cn/RWPda8r

本文由 AI 學(xué)術(shù)社區(qū) PaperWeekly 精選推薦,社區(qū)目前已覆蓋自然語言處理、計算機(jī)視覺、人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘和信息檢索等研究方向,點擊「閱讀原文」即刻加入社區(qū)!

?投票時間?

以下論文選自 PaperWeekly 社區(qū) -?排行榜,這里不僅有各領(lǐng)域的經(jīng)典論文,還有當(dāng)下最熱門的新近之作。

所有論文均為用戶自發(fā)推薦,然后再以點贊的方式評選出熱門論文。最后,我們會針對上榜論文發(fā)起論文共讀,讓志同道合的同學(xué)們得到充分交流。

現(xiàn)在,就請選出你最感興趣的論文,我們將根據(jù)大家的投票結(jié)果選出本期論文。

總結(jié)

以上是生活随笔為你收集整理的三分熟博士生の阅读理解与问答数据集 | 论文集精选 #03的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。