直播预告 | 长文本知识抽取:基于语义分割的文档级三元组关系抽取
「AI Drive」是由 PaperWeekly 和 biendata 共同發(fā)起的學(xué)術(shù)直播間,旨在幫助更多的青年學(xué)者宣傳其最新科研成果。我們一直認(rèn)為,單向地輸出知識并不是一個(gè)最好的方式,而有效地反饋和交流可能會讓知識的傳播更加有意義,從而產(chǎn)生更大的價(jià)值。
本期 AI Drive,我們邀請到浙江大學(xué)助理研究員張寧豫,為大家?guī)?strong>長文本知識抽取:基于語義分割的文檔級三元組關(guān)系抽取專題報(bào)告。對本期主題感興趣的小伙伴,9?月 29 日(本周三)晚 7 點(diǎn),我們準(zhǔn)時(shí)相約 PaperWeekly 直播間。
直播信息
關(guān)系抽取 (Relation Extraction) 是從純文本中提取未知關(guān)系事實(shí)。過去的關(guān)系抽取方法主要將注意力集中于抽取單個(gè)實(shí)體對在某個(gè)句子內(nèi)反映的關(guān)系,然而單句關(guān)系抽取在實(shí)踐中受到不可避免的限制:在真實(shí)場景如醫(yī)療、金融文檔中,有許多關(guān)系事實(shí)是蘊(yùn)含在文檔中不同句子的實(shí)體對中的,且文檔中的多個(gè)實(shí)體之間,往往存在復(fù)雜的相互關(guān)系。文檔級關(guān)系抽取旨在從文檔中抽取多個(gè)實(shí)體對之間的關(guān)系,然而現(xiàn)有的基于 graph 或基于 transformer 的模型僅單獨(dú)地使用實(shí)體對,而未考慮關(guān)系三元組之間的全局信息。
在本文中,我們創(chuàng)新性地提出 DocuNet 模型,將文檔級關(guān)系抽取任務(wù)類比于計(jì)算機(jī)視覺中的語義分割任務(wù)。DocuNet 模型利用編碼器模塊捕獲實(shí)體的上下文信息,并采用 U-shaped 分割模塊在 image-style 特征圖上捕獲三元組之間的全局相互依賴性,通過預(yù)測實(shí)體級關(guān)系矩陣來捕獲 local 和 global 信息以增強(qiáng)文檔級關(guān)系抽取。實(shí)驗(yàn)結(jié)果表明,我們的方法可以在三個(gè)基準(zhǔn)數(shù)據(jù)集 DocRED,CDR 和 GDA 上獲得 SOTA 性能。
論文標(biāo)題:
Document-level Relation Extraction as Semantic Segmentation
論文鏈接:
https://www.ijcai.org/proceedings/2021/0551.pdf
本次分享的具體內(nèi)容有:?
背景介紹:關(guān)系抽取的簡單介紹
研究動機(jī):文檔級關(guān)系抽取的難點(diǎn)與挑戰(zhàn)
具體方法:介紹提出的模型的主要架構(gòu)
實(shí)驗(yàn)結(jié)果:在基準(zhǔn)數(shù)據(jù)集上與之前方法的對比與分析
工作總結(jié):總結(jié)與展望
嘉賓介紹
?張寧豫?/ 浙江大學(xué)軟件學(xué)院助理研究員?
張寧豫,博士,浙江大學(xué)軟件學(xué)院助理研究員,阿里巴巴-浙江大學(xué)前沿技術(shù)聯(lián)合研究中心(AZFT)研究員,主要研究方向?yàn)橹R圖譜、大數(shù)據(jù)系統(tǒng)、自然語言處理等,曾在 WWW、KDD、WSDM、AAAI、IJCAI、ACL、ENNLP、NAACL、ACMMM、IEEE TASLP 等國際頂級學(xué)術(shù)會議和期刊發(fā)表多篇論文。
直播地址?& 交流群
本次直播將在 PaperWeekly 視頻號和 B 站直播間進(jìn)行,掃描下方海報(bào)二維碼或點(diǎn)擊閱讀原文即可免費(fèi)觀看。線上分享結(jié)束后,嘉賓還將在直播交流群內(nèi)實(shí)時(shí) QA,在 PaperWeekly 微信公眾號后臺回復(fù)「AI Drive」,即可獲取入群通道。
視頻號直播間:
掃描下方二維碼關(guān)注 PaperWeekly 視頻號,第一時(shí)間獲取開播提醒。
B 站直播間:
https://live.bilibili.com/14884511
合作伙伴
🔍
現(xiàn)在,在「知乎」也能找到我們了
進(jìn)入知乎首頁搜索「PaperWeekly」
點(diǎn)擊「關(guān)注」訂閱我們的專欄吧
·
總結(jié)
以上是生活随笔為你收集整理的直播预告 | 长文本知识抽取:基于语义分割的文档级三元组关系抽取的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: WWW 2021最佳论文亚军:基于属性补
- 下一篇: 《失控玩家》爆火背后:什么才是拥抱人工智