直播预告 | 长文本知识抽取:基于语义分割的文档级三元组关系抽取
「AI Drive」是由 PaperWeekly 和 biendata 共同發(fā)起的學(xué)術(shù)直播間,旨在幫助更多的青年學(xué)者宣傳其最新科研成果。我們一直認(rèn)為,單向地輸出知識并不是一個最好的方式,而有效地反饋和交流可能會讓知識的傳播更加有意義,從而產(chǎn)生更大的價值。
本期 AI Drive,我們邀請到浙江大學(xué)助理研究員張寧豫,為大家?guī)?strong>長文本知識抽取:基于語義分割的文檔級三元組關(guān)系抽取專題報告。對本期主題感興趣的小伙伴,9?月 29 日(本周三)晚 7 點,我們準(zhǔn)時相約 PaperWeekly 直播間。
直播信息
關(guān)系抽取 (Relation Extraction) 是從純文本中提取未知關(guān)系事實。過去的關(guān)系抽取方法主要將注意力集中于抽取單個實體對在某個句子內(nèi)反映的關(guān)系,然而單句關(guān)系抽取在實踐中受到不可避免的限制:在真實場景如醫(yī)療、金融文檔中,有許多關(guān)系事實是蘊含在文檔中不同句子的實體對中的,且文檔中的多個實體之間,往往存在復(fù)雜的相互關(guān)系。文檔級關(guān)系抽取旨在從文檔中抽取多個實體對之間的關(guān)系,然而現(xiàn)有的基于 graph 或基于 transformer 的模型僅單獨地使用實體對,而未考慮關(guān)系三元組之間的全局信息。
在本文中,我們創(chuàng)新性地提出 DocuNet 模型,將文檔級關(guān)系抽取任務(wù)類比于計算機視覺中的語義分割任務(wù)。DocuNet 模型利用編碼器模塊捕獲實體的上下文信息,并采用 U-shaped 分割模塊在 image-style 特征圖上捕獲三元組之間的全局相互依賴性,通過預(yù)測實體級關(guān)系矩陣來捕獲 local 和 global 信息以增強文檔級關(guān)系抽取。實驗結(jié)果表明,我們的方法可以在三個基準(zhǔn)數(shù)據(jù)集 DocRED,CDR 和 GDA 上獲得 SOTA 性能。
論文標(biāo)題:
Document-level Relation Extraction as Semantic Segmentation
論文鏈接:
https://www.ijcai.org/proceedings/2021/0551.pdf
本次分享的具體內(nèi)容有:?
背景介紹:關(guān)系抽取的簡單介紹
研究動機:文檔級關(guān)系抽取的難點與挑戰(zhàn)
具體方法:介紹提出的模型的主要架構(gòu)
實驗結(jié)果:在基準(zhǔn)數(shù)據(jù)集上與之前方法的對比與分析
工作總結(jié):總結(jié)與展望
嘉賓介紹
?張寧豫?/ 浙江大學(xué)軟件學(xué)院助理研究員?
張寧豫,博士,浙江大學(xué)軟件學(xué)院助理研究員,阿里巴巴-浙江大學(xué)前沿技術(shù)聯(lián)合研究中心(AZFT)研究員,主要研究方向為知識圖譜、大數(shù)據(jù)系統(tǒng)、自然語言處理等,曾在 WWW、KDD、WSDM、AAAI、IJCAI、ACL、ENNLP、NAACL、ACMMM、IEEE TASLP 等國際頂級學(xué)術(shù)會議和期刊發(fā)表多篇論文。
直播地址?& 交流群
本次直播將在 PaperWeekly 視頻號和 B 站直播間進(jìn)行,掃描下方海報二維碼或點擊閱讀原文即可免費觀看。線上分享結(jié)束后,嘉賓還將在直播交流群內(nèi)實時 QA,在 PaperWeekly 微信公眾號后臺回復(fù)「AI Drive」,即可獲取入群通道。
視頻號直播間:
掃描下方二維碼關(guān)注 PaperWeekly 視頻號,第一時間獲取開播提醒。
B 站直播間:
https://live.bilibili.com/14884511
合作伙伴
🔍
現(xiàn)在,在「知乎」也能找到我們了
進(jìn)入知乎首頁搜索「PaperWeekly」
點擊「關(guān)注」訂閱我們的專欄吧
·
總結(jié)
以上是生活随笔為你收集整理的直播预告 | 长文本知识抽取:基于语义分割的文档级三元组关系抽取的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: WWW 2021最佳论文亚军:基于属性补
- 下一篇: 《失控玩家》爆火背后:什么才是拥抱人工智