日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

论文浅尝 | 基于异质图交互模型进行篇章级事件抽取

發布時間:2024/7/5 编程问答 38 豆豆
生活随笔 收集整理的這篇文章主要介紹了 论文浅尝 | 基于异质图交互模型进行篇章级事件抽取 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

筆記整理:婁東方,浙江大學 & 恒生電子股份有限公司博士后,研究方向為事件抽取

來源:ACL2021

鏈接:https://arxiv.org/abs/2105.14924

GitHub項目地址:https://github.com/RunxinXu/GIT

本文關注篇章事件抽取——建模篇章信息,從中發現事件,并抽取事件各角色對應屬性。現有方法主要關注句子事件抽取(假設事件屬性分布在同一句內/較小文本片段內),它們無法適用于事件屬性分散在篇章中多個句子的情形。如下圖所示,

篇章事件抽取問題的挑戰包括事件屬性分散(EO事件中,“Xiaoting Wu”出現在句子3和句子4中,“Nov 6, 2014”則出現在句子1和句子2中)和多事件(關聯性事件“股票增持”和“股票減持”)。現有方法DCFEE、Doc2EDAG等一般獨立地抽取事件,忽略它們之間內在關聯性。

本文提出的Graph-based Interaction Model with a Tracker (GIT)方法基于異質圖網絡完成篇章內句子、實體提及之間的交互,并引入tracker跟蹤預測事件記錄以及role對應抽取記錄。試驗證明它能增強實現篇章理解和事件關聯建模。

Motivation

針對篇章級事件抽取問題面臨的兩個挑戰,作者分別設計相應模塊予以解決。

1.同一事件屬性分散在篇章不同句子,需要對篇章信息充分理解。考慮構建句子和實體提及的異質圖,將實體之間、句子之間、實體與句子之間的信息建模起來,并應用GNN網絡進行編碼,增強實體提及和句子向量表示,篇章理解更細致;2.建模事件之間的依賴性。考慮將當前篇章中已抽取的事件記錄用memory存儲下來,在預測當前事件角色對應屬性過程中將memory中的信息考慮進來,從而使得事件關聯信息被捕捉到。

Model

上圖所示為本文提出GIT事件抽取框架。主要包括如下模塊:

1.句子編碼:將篇章的所有句子進行獨立編碼,模型為Transformer結構;

2.實體提及預測:基于句子編碼結果(每個token表示) + CRF解碼得到每個句子的實體提及預測結果;

3.構建異質圖:

?節點:句子、候選實體提及(上一步的結果);

?????邊:句-句關系(全連接)、句內屬性之間關系(句內屬性全連接)、屬性-句關系(屬性與所在句相連)、跨句同名屬性關系(篇章同名屬性全連接)

4.GNN編碼器:輸出所有句子和實體提及對應的向量表示,它們已捕捉到全篇章信息;

5.事件類型發現:基于多頭機制將所有句子信息整合起來,獲取每個事件類型對應的向量表示,

并采用多標簽分類方式學習事件類型,對應損失函數為,

6.多事件屬性抽取。如圖所示,抽取步驟及原則如下,

?按照給定事件類型逐個抽取事件(例如,先抽EquityFreeze類型,再抽EquityPledge類型),按照給定角色順序逐個抽取屬性(在EquityFreeze類型的事件中,角色抽取順序為EquityHolder、FrozeShares、StartDate…)?構建tracker實時記錄當前抽取情況,存入memory,并在當前角色的屬性預測過程中將memory中的信息考慮進來。具體而言,當前角色屬性抽取考慮的因素包括

??: 實體候選(融合角色信息),??

??: 每個句子的向量表示;

??: 第i個事件記錄屬性序列,記錄屬性向量表示??

??: memory中已完成、未完成事件記錄的LSTM編碼結果。

?基于Transformer更新候選實體在當前角色下的向量表示,

基于更新之后的候選實體表示 ?E ? ?進行二分類,確定每個實體是否能成為當前“事件+角色”對應的屬性。屬性抽取對應的損失函數為

最終總損失包括:實體提及損失、事件類型發現損失和屬性抽取損失之和。

Experiment

實驗在中文金融事件抽取數據ChFinAnn上進行,結果表明GIT方法在該數據上達到SOTA;在單事件和多事件情況下表現都能顯著提升,基于GNN的異質圖編碼對文檔理解充分、基于tracker的事件關聯建模能增強多事件表現等。


OpenKG

OpenKG(中文開放知識圖譜)旨在推動以中文為核心的知識圖譜數據的開放、互聯及眾包,并促進知識圖譜算法、工具及平臺的開源開放。

點擊閱讀原文,進入 OpenKG 網站。

創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎

總結

以上是生活随笔為你收集整理的论文浅尝 | 基于异质图交互模型进行篇章级事件抽取的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。