论文浅尝 | 通过共享表示和结构化预测进行事件和事件时序关系的联合抽取
論文筆記整理:鄧淑敏,浙江大學在讀博士,研究方向為低資源條件下知識圖譜自動化構建關鍵技術研究。
Rujun Han, Qiang Ning, Nanyun Peng. Joint Event and Temporal Relation Extractionwith Shared Representations and Structured Prediction. EMNLP 2019.
論文鏈接:https://www.aclweb.org/anthology/D19-1041/
這篇文章解決的是“事件-事件關系聯合抽取”問題,即給定一個候選事件對,除了判斷這兩個候選事件是否屬于事件,還要判斷出這兩者之間是否存在關系(這篇文章判斷的是時序關系)。在講這篇文章的模型之前,我們首先整理一下解決這個問題的方法——端到端的事件-事件關系聯合抽取模型。
端到端的事件-事件關系聯合抽取模型大致可以分為四類:
(1)單任務模型,先進行事件檢測,然后把檢測到的事件對輸入到事件關系抽取模型中,事件對的編碼模型參數不共享;
(2)多任務模型,與單任務模型類似,但是事件的對的編碼模型參數共享;
(3)管道聯合模型,與多任務模型的區別在于訓練過程,它是將事件檢測模型生成的事件候選集直接用于事件關系抽取模型的訓練;
(4)結構化聯合抽取模型,與管道聯合抽取模型的區別在于,事件檢測模型和事件關系抽取模型不是序列關系,而是結構化的。注意單任務模型和多任務模型是無法處理None事件類型的,但是管道聯合模型和結構化聯合抽取模型可以。這篇文章提出的SSVM方法屬于結構化聯合抽取模型。4種方法形象化表示如下圖所示。
端到端的事件-事件關系聯合抽取模型分類(轉載請注明出處)
Neural SSVM模型
接下來看一下本篇文章提出的Neural SSVM(神經結構化支持向量機)模型。
Neural SSVM 模型架構
上圖是這篇文章提出的模型架構。事件對由BERT得到Embedding,然后經由BiLSTM編碼,最后放到SSVM中進行事件與否和事件關系存在與否的判斷。
SSVM的Loss函數為
其中,
表示的是事件的數目和事件關系數目的總和。
分別表示的事件對和事件關系的真實結果和預測結果。
分別表示的判斷事件與否和判斷事件關系存在與否的得分函數。
其他參數為超參或者模型參數。
MAP推斷
這篇文章是通過最大后驗概率推斷來得到預測結果的,將推斷問題建模為整數線性規劃(ILP)問題,加入了三種約束:(1)one-labelassignment:單標簽分配,事件和事件關系只有是與不是之分,并且只可能是其中一種;(2)event-relationconsistency:事件-事件關系的一致性,只有事件之間才存在事件關系,非事件之間不存在;(3)symmetryand transitivity:(時序)關系的對稱性和傳遞性。
最后ILP的目標函數為:
Experiments
最后看一下這篇文章的實驗結果。用的數據集是TB-Dense和MATRES,比較的模型就是開篇提到的四種端到端的事件-事件關系聯合抽取模型。
事件-事件關系聯合抽取結果
事件-事件關系聯合抽取的Ablation Study
?
OpenKG
開放知識圖譜(簡稱 OpenKG)旨在促進中文知識圖譜數據的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。
點擊閱讀原文,進入 OpenKG 博客。
總結
以上是生活随笔為你收集整理的论文浅尝 | 通过共享表示和结构化预测进行事件和事件时序关系的联合抽取的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 论文浅尝 | 直译优于翻译?混合语言的知
- 下一篇: 开源开放 | 《大词林》开源 75 万核