论文浅尝 | Zero-Shot Transfer Learning for Event Extraction
事件抽取的目標(biāo)是在非結(jié)構(gòu)化的文本中確認(rèn)事件的觸發(fā)詞(Eventtrigger)和參與者(Event argument),并判斷觸法詞的事件類型(Eventtype),判斷參與者在事件中的扮演的角色(Argument role)。有觸發(fā)詞和參與者的短語(yǔ)或文本稱為EventMention。如下圖的關(guān)于Transport-Person 事件的一條EventMention,dispatching是觸發(fā)詞,下劃線是參與者,其中China作為Agent參與事件。
目前大多數(shù)的事件抽取是基于已有的手動(dòng)標(biāo)記樣本進(jìn)行訓(xùn)練。常見的數(shù)據(jù)集ACE,總共有8個(gè)大類,33個(gè)小類,對(duì)每個(gè)類,有人為標(biāo)記的訓(xùn)練語(yǔ)料。但是對(duì)于沒有樣本的新事件類型,用上述語(yǔ)料訓(xùn)練的模型會(huì)顯得無(wú)力。對(duì)此,一是可以用遠(yuǎn)程監(jiān)督的方法標(biāo)記訓(xùn)練樣本,二是用遷移學(xué)習(xí)方法。本文基于第二點(diǎn)的,提出在事件抽取任務(wù)中用零樣本遷移學(xué)習(xí)方法:將event mention 和event ontology聯(lián)合映射到共享的語(yǔ)義空間上,拉近兩者在語(yǔ)義空間上的距離。
具體來(lái)說(shuō):對(duì)于新的語(yǔ)料,可以用AMR得到具體事件mention的結(jié)構(gòu),同時(shí)提供已定義好的關(guān)于事件類型ontology的結(jié)構(gòu)。如上圖所示,是對(duì)上述E1進(jìn)行處理后得到mention的結(jié)構(gòu)和一些已定義好的ontology結(jié)構(gòu)。可以看到,事件觸發(fā)詞和事件類型名通常有一些共享含義,同時(shí),兩者的結(jié)構(gòu)也趨于相似。本文基于這兩點(diǎn),將mention和ontology的結(jié)構(gòu)表示聯(lián)合映射到同一語(yǔ)義空間,最小化mention和對(duì)應(yīng)的ontology的語(yǔ)義距離,從而學(xué)習(xí)一個(gè)通用映射函數(shù),將已有樣本訓(xùn)練得到的模型遷移到?jīng)]有樣本的事件中,整體框架如下:
分為如下幾步:
1. 找出候選觸發(fā)詞和候選參與者,稱為Tiggerand Argument Identification
用WSD找出觸發(fā)詞候選項(xiàng),并用FrameNet中的Lexical units匹配文本擴(kuò)充觸發(fā)詞候選項(xiàng);利用ARMparser找出參與者候選項(xiàng)。
2. 確定觸發(fā)詞對(duì)應(yīng)的事件類型,稱為 Tigger Classification
觸發(fā)詞分類主要是用CNN模型,模型的輸入考慮了兩個(gè)部分 [V_t,V_(S_t)]:V_t 觸發(fā)詞本身的語(yǔ)義表示,可以用word2vec來(lái)訓(xùn)練;觸發(fā)詞t的結(jié)構(gòu)是 S_t,V_(S_t)是 S_t 的表示; ontology的 [V_y,V_(S_y)] 輸入同理。
對(duì)于 V_(S_t),分兩步進(jìn)行:首先結(jié)構(gòu)中的每條邊,可以表示為 u=<w_1,λ,w_2>,用 M_λ 表示關(guān)系,可以得到每個(gè)元組的表示 V_u,對(duì)應(yīng)公式如下;之后將 t 的所有元組的表示 V_u 拼接起來(lái),輸入到CNN網(wǎng)絡(luò)中,得到V_(S_t)。
對(duì)于 V_(S_y),ontology的每個(gè)元祖表示為?u^'=<y,r>, y 是事件類型,r 是參與者角色,?V_u' 的表示如下,之后也輸入到CNN中得到 V_(S_y)。
通過hinge loss來(lái)訓(xùn)練模型,將mention和ontology的表示學(xué)習(xí)到同一語(yǔ)義空間:
3. 確定參與者在事件中扮演的角色,稱為ArgumentClassification
參與角色的分類是基于觸發(fā)詞到參與者路徑的相似度。仍以E1為例,通過將dispatch-01—>:ARG0—>China和Transport-Person—>Agent的路徑信息學(xué)習(xí)到同一語(yǔ)義空間,之后根據(jù)語(yǔ)義相似度判斷China在Transport-Person中的扮演的角色是Agent。
4. 預(yù)測(cè)新類別
測(cè)試時(shí)候,對(duì)于新的?t',用訓(xùn)練好的模型得到 t' 的結(jié)構(gòu)化表示和所有ontology的結(jié)構(gòu)化表示,距離最近的就是預(yù)測(cè)的結(jié)果。
本文進(jìn)行了比較豐富的實(shí)驗(yàn):
1. 在ACE數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)中可見類設(shè)置如下,N表示可見類的數(shù)量:
上述設(shè)置下得到的效果如下,WSD-Embedding沒有將結(jié)構(gòu)信息考慮到遷移的過程中。可以在遷移學(xué)習(xí)過程中考慮更多的機(jī)構(gòu)化信息,得到的效果更好;可見類越多,效果越好。
2. 用ACE的 Justice類的4個(gè)小類做訓(xùn)練,用其余三個(gè)或用其他大類下隨機(jī)的一個(gè)小類作測(cè)試。可以看到,測(cè)試類跟訓(xùn)練類的相似度越高,效果越好。
3. 使用LSTM在所有類上進(jìn)行訓(xùn)練和測(cè)試,和用ZSL進(jìn)行訓(xùn)練和測(cè)試的效果對(duì)比。可以看到用ZSL訓(xùn)練得到的效果和用LSTM訓(xùn)練近500條樣本得到的效果不相上下。
筆記整理:王若旭,浙江大學(xué)碩士,研究方向?yàn)橹R(shí)圖譜,自然語(yǔ)言處理.
OpenKG.CN
中文開放知識(shí)圖譜(簡(jiǎn)稱OpenKG.CN)旨在促進(jìn)中文知識(shí)圖譜數(shù)據(jù)的開放與互聯(lián),促進(jìn)知識(shí)圖譜和語(yǔ)義技術(shù)的普及和廣泛應(yīng)用。
轉(zhuǎn)載須知:轉(zhuǎn)載需注明來(lái)源“OpenKG.CN”、作者及原文鏈接。如需修改標(biāo)題,請(qǐng)注明原標(biāo)題。
?
點(diǎn)擊閱讀原文,進(jìn)入 OpenKG 博客。
總結(jié)
以上是生活随笔為你收集整理的论文浅尝 | Zero-Shot Transfer Learning for Event Extraction的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 论文浅尝 | Interaction E
- 下一篇: 领域应用 | OMAHA联盟发布“疾病临