日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

论文浅尝 | Zero-Shot Transfer Learning for Event Extraction

發布時間:2024/7/5 42 豆豆
生活随笔 收集整理的這篇文章主要介紹了 论文浅尝 | Zero-Shot Transfer Learning for Event Extraction 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

事件抽取的目標是在非結構化的文本中確認事件的觸發詞(Eventtrigger)和參與者(Event argument),并判斷觸法詞的事件類型(Eventtype),判斷參與者在事件中的扮演的角色(Argument role)。有觸發詞和參與者的短語或文本稱為EventMention。如下圖的關于Transport-Person 事件的一條EventMention,dispatching是觸發詞,下劃線是參與者,其中China作為Agent參與事件。

目前大多數的事件抽取是基于已有的手動標記樣本進行訓練。常見的數據集ACE,總共有8個大類,33個小類,對每個類,有人為標記的訓練語料。但是對于沒有樣本的新事件類型,用上述語料訓練的模型會顯得無力。對此,一是可以用遠程監督的方法標記訓練樣本,二是用遷移學習方法。本文基于第二點的,提出在事件抽取任務中用零樣本遷移學習方法:event mention 和event ontology聯合映射到共享的語義空間上,拉近兩者在語義空間上的距離。

具體來說:對于新的語料,可以用AMR得到具體事件mention的結構,同時提供已定義好的關于事件類型ontology的結構。如上圖所示,是對上述E1進行處理后得到mention的結構和一些已定義好的ontology結構。可以看到,事件觸發詞和事件類型名通常有一些共享含義,同時,兩者的結構也趨于相似。本文基于這兩點,將mention和ontology的結構表示聯合映射到同一語義空間,最小化mention和對應的ontology的語義距離,從而學習一個通用映射函數,將已有樣本訓練得到的模型遷移到沒有樣本的事件中,整體框架如下:

分為如下幾步:

1. 找出候選觸發詞和候選參與者,稱為Tiggerand Argument Identification

用WSD找出觸發詞候選項,并用FrameNet中的Lexical units匹配文本擴充觸發詞候選項;利用ARMparser找出參與者候選項。

2. 確定觸發詞對應的事件類型,稱為 Tigger Classification

觸發詞分類主要是用CNN模型,模型的輸入考慮了兩個部分 [V_t,V_(S_t)]:V_t 觸發詞本身的語義表示,可以用word2vec來訓練;觸發詞t的結構是 S_t,V_(S_t)是 S_t 的表示; ontology的 [V_y,V_(S_y)] 輸入同理。

對于 V_(S_t),分兩步進行:首先結構中的每條邊,可以表示為 u=<w_1,λ,w_2>,用 M_λ 表示關系,可以得到每個元組的表示 V_u,對應公式如下;之后將 t 的所有元組的表示 V_u 拼接起來,輸入到CNN網絡中,得到V_(S_t)。


對于 V_(S_y),ontology的每個元祖表示為?u^'=<y,r>, y 是事件類型,r 是參與者角色,?V_u' 的表示如下,之后也輸入到CNN中得到 V_(S_y)


通過hinge loss來訓練模型,將mention和ontology的表示學習到同一語義空間:


3. 確定參與者在事件中扮演的角色,稱為ArgumentClassification

參與角色的分類是基于觸發詞到參與者路徑的相似度。仍以E1為例,通過將dispatch-01—>:ARG0—>China和Transport-Person—>Agent的路徑信息學習到同一語義空間,之后根據語義相似度判斷China在Transport-Person中的扮演的角色是Agent。

4. 預測新類別

測試時候,對于新的?t',用訓練好的模型得到 t' 的結構化表示和所有ontology的結構化表示,距離最近的就是預測的結果。


本文進行了比較豐富的實驗:

1. 在ACE數據集上進行實驗,實驗中可見類設置如下,N表示可見類的數量:

上述設置下得到的效果如下,WSD-Embedding沒有將結構信息考慮到遷移的過程中。可以在遷移學習過程中考慮更多的機構化信息,得到的效果更好;可見類越多,效果越好。

2. 用ACE的 Justice類的4個小類做訓練,用其余三個或用其他大類下隨機的一個小類作測試。可以看到,測試類跟訓練類的相似度越高,效果越好。

3. 使用LSTM在所有類上進行訓練和測試,和用ZSL進行訓練和測試的效果對比。可以看到用ZSL訓練得到的效果和用LSTM訓練近500條樣本得到的效果不相上下。


筆記整理:王若旭,浙江大學碩士,研究方向為知識圖譜,自然語言處理.



OpenKG.CN


中文開放知識圖譜(簡稱OpenKG.CN)旨在促進中文知識圖譜數據的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。

轉載須知:轉載需注明來源“OpenKG.CN”、作者及原文鏈接。如需修改標題,請注明原標題。

?

點擊閱讀原文,進入 OpenKG 博客。

總結

以上是生活随笔為你收集整理的论文浅尝 | Zero-Shot Transfer Learning for Event Extraction的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。