日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

中文事件抽取研究综述

發(fā)布時(shí)間:2023/12/20 编程问答 29 豆豆
生活随笔 收集整理的這篇文章主要介紹了 中文事件抽取研究综述 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

中文事件抽取研究綜述

  • 中文事件抽取研究綜述
    • 摘要
    • 2 事件抽取任務(wù)定義
      • 2.1 公開評(píng)測(cè)事件抽取
        • 評(píng)估
      • 2.2 框架表示事件抽取
      • 2.3 實(shí)例表示事件抽取
    • 3 中文事件抽取技術(shù)方法
      • 3.1 基于模式匹配的方法
      • 3.2 基于機(jī)器學(xué)習(xí)的方法
        • (1)基于特征工程的方法
        • (2)基于神經(jīng)網(wǎng)絡(luò)的方法
        • (3)弱監(jiān)督的方法
      • 3.3 中文事件抽取的方法
    • 參考文獻(xiàn)

中文事件抽取研究綜述

項(xiàng)威,王邦 ( 華中科技大學(xué)電子信息與通信學(xué)院,湖北武漢430074)

摘要

事件抽取是構(gòu)建知識(shí)圖譜的關(guān)鍵任務(wù)之一,也是當(dāng)前自然語言處理的研究熱點(diǎn)和難點(diǎn)問題。

事件抽取研究從非結(jié)構(gòu)化的自然語言文本中自動(dòng)抽取用戶感興趣的事件信息,對(duì)人們認(rèn)知世界有著深遠(yuǎn)的意義,在信息檢索、智能問答、情感分析等應(yīng)用場(chǎng)景有著重要的意義和價(jià)值。

在公開國際測(cè)評(píng)和語料的推動(dòng)下,事件抽取研究受到越來越多的學(xué)者關(guān)注,取得了許多的研究成果。

  • 按照事件抽取任務(wù)定義,有:

    • 預(yù)先定義結(jié)構(gòu)化的事件表示框架的框架表示事件抽取
    • 通過事件實(shí)例中觸發(fā)詞及事件元素進(jìn)行聚類的實(shí)例表示事件抽取
  • 根據(jù)事件抽取方法的不同,可以分為:

    • 基于模式匹配的方法
    • 基于機(jī)器學(xué)習(xí)的方法
  • 中文事件抽取方法還要考慮中文語言特性問題。


    自動(dòng)內(nèi)容抽取國際評(píng)測(cè)會(huì)議 Automatic content extraction, ACE

    將事件定義為:

    發(fā)生在某個(gè)特定時(shí)間點(diǎn)或時(shí)間段,某個(gè)特定地域范圍內(nèi),由一個(gè)或者多個(gè)角色參與的一個(gè)或者多個(gè)動(dòng)作組成的事情或者狀態(tài)的改變。

    • 早期的事件抽取任務(wù)采用基于模式匹配的方式,隨著機(jī)器學(xué)習(xí)的興起,采用特征工程神經(jīng)網(wǎng)絡(luò)的方法進(jìn)行事件抽取受到關(guān)注。
    • 中文事件抽取還存在中文語言特性方面的問題

    本文首先簡(jiǎn)要介紹了事件抽取的研究意義,再從事件抽取的任務(wù)定義技術(shù)方法兩個(gè)維度全面闡述事件抽取工作。

    2 事件抽取任務(wù)定義

    事件抽取在相關(guān)公開測(cè)評(píng)和語料的推動(dòng)下展開,不同的公開測(cè)評(píng)和語料關(guān)注的領(lǐng)域和事件粒度不同。

    • 框架表示事件抽取任務(wù)是參照公開測(cè)評(píng)事件抽取任務(wù),也稱為限定域事件抽取。
    • 實(shí)例表示事件抽取是在沒有預(yù)先定義結(jié)構(gòu)化的事件表示框架下,通過事件實(shí)例的觸發(fā)詞和事件元素詞用無監(jiān)督方法聚類來進(jìn)行的事件抽取任務(wù),也稱為開放域事件抽取

    2.1 公開評(píng)測(cè)事件抽取

    公開評(píng)測(cè)語料通常面向通用背景,沒有特定的領(lǐng)域背景,如ACE僅僅對(duì)新聞?wù)Z料中關(guān)注的33種常用事件類型進(jìn)行了標(biāo)注。

    公開評(píng)測(cè)極大推動(dòng)了事件抽取的研究和發(fā)展,但公開評(píng)測(cè)語料通常面向通用背景,沒有特定的領(lǐng)域背景,如ACE僅對(duì)新聞?wù)Z料中關(guān)注的33種常用事件類型進(jìn)行了標(biāo)注。

    • 雖然有少量的特定領(lǐng)域事件抽取語料,如BioNLP生物醫(yī)學(xué)領(lǐng)域語料等,但不能滿足豐富多樣的實(shí)際應(yīng)用需求。同時(shí)公開評(píng)測(cè)語料還存在數(shù)據(jù)量級(jí)小、事件類型稀疏和語料時(shí)效性差等問題,目前最優(yōu)性能也無法滿足知識(shí)圖譜構(gòu)建等應(yīng)用需求。

    ACE認(rèn)為事件是事物狀態(tài)的改變或事情的發(fā)生,并將事件抽取任務(wù)定義為從非結(jié)構(gòu)化的文本中識(shí)別并抽取事件信息并結(jié)構(gòu)化表示,包括事件觸發(fā)詞、事件類型、事件元素、元素角色。

    相關(guān)術(shù)語:

    • 實(shí)體 entity
    • 事件提及 event mention:描述事件的短語 或 句子,包括事件觸發(fā)詞和事件元素。
    • 事件觸發(fā)詞 event trigger
    • 事件元素 event arguments
    • 元素角色 argument roles

    ACE事件抽取任務(wù)通常分為:事件檢測(cè) & 元素識(shí)別

  • 事件檢測(cè):通過識(shí)別文本中的事件觸發(fā)詞檢測(cè)事件,并判斷事件類型。

    每種事件類型對(duì)應(yīng)唯一的事件表示框架(如生活-出生類型事件表示框架為{人物,時(shí)間,地點(diǎn)})

  • 元素識(shí)別:根據(jù)事件表示框架判斷文本中的實(shí)體是否為事件元素,并確定元素角色

  • ACE語料沒有指定具體的領(lǐng)域和場(chǎng)景,主要來自新聞?wù)Z料,包括新聞專線、廣播新聞等6個(gè)來源,同時(shí)包含英語、漢語、西班牙語三種語言,由美國賓夕法尼亞大學(xué)等語言數(shù)據(jù)聯(lián)盟 linguistic data consortium, LDC 標(biāo)注。ACE定義了8種類型和33種子類型事件及其對(duì)應(yīng)的表示框架。

    事件抽取任務(wù)往往依賴于文本的命名實(shí)體識(shí)別、共指消解、關(guān)系抽取等自然語言處理任務(wù)結(jié)果,但其并不是事件抽取任務(wù)本身所關(guān)注的。

    ACE數(shù)據(jù)集同時(shí)對(duì)實(shí)體及其類型、關(guān)系、共指等內(nèi)容進(jìn)行了標(biāo)注,在ACE事件抽取任務(wù)中通常直接使用實(shí)體標(biāo)注內(nèi)容。ACE事件抽取任務(wù)通常采用以下標(biāo)準(zhǔn)評(píng)估正確性:

    評(píng)估

    ACE事件抽取任務(wù)通常采用以下標(biāo)準(zhǔn)評(píng)估正確性:

    • 如果一個(gè)事件觸發(fā)詞的位置偏移和事件類型與標(biāo)注內(nèi)容匹配,則正確識(shí)別該事件觸發(fā)詞
    • 如果一個(gè)事件元素詞的位置偏移和對(duì)應(yīng)事件與標(biāo)注內(nèi)容匹配,則正確識(shí)別該事件元素
    • 如果一個(gè)事件元素詞的位置偏移、對(duì)應(yīng)事件元素角色與標(biāo)注內(nèi)容匹配,則正確識(shí)別并分類該事件元素

    2.2 框架表示事件抽取

    通過自頂向下的方式,預(yù)先定義事件表示框架,包括事件類等等,然后制作相應(yīng)的標(biāo)注語料數(shù)據(jù)進(jìn)行事件抽取。

    • Perroni等在2018年提出一種從新聞報(bào)道和社交媒體中抽取突發(fā)事件等框架表示,用于公共安全預(yù)警、政府組織決策支持等。文章定義了“洪水”、“風(fēng)暴”、“火災(zāi)”等7種突發(fā)事件類型,并結(jié)合6何分析法(5W1H: Who, What, Where, When, Why, How)設(shè)計(jì)各類事件元素的表示框架。
    • 劉振[7]等在2018年提出了常見科技政策領(lǐng)域內(nèi)的事件類型與對(duì)應(yīng)的事件表示框架,幫助獲取科研領(lǐng)域內(nèi)有價(jià)值的信息,把握學(xué)科發(fā)展趨勢(shì)。

    框架表示事件抽取任務(wù) 按照不同的領(lǐng)域背景和應(yīng)用需求自由靈活地構(gòu)建事件框架表示,解決了公開評(píng)測(cè)語料的事件類型稀疏,數(shù)據(jù)量級(jí)小等問題。

    【優(yōu)點(diǎn)】框架表示的事件類型可擴(kuò)展性強(qiáng),結(jié)合遠(yuǎn)程監(jiān)督的方法可以自動(dòng)生成大規(guī)模標(biāo)注數(shù)據(jù),提高語料的時(shí)效性。

    【缺點(diǎn)】但事件的框架表示通常結(jié)構(gòu)復(fù)雜,通用性差,不同的領(lǐng)域背景和實(shí)際應(yīng)用需要不同的事件框架表示,這都需要耗費(fèi)大量的人力勞動(dòng)和時(shí)間,并且嚴(yán)重依賴領(lǐng)域?qū)<蚁到y(tǒng)。

    ==> 所以框架表示事件的標(biāo)注語料雖然可以保證每種事件類型的數(shù)量,但大部分標(biāo)注語料規(guī)模仍然較小。

    • 框架
    • 某個(gè)類型的事件必定有一個(gè)表述的框架:
    • 如,死亡類型的事件:肯定有實(shí)施者、有受害者、有時(shí)間。。。
    • 故,可以用這樣的框架來抽取信息:先有 觸發(fā)詞 識(shí)別出該事件類型是 “死亡”事件,然后用“死亡”事件的模版去找出對(duì)應(yīng)的 元素。Done!

    2.3 實(shí)例表示事件抽取

    實(shí)例表示事件抽取可以面向不同領(lǐng)域背景和應(yīng)用需求的事件,也可以面向通用領(lǐng)域的事件語料。通過自底向上的方式,利用文本的上下文語境、句法依存結(jié)構(gòu)等信息,采用無監(jiān)督的方法聚類事件類型和事件元素,自動(dòng)發(fā)現(xiàn)新的事件實(shí)例,不需要人工制作標(biāo)注數(shù)據(jù)。

    例如,如果事件觸發(fā)詞具有相似的上下文語境,那么它們可能屬于同類事件;如果事件元素與事件觸發(fā)詞具有類似的句法依存結(jié)構(gòu),那么它們可能具有相同的事件元素角色。

    • Huang等[9]在2016年提出一種自由事件抽取模型,適用于所有語料輸入,利用符號(hào)特征和分布式語義自動(dòng)生成輸入語料的事件表示,檢測(cè)事件并結(jié)構(gòu)化表示。
    • Zhou等[10]在2017年從推特中用無監(jiān)督模型抽取有價(jià)值的新聞事件并結(jié)構(gòu)化表示,文章假設(shè)相同的事件擁有相似的實(shí)體和詞語,用無監(jiān)督的方法抽取結(jié)構(gòu)化事件信息。
    • Yuan等[11]在2018年利用新聞?wù)Z料中的實(shí)體和實(shí)體類型建立 槽值對(duì)(slot-value) 來檢測(cè)事件,相似的實(shí)體槽值對(duì)句子屬于相同的事件類型,最后生成事件結(jié)構(gòu)化的表示框架。

    【缺點(diǎn)】由于語言的結(jié)構(gòu)復(fù)雜性,實(shí)例表示事件抽取很難準(zhǔn)確地獲得語義信息,并且難以用統(tǒng)一的結(jié)構(gòu)化標(biāo)準(zhǔn)表示,需要一定的人工方式加以輔助,其結(jié)果仍然很難應(yīng)用到其他自然語言處理任務(wù)中。

    實(shí)例表示事件抽取:

    • 先把一些詞取出來,然后將這些詞聚類,注意,這里并未定義哪些詞是哪一類,而是讓它們自己尋找類別,和識(shí)別事件元素

    3 中文事件抽取技術(shù)方法

    事件抽取任務(wù)在方法上可以分為基于模式匹配的方法和基于機(jī)器學(xué)習(xí)的方法兩大類。

    • 基于模式匹配的方法:是在一些模式的指導(dǎo)下進(jìn)行的某類事件的識(shí)別和抽取方法,在特定領(lǐng)域中表現(xiàn)出了良好的性能。
    • 基于機(jī)器學(xué)習(xí)的方法:將事件抽取建模成多分類任務(wù),通過提取的特征進(jìn)行分類完成事件抽取。
    • 中文事件抽取中還需考慮語言特性的問題,主要通過建立勘誤表和序列標(biāo)注方法來解決。

    3.1 基于模式匹配的方法

    基于模式匹配事件抽取主要分為有監(jiān)督的模式匹配方法和弱監(jiān)督的模式匹配方法兩大類。

    • 有監(jiān)督的模式匹配方法依賴于人工標(biāo)注語料進(jìn)行事件模式學(xué)習(xí)。
      • Ellen[12]等在1993年通過建立觸發(fā)詞典和13中事件匹配模式進(jìn)行事件識(shí)別與抽取,事件匹配模式主要利用事件元素初始描述和事件元素上下文語義進(jìn)行構(gòu)建,并開發(fā)了AutoSlog模式匹配事件抽取系統(tǒng),在MUC語料上性能優(yōu)異。
      • Kim等在1995年引入了WordNet語義詞典,利用語義框架和短語結(jié)構(gòu)進(jìn)行事件抽取
    • 弱監(jiān)督的模式匹配方法只需對(duì)語料進(jìn)行預(yù)分類或指定種子模式的少量人工標(biāo)注工作,然后自動(dòng)進(jìn)行事件模式學(xué)習(xí)。
      • Ellen[14]等在1995年在AutoSlog基礎(chǔ)上開發(fā)出AutoSlog-ST系統(tǒng),不需要對(duì)語料中的所有事件元素進(jìn)行標(biāo)注,只需標(biāo)注事件類型,然后利用預(yù)分類語料自動(dòng)學(xué)習(xí)事件模式。
      • 姜吉發(fā)[15]在2005年提出一種領(lǐng)域通用事件模式匹配方法IEPAM,將事件抽取模式分為語義模式、觸發(fā)模式、抽取模式,在MUC-7語料的飛行事故事件抽取中獲得優(yōu)異結(jié)果。

    【優(yōu)缺點(diǎn)】模式匹配事件抽取方法在領(lǐng)域事件抽取任務(wù)中性能優(yōu)異,但模版的制作需要耗費(fèi)大量人力和時(shí)間,且模版局限于領(lǐng)域背景,很難在通用領(lǐng)域事件抽取任務(wù)中應(yīng)用。

    3.2 基于機(jī)器學(xué)習(xí)的方法

    基于機(jī)器學(xué)習(xí)的方法將事件抽取建模成分類任務(wù),是目前的主流研究方向。

    尤其是深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò),已經(jīng)成為事件抽取的主要手段,全連接神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)都已經(jīng)成功應(yīng)用到事件抽取任務(wù)中。此外,弱監(jiān)督的方法能夠自動(dòng)生成標(biāo)注語料數(shù)據(jù),緩解數(shù)據(jù)稀疏問題,也逐步應(yīng)用到事件抽取任務(wù)中。

    (1)基于特征工程的方法

    傳統(tǒng)的機(jī)器學(xué)習(xí)方法將事件抽取任務(wù)建模為多分類問題,提取文本的語義特征,然后輸入分類器進(jìn)行事件抽取。

    • Ahn[2]等在2006年率先將事件抽取分為4個(gè)階段的多分類子任務(wù),包括
    • 事件觸發(fā)詞分類 :判斷詞語是否為事件觸發(fā)詞和事件類型 —— 利用詞匯特征、字典特征、句法特征、實(shí)體特征 ,完成觸發(fā)詞分類子任務(wù)
    • 事件元素分類 :判斷實(shí)體詞語是否為事件元素 —— 利用事件類型、觸發(fā)詞特征、實(shí)體特征、句法特征 ,完成事件元素分類子任務(wù)
    • 事件屬性分類 :判斷事件屬性
    • 事件共指消解 :判斷兩個(gè)事件實(shí)例是否屬于同一事件

    【缺點(diǎn)】傳統(tǒng)的機(jī)器學(xué)習(xí)事件抽取多分類方法中,各個(gè)階段的子分類任務(wù)是相互獨(dú)立的,導(dǎo)致誤差從前面的環(huán)節(jié)向后面的環(huán)節(jié)傳遞,性能也因此逐級(jí)衰減,并且無法處理全局的依賴關(guān)系。

    (2)基于神經(jīng)網(wǎng)絡(luò)的方法

    事件抽取的機(jī)器學(xué)習(xí)傳統(tǒng)方法不僅需要人工設(shè)計(jì)特征,而且需要借助外部的NLP工具抽取特征,并且部分語言和領(lǐng)域缺少相關(guān)的NLP工具。

    在各種特征的抽取過程中會(huì)產(chǎn)生誤差,造成誤差的積累和傳播。

    【神經(jīng)網(wǎng)絡(luò)的方法將事件抽取建模成端到端的系統(tǒng),使用包含豐富語言特征的詞向量作為輸入自動(dòng)提取特征,不需要或者極少的依賴外部的NLP工具,避免了人工設(shè)計(jì)特征的繁瑣工作。】

    • Chen等[23]在2015年提出基于動(dòng)態(tài)多池化卷積神經(jīng)網(wǎng)絡(luò)的事件抽取方法,利用動(dòng)態(tài)多池化方法學(xué)習(xí)出一個(gè)句子中包含的多個(gè)事件。
    • Feng等[18]在2016年提出用雙向長(zhǎng)短期記憶網(wǎng)絡(luò)進(jìn)行事件檢測(cè),但沒有探索事件元素等抽取方法。
    • Nguyen[19]等在2016年利用雙向LSTM抽取句子中的語義特征,然后聯(lián)合句子結(jié)構(gòu)特征同時(shí)抽取事件觸發(fā)詞和事件元素。

    (3)弱監(jiān)督的方法

    弱監(jiān)督的事件抽取方法希望通過結(jié)構(gòu)化知識(shí)庫或者少量人工標(biāo)注數(shù)據(jù),自動(dòng)生成大規(guī)模、高質(zhì)量的標(biāo)注數(shù)據(jù)。

    • Chen[24]等在2009年提出利用少量人工標(biāo)注數(shù)據(jù)訓(xùn)練模型,在未標(biāo)注數(shù)據(jù)上反復(fù)迭代自動(dòng)擴(kuò)充標(biāo)注數(shù)據(jù)。
    • Liu[16]等在2016年提出利用ACE語料數(shù)據(jù)訓(xùn)練模型,再結(jié)合FrameNet知識(shí)庫擴(kuò)充標(biāo)注數(shù)據(jù)。
    • Chen[9]等在2017年提出利用Freebase、Wikipedia、FrameNet等知識(shí)庫等遠(yuǎn)程監(jiān)督方法,自動(dòng)生成大規(guī)模的標(biāo)注數(shù)據(jù)進(jìn)行事件抽取,并將其應(yīng)用到金融領(lǐng)域的事件抽取問題中。

    3.3 中文事件抽取的方法

    中文語言特性問題主要來自中文詞句意合特性,中文語言詞語件沒有顯示間隔,而分詞會(huì)帶來明顯的錯(cuò)誤和誤差。

    • Chen[24]等在2009年提出中文事件抽取觸發(fā)詞不一致問題,并將中文觸發(fā)詞分詞不一致問題分為 跨詞語 (cross-word) 不一致 和 內(nèi)詞語 (inside-word) 不一致 兩種類型。

    Chen提出兩種方法解決觸發(fā)詞分詞不一致的問題:

  • 基于詞語的觸發(fā)詞標(biāo)注,通過在訓(xùn)練集上建立觸發(fā)詞的全局勘誤表修正測(cè)試集中分詞不一致的觸發(fā)詞;
  • 基于字符的觸發(fā)詞標(biāo)注,將觸發(fā)詞檢測(cè)轉(zhuǎn)化為序列標(biāo)注問題。
    • Zeng[20]等在2016年用不同的中文分詞工具對(duì)ACE中文語料進(jìn)行分詞,結(jié)果顯示至少有14%對(duì)觸發(fā)詞分詞結(jié)果與語料標(biāo)注不一致!!!【這個(gè)需要使用】

      解決

      在Chen的字符序列標(biāo)注方法的基礎(chǔ)上,使用雙向長(zhǎng)短期記憶網(wǎng)絡(luò)和條件隨機(jī)場(chǎng)抽取句子特征,并結(jié)合卷積神經(jīng)網(wǎng)絡(luò)抽取上下文語義特征完成中文事件抽取

    • Lin[26]等認(rèn)為序列標(biāo)注模型中的字符區(qū)別于詞語,無法準(zhǔn)確表達(dá)句子的語義,提出將每個(gè)字符與上下文的若干字符組合生成多個(gè)候選觸發(fā)詞塊,然后從候選觸發(fā)詞塊中檢測(cè)觸發(fā)詞。

    【中文事件抽取問題】

    • 中文事件抽取還存在比英文更加嚴(yán)重的數(shù)據(jù)稀疏問題。
    • 中文語言的復(fù)雜性和靈活性使得相同語義的詞語有更多表達(dá)方式,即同一類型事件觸發(fā)詞可以用更多詞語表達(dá)。=> 因此中文觸發(fā)詞數(shù)量要遠(yuǎn)多于英文,導(dǎo)致測(cè)試集中有更多在訓(xùn)練集中沒有出現(xiàn)過的未知觸發(fā)詞。

    參考文獻(xiàn)

    [1] DODDINGTON G R,MITCHELL A,PRZYBOCKI M A,et al.The automatic content extraction ( ACE) program-tasks,data,and evaluation[C]//Proceedings of the 2004 international conference on language resources and evaluation.Lisbon,Portugal: European Language Resources Association,2004: 837-840.

    [2] AHN D.The stages of event extraction[C]//Proceedings of the workshop on annotations and reasoning about time and events.Sydney,Australia: Association for Computational Linguistics,2006: 1-8.

    [3] AGUILAR J,BELLER C,MCNAMEE P,e t al.A comparison of the events and relations across ace,ere, tac - kbp,and framenet annotation standards[C]//Proceedings of the second workshop on events: definition,detection,coreference,and representation.Baltimore,Maryland,USA: ACL,2014: 45-53.

    [4] SONG Z,BIES A,STRASSEL S,et al. From light to rich ere: annotation of entities,relations,and events[C]/ /Proceedings of the 3rd workshop on events: definition,detection,coreference,and representation. Beijing,China: ACL,2015:89-98.

    [5] PETRONI F,RAMAN N,NUGENT T,et al.An extensible event extraction system with cross - media event resolution[C]/ /Proceedings of the 24th ACM SIGKDD international conference on knowledge discovery & data mining.London,United Kingdom: ACM, 2018: 626-635.

    [6] YANG H,CHEN Y,LIU K,et al.DCFEE: a document-level Chinese financial event extraction system based on automatically labeled training data[C]/ /Proceedings of ACL 2018,system demonstrations.Melbourne,Australia: ACL,2018: 50-55.

    [7] 劉振.基于網(wǎng)絡(luò)科技信息的事件抽取研究[J].情報(bào)科學(xué),2018, 36( 9) : 115-117.

    [8] CHEN Y,LIU S,ZHANG X, et al.Automatically labeled data generation for large scale event extraction[C]/ /Proceedings of the 55th ACL.Vancouver,Canada: ACL, 2017: 409-419.

    [9] HUANG L,CASSIDY T,FENG X, et al.Liberal event extraction and event schema induction[C]/ /Proceedings of the 54th ACL.Berlin,Germany: ACL, 2016: 258-268.

    [10] ZHOU D,ZHANG X,HE Y.Event extraction from Twitter using non-parametric Bayesian mixture model with word embeddings[C]/ /Proceedings of the 15th EACL. Valencia,Spain: ACL, 2017: 808-817.

    [11] YUAN Q,REN X,HE W, et al.Open-schema event profiling for massive news corpora[C]/ /Proceedings of the 27th ACM international conference on information and knowledge management.Torino, Italy: ACM, 2018: 587-596.

    [12] RILOFF E.Automatically constructing a dictionary for information extraction tasks[C]/ /Proceedings of the 11th national conference on artificial intelligence.Washington D C: AAAI,1993: 811-816.

    [13] KIM J T,MOLDOVAN D I.Acquisition of linguistic patterns for knowledge-based information extraction[J].IEEE Transactions on Knowledge and Data Engineering,1995,7 ( 5) : 713-724.

    [14] RILOFF E,SHOEN J.Automatically acquiring conceptual patterns without an annotated corpus[C]/ /Third workshop on very large corpora.Massachusetts,USA: ACL, 1995: 148-161.

    [15] 姜吉發(fā).一種事件信息抽取模式獲取方法[J].計(jì)算機(jī)工程,2005, 31( 15) : 96-98.

    [16] LIU S,CHEN Y,HE S, et al.Leveraging framenet to improve automatic event detection[C]/ /Proceedings of the 54th ACL.Berlin,Germany: ACL, 2016: 2134-2143.

    [17] NGUYEN T H,GRISHMAN R.Event detection and domain adaptation with convolutional neural networks[C]/ /Proceedings of the 53rd ACL and the 7th IJCNLP. Beijing,China: ACL, 2015: 365-371.

    [18] FENG X,QIN B,LIU T.A language-independent neural network for event detection[J].Science China: Information Sciences,2018, 61( 9) : 092106.

    [19] NGUYEN T H,CHO K,GRISHMAN R.Joint event extraction via recurrent neural networks[C]/ /Proceedings of the 2016 NAACL: human language technologies.San Diego,California: ACL, 2016: 300-309.

    [20] ZENG Y,YANG H,FENG Y,et al.A convolution BiLSTM neural network model for Chinese event extraction[M]/ /Natural language understanding and intelligent applications.[s.l.]: Springer, 2016: 275-287.

    [21] LI P,ZHU Q,ZHOU G.Joint modeling of argument identification and role determination in Chinese event extraction with discourse-level information[C]/ /Proceedings of the 23th IJCAI.Beijing,China: AAAI Press, 2013: 2120-2126.

    [22] LI Q, JI H,YU H, et al.Constructing information networks using one single model[C]/ /Proceedings of the 2014 EMNLP.Doha,Qatar: ACL, 2014: 1846-1851.

    [23] CHEN Y,XU L,LIU K,et al.Event extraction via dynamic multi-pooling convolutional neural networks[C]/ /Proceedings of the 53rd ACL and the 7th IJCNLP. Beijing,China: ACL, 2015: 167-176.

    [24] CHEN Z, JI H.Language specific issue and feature exploration in Chinese event extraction[C]/ /Proceedings of human language technologies: the 2009 NAACL,volume: short papers.Boulder,Colorado,USA: ACL, 2009: 209-212.

    [25] LIN H,LU Y,HAN X,et al.Nugget Proposal Networks for Chinese event detection[C]/ /Proceedings of the 56th ACL.Melbourne,Australia: ACL, 2018: 1565-1574.

    [26] LAFFERTY J,MCCALLUM A,PEREIRA F C N.Conditional random fields: Probabilistic models for segmenting and labeling sequence data[C]/ /Proceedings of the 18th intelligence conference on machine learning.Francisco,CA,USA: Morgan Kaufmann Publishers Inc, 2001: 282-289.

    [27] LI P,ZHOU G,ZHU Q, et al.Employing compositional semantics and discourse consistency in Chinese event extraction[C]/ /Proceedings of the 2012 joint conference on EMNLP and computational natural language learning.Jeju Island,Korea: ACL, 2012: 1006-1016.

    總結(jié)

    以上是生活随笔為你收集整理的中文事件抽取研究综述的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。