日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

论文浅尝 | 融合多粒度信息和外部语言知识的中文关系抽取

發布時間:2024/7/5 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 论文浅尝 | 融合多粒度信息和外部语言知识的中文关系抽取 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

論文筆記整理:吳涵,天津大學碩士,研究方向:自然語言處理



Paper:https://www.aclweb.org/anthology/P19-1430/

Code:https://github.com/thunlp/Chinese_NRE

?

引入

中文NER問題在很大程度上取決于分詞的效果,所以在中文NER問題中,學者們通常先對文本進行分詞然后再預測序列中單詞的類別。這樣一來會導致一個問題,即在分詞中造成的錯誤會影響到NER的結果。

如果單純采用字向量的話會導致拆開了很多并不應該拆開的詞語,從而丟失了它們本身的內在信息(比如“人生”這個詞如果拆成字向量就成了“人”和“生”,這兩個字的單獨含義明顯與它們組合起來的詞的含義大相徑庭)。為了解決這個問題,該論文使用了一種新型的格子結構(latticestructure),它能夠將單詞本身的含義加入基于字向量的模型中,并引入義原作為外部知識。

?

文章摘要

????本文在ACL2018的一篇論文《ChineseNER Using Lattice LSTM》上加以改進,加入了義原作為外部知識,可以更好地理解語義信息。

由于同時考慮了詞格作為一個cell,自然網絡中路徑就變多,所以要對于基本的LSTM網絡的計算公式加以修改:

?

對詞格結尾的字符(如圖中的“市”)進行計算時,會有一點不同:由于向“市”的cell有兩個信息流的輸入,故需要再加一個inputgate,兩個門同時通過不同的信息流,需要設置權重:

本文模型:引入義原作為外部知識

?

加入義原后,計算時,在詞格cell狀態的計算上考慮不同義項帶來的影響,并為不同的義項設置不同的權重:

?

?

實驗結果

?

? 通過與基于詞粒度和字符粒度模型進行比較,可以得出,加入義原的多粒度模型可以獲得更好的效果,同時,詞格模型也是性能提升的重要原因。

?


?

OpenKG

開放知識圖譜(簡稱 OpenKG)旨在促進中文知識圖譜數據的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。

點擊閱讀原文,進入 OpenKG 博客。

總結

以上是生活随笔為你收集整理的论文浅尝 | 融合多粒度信息和外部语言知识的中文关系抽取的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。