日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪(fǎng)問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) >

论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法

發(fā)布時(shí)間:2024/7/5 36 豆豆
生活随笔 收集整理的這篇文章主要介紹了 论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

筆記整理:張清恒,南京大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系,碩士研究生。


論文鏈接:https://people.eng.unimelb.edu.au/jianzhongq/papers/AAAI2019_EntityAlignment.pdf

發(fā)表會(huì)議:AAAI 2019

摘要

近來(lái),針對(duì)跨知識(shí)圖譜(KGs)的實(shí)體對(duì)齊任務(wù),研究者提出并改進(jìn)了多種基于embedding的模型。這些模型充分利用實(shí)體與實(shí)體之間的關(guān)系以得到實(shí)體之間的語(yǔ)義相似度,換言之,這些模型更關(guān)注于關(guān)系三元組(relationship triple)。本文發(fā)現(xiàn)KG中存在著大量的屬性三元組(attribute triple),本文提出的模型利用屬性三元組生成 attributecharacter embeddings,使其幫助不同KG中的實(shí)體映射到同一空間中。與此同時(shí),模型還使用傳遞規(guī)則進(jìn)一步豐富三元組。實(shí)驗(yàn)結(jié)果表明,相比于現(xiàn)有方法,本文提出的模型在實(shí)體對(duì)齊任務(wù)上取得了較大的提升。

模型介紹

1.???? 概覽

如圖1所示,該模型由三個(gè)核心部分組成,分別是謂詞對(duì)齊(predicate alignment)、嵌入學(xué)習(xí)(embedding learning)和實(shí)體對(duì)齊(entity alignment)。

2. Predicate Alignment

該模塊通過(guò)重命名潛在對(duì)齊的謂詞將兩個(gè)KG合并成一個(gè)KG。通過(guò)計(jì)算謂詞的名稱(chēng)(URI的最后一部分)相似度,發(fā)現(xiàn)潛在對(duì)齊的謂詞對(duì),然后使用統(tǒng)一的命名格式將其重命名。例如,將對(duì)其的謂詞對(duì),“dbp:bornIn”和“yago:wasBornIn”重命名成“:bornIn”。

3.???? Embedding Learning

3.1?? Structure Embedding

Structureembedding模塊采用TransE實(shí)現(xiàn),與TransE不同的是,模型希望更關(guān)注

已對(duì)齊的三元組,也就是包含對(duì)齊謂詞的三元組。模型通過(guò)添加權(quán)重來(lái)實(shí)現(xiàn)這一目的。Structure embedding的目標(biāo)函數(shù)如下:

其中,count(r) 是包含的三元組的數(shù)量,表示合并之后的三元組集合。

3.2 Attribute Character Embedding

structure embedding 一樣,attribute character embedding 也借鑒了 TransE 的思想,把謂詞作為頭實(shí)體與屬性值之間的轉(zhuǎn)換媒介。但與 structure embedding 不同的是,對(duì)于相同含義的屬性值,在不同的KG中表現(xiàn)形式存在差別。因此,本文提出了三種屬性值組合函數(shù)。在組合函數(shù)編碼屬性值之后,模型希望屬性三元組滿(mǎn)足 h+r≈f_a(a),其中 f_a(a) 是組合函數(shù),表示屬性值的字符串 a={c_1,c_2,c_3,…,c_t}。三種組合函數(shù)如下:

1. Sum compositional functionSUM

2. LSTM-based compositional functionLSTM


3. N-gram-based compositional functionN-gram

Attribute character embedding 模塊的目標(biāo)函數(shù)如下:

3.3 ? Joint Learning of Structure Embedding and Attribute Character Embedding

本文提出的模型旨在使用attribute character embedding h_ce 幫助structure embedding h_se 在同一向量空間中完成訓(xùn)練,聯(lián)合訓(xùn)練的目標(biāo)函數(shù)如下:

本文提出的模型的整體目標(biāo)函數(shù)如下:

4.???? Entity Alignment

在經(jīng)過(guò)上述訓(xùn)練過(guò)程之后,來(lái)自不同KG的相似的實(shí)體將會(huì)有相似的向量表示,因此可通過(guò)獲得潛在的實(shí)體對(duì)齊對(duì)。此外,模型設(shè)定相似度閾值來(lái)過(guò)濾潛在實(shí)體對(duì)齊對(duì),得到最終的對(duì)齊結(jié)果。

5.???? Triple Enrichment via Transitivity Rule

本文發(fā)現(xiàn)利用傳遞關(guān)系可以豐富三元組,從而提升實(shí)體對(duì)齊效果。給定三元組 ?h_1,r_1,t? 和三元組 ?t,r_2,t_2?,可將 作為頭實(shí)體 h_1 和 h_2 尾實(shí)體的關(guān)系,使其滿(mǎn)足。


實(shí)驗(yàn)分析

1.???? 數(shù)據(jù)集

本文從 DBpedia (DBP)、LinkedGeoData (LGD)、Geonames (GEO) 和 YAGO 四個(gè) KG 中抽取構(gòu)建了三個(gè)數(shù)據(jù)集,分別是DBP-LGDDBP-GEODBP-YAGO。具體的數(shù)據(jù)統(tǒng)計(jì)如下:

2.???? 實(shí)體對(duì)齊結(jié)果

本文對(duì)比了三個(gè)相關(guān)的模型,分別是 TransEMTransEJAPE。試驗(yàn)結(jié)果表明,本文提出的模型在實(shí)體對(duì)齊任務(wù)上取得了全面的較大的提升,在三種組合函數(shù)中,N-gram函數(shù)的優(yōu)勢(shì)較為明顯。此外,基于傳遞規(guī)則的三元組豐富模型對(duì)結(jié)果也有一定的提升。具體結(jié)果如下:

3.???? 基于規(guī)則的實(shí)體對(duì)齊結(jié)果

為了進(jìn)一步衡量 attribute character embedding 捕獲實(shí)體間相似信息的能力,本文設(shè)計(jì)了基于規(guī)則的實(shí)體對(duì)齊模型。本實(shí)驗(yàn)對(duì)比了三種不同的模型:以label的字符串相似度作為基礎(chǔ)模型;針對(duì)數(shù)據(jù)集特點(diǎn),在基礎(chǔ)模型的基礎(chǔ)之上增加了坐標(biāo)屬性,以此作為第二個(gè)模型;第三個(gè)模型是把本文提出的模型作為附加模型,與基礎(chǔ)模型相結(jié)合。具體結(jié)果如下:

4.???? KG補(bǔ)全結(jié)果

本文還在KG補(bǔ)全任務(wù)上驗(yàn)證了模型的有效性。模型主要測(cè)試了鏈接預(yù)測(cè)和三元組分類(lèi)兩個(gè)標(biāo)準(zhǔn)任務(wù),在這兩個(gè)任務(wù)中,模型也取得了不錯(cuò)的效果。具體結(jié)果如下:




OpenKG


開(kāi)放知識(shí)圖譜(簡(jiǎn)稱(chēng) OpenKG)旨在促進(jìn)中文知識(shí)圖譜數(shù)據(jù)的開(kāi)放與互聯(lián),促進(jìn)知識(shí)圖譜和語(yǔ)義技術(shù)的普及和廣泛應(yīng)用。

點(diǎn)擊閱讀原文,進(jìn)入 OpenKG 博客。

總結(jié)

以上是生活随笔為你收集整理的论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。