论文浅尝 | 知识图谱的单样本关系学习
鏈接:http://cn.arxiv.org/pdf/1808.09040
動機
如今的知識圖譜規模很大但是完成度不高,long-tail關系在知識圖譜中很常見,之前致力于完善知識圖譜的方法對每個關系都需要大量的訓練樣本(三元組),而新加入的關系其樣本數量通常不是很多。為解決這個問題,本文提出了one-shot場景下的關系學習模型,該模型通過學習實體的embedding和相應的局部圖結構來獲得一個匹配度量函數,最終推導出新的三元組。
亮點
本文提出的模型有以下亮點:
(1)只依賴于實體的embedding和局部圖結構(之前的方法依賴于關系的良好表示);
(2)一旦訓練完成便可以預測任何關系(之前的方法需要微調來適應新的關系)
概念
本文主要針對(h,r,?)類型的推測,即從候選集合中選出最合適的t來構造新的三元組(h,r,t),主要符號含義如下:
?
??????? G{(h,r,t)}:即原始KG,三元組集合
??????? :對應于G中的一個關系(任務),每個 T_r 中所有三元組的r相同
??????? :任務集合
??????? :只含有一個三元組(h_0,r,t_0)
??????? :C_(h_i,r) 為候選t集合
??????? G':G的子集,作為背景知識
模型
本文的模型由兩部分組成:
(1)?? Neighbor Encoder
該模塊利用局部圖結構對(h,t)實體對進行編碼,首先對任意h/t構建其one-hop Neighbor set N_e,再利用Encoding function f(N_e)編碼,最后將 h 和 t 的編碼連接起來便得到(h,t)實體對的表示,f(N_e )形式如下:
??
(2)?? Matching processor
對于候選集 C_(h_i,r) 中的每一個 t_(i,j),利用LSTM計算 (h_i,t_(i,j)) 和 (h_0,t_0) 的相似度,相似度最高的 t_(i,j) 即為 (h_i,r) 對應的t,迭代過程如下:
?
實驗?????????????????????????????????????????????????????????????????????????
⑴數據集
本文的兩個數據集NELL-One和Wiki-One是作者分別基于NELL和Wikidata構建(選取其中三元組數量在50~500之間的關系)。
⑵實驗結果
作者將本文提出的模型(GMatching)與之前基于embedding的模型在NELL-One和Wiki-One兩個數據集上進行了比較,結果顯示該模型各項指標均優于之前的模型。
總結??????????????????????????????????????????????????
本文提出的模型利用實體的局部圖結構以及學習度量來匹配實體對,一經訓練可以直接適用于預測任何關系,并在one-shot場景下表現出優越性能。
?
論文筆記整理:楊帆,浙江大學碩士,研究方向為知識圖譜、自然語言處理。
?
OpenKG.CN
中文開放知識圖譜(簡稱OpenKG.CN)旨在促進中文知識圖譜數據的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。
點擊閱讀原文,進入 OpenKG 博客。
總結
以上是生活随笔為你收集整理的论文浅尝 | 知识图谱的单样本关系学习的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 图谱实战 | 李翔:美团到店综合知识图谱
- 下一篇: 如何成为架构师?3条有效的实战经验