日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

论文浅尝 | 基于表示学习的大规模知识库规则挖掘

發布時間:2024/7/5 编程问答 42 豆豆
生活随笔 收集整理的這篇文章主要介紹了 论文浅尝 | 基于表示学习的大规模知识库规则挖掘 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

鏈接:www.ict.griffith.edu.au/zhe/pub/OmranWW18.pdf


動機


傳統的規則挖掘算法因計算量過大等原因無法應用在大規模KG上。為了解決這個問題,本文提出了一種新的規則挖掘模型RLvLR(Rule Learning via LearningRepresentation),通過利用表示學習的embedding和一種新的子圖采樣方法來解決之前工作不能在大規模KGscalable的問題。


亮點


文章的亮點主要包括:

1)采樣只與對應規則相關的子圖,在保存了必要信息的前提下極大減少了算法的搜索空間和計算量;

2)提出了argument embedding,將規則表示為predicate sequence


概念


1.?? closed-pathruleLHS記為body(r)RHS記為head(r)

2.???? supportdegree of r,滿足 r 的實體對個數

3. standard confidencehead coverage

方法


Sampling Method

head predicate Pt為輸入,把KG看成無向圖,選擇到Pt的頭尾實體路徑長不超過len-1的實體和關系組成子圖K’=(E’,F’),后面所有的計算都基于這個子圖。

?

argument embedding

?對于謂詞P,它的subject argument定義為所有出現在subject上實體的embedding的加權平均,object argument則為尾實體上實體的embedding的加權平均,這個主要用在后面的score function上,即本文引入了共現的信息,對于路徑(P1,P2)來說,P1object argumentP2subject argument應該很相似,這里就應用到了下面說的基于argument embeddingscore function

co-occurrence score function

????? 這個 score function 就是基于上面的 argument embedding,以上圖這個長為 3 rule 為例,path p=P1,P2embeddingP1*P2,之前通用的synonymy scoring function就是讓 p Pt embedding 相似,再與這個本文提出的co-occurrence scorefunction,結合起來就是最后的score function,下圖左邊的就是利用了路徑的同義信息,即 body(r) predicate embedding path 的乘積應當與 headpredicate embedding 相似。

Rule Evaluation

根據 score function 抽出來的 rule 還要進過篩選,具體做法是先排除掉 support degree 小于 1 rule,再過濾掉 standard confidence<minSChead coverage<minHC rule

?

實驗

??????????????????????????????????????????????????????????????????

. 數據集

本文的關注點是 scalable,所以選取做比較的數據集都是大規模知識庫

. 實驗結果

作者與 AMIE+ 在三個規模較大的知識庫上進行了比較,具體做法是隨機選取 20 target predicate 進行挖掘,其中 R SC>0.1&HC>0.01 的規則,QCSC>0.7 的規則,結果顯示了 RLvLR 在大規模 KG 上的效率和挖掘規則的能力。


總結??????????????????????????????????????????????????


本文提出了一種可以在大規模 KG 上可以以較小計算量進行規則挖掘的模型,減少計算量的方式包括子圖采樣,argument embedding co-occurrence? score function

?

論文筆記整理:汪寒,浙江大學碩士,研究方向為知識圖譜、自然語言處理。

?



OpenKG.CN


中文開放知識圖譜(簡稱OpenKG.CN)旨在促進中文知識圖譜數據的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。

點擊閱讀原文,進入 OpenKG 博客。

總結

以上是生活随笔為你收集整理的论文浅尝 | 基于表示学习的大规模知识库规则挖掘的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。