當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

论文浅尝 | 知识图谱的不确定性衡量

發(fā)布時(shí)間：2024/7/5 编程问答 26 豆豆

生活随笔收集整理的這篇文章主要介紹了论文浅尝 | 知识图谱的不确定性衡量小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

論文筆記整理：譚亦鳴，東南大學(xué)博士。

來(lái)源：Knowledge and Information Systems volume?62,?pages611–637(2020)

鏈接：https://link.springer.com/article/10.1007/s10115-019-01363-0

概要

本文的核心工作是利用知識(shí)結(jié)構(gòu)來(lái)衡量知識(shí)庫(kù)的不確定性。文章的內(nèi)容涵蓋了以下幾個(gè)部分：

1.首先隊(duì)知識(shí)庫(kù)的知識(shí)結(jié)構(gòu)進(jìn)行介紹；

2.以包含度特征為基礎(chǔ)，提出知識(shí)結(jié)構(gòu)與知識(shí)庫(kù)之間的依賴以及獨(dú)立性；

3.研究給定知識(shí)庫(kù)的不確定性度量（并證明該度量方法是以知識(shí)庫(kù)的知識(shí)結(jié)構(gòu)為基礎(chǔ)）；

4.最后，通過實(shí)驗(yàn)驗(yàn)證了本文方法的有效性，并從統(tǒng)計(jì)學(xué)的離散型和相關(guān)性兩個(gè)方面做有效性分析。

動(dòng)機(jī)與思路

作者用自問自答的形式對(duì)知識(shí)庫(kù)不確定進(jìn)行論述：

為何研究知識(shí)庫(kù)不確定性的度量？因?yàn)橹R(shí)庫(kù)本身具有不確定性。

為何研究知識(shí)庫(kù)的知識(shí)結(jié)構(gòu)？因?yàn)橹R(shí)結(jié)構(gòu)有助于從知識(shí)庫(kù)中發(fā)現(xiàn)知識(shí)。

為何使用知識(shí)結(jié)構(gòu)衡量知識(shí)庫(kù)的不確定性？因?yàn)楹茈y對(duì)比給定知識(shí)庫(kù)的不確定性值（原文是“This is because it is hard to compare the size of measure values of uncertainty for a given knowledge base.”，這句話沒看明白，我的理解是：由于不同知識(shí)庫(kù)的實(shí)體/關(guān)系規(guī)模差異較大，直接對(duì)知識(shí)庫(kù)做不確定性衡量得到的量化結(jié)果不適合（不能夠）反映出不同知識(shí)庫(kù)之間的不確定性差異，因此要使用一個(gè)高層特征（知識(shí)結(jié)構(gòu)），來(lái)代表并對(duì)不確定性的量化衡量做一個(gè)類似歸一化的效果。），而且如果獲取到兩個(gè)知識(shí)結(jié)構(gòu)之間的依賴關(guān)系，可以利用這個(gè)關(guān)系參與比較知識(shí)庫(kù)之間的不確定性差異。

概念與定義

首先，作者使用矩陣M對(duì)于二元關(guān)系R進(jìn)行了如下描述：

我們可以將矩陣中的x理解為知識(shí)庫(kù)中的實(shí)體，R表明實(shí)體之間的關(guān)系，當(dāng)R(x_i, x_j) =1時(shí)，表明x₁，x₂之間存在關(guān)系R.

可以看到，R在矩陣中可能構(gòu)成三種關(guān)系場(chǎng)景（令實(shí)體集合為U，x, y∈U）：

1.xRx （Re?exive）

2.xRy且yRx（Symmetric）

3.xRy，yRz，且xRz（Transitive）

當(dāng)R滿足上述三種情況時(shí)，被稱為“equivalence relation on U”,R?(U)則代表所有equivalence relation on U”的集合的族（我理解為子集的集合）

對(duì)于一個(gè)equivalence relation R，通過以下公式，可以抽取實(shí)體集U在R上對(duì)應(yīng)的類別子集：

因此，利用equivalence relation R可以對(duì)U進(jìn)行類別劃分，即：

故作者在這里提出定義：

2.1當(dāng)R是U的一個(gè)equivalence relation，那么(U, R)被視作一個(gè)Pawlak近似空間（這里需要對(duì)粗糙集的概念做一個(gè)初步了解），在此基礎(chǔ)上，X∈2^U（U的所有子集的族）的近似上下界可以通過以下公式定義：

2.2 當(dāng)R∈2^R*(U)時(shí)（R*(U)指U上所有的equivalence relation的集合），(U, R)可以表示一個(gè)知識(shí)庫(kù)，舉個(gè)栗子來(lái)看：

可以看到這個(gè)知識(shí)庫(kù)里有6個(gè)實(shí)體，4種關(guān)系，對(duì)應(yīng)得到了四組矩陣。

因此對(duì)應(yīng)可以得到知識(shí)庫(kù)對(duì)應(yīng)的近似空間的上下界：

知識(shí)結(jié)構(gòu)定義：

對(duì)于一個(gè)知識(shí)庫(kù)(U, R)，對(duì)于r∈R，可以通過以下公式描述r的知識(shí)結(jié)構(gòu)：

因此整個(gè)知識(shí)庫(kù)的知識(shí)結(jié)構(gòu)為：

對(duì)于兩個(gè)知識(shí)庫(kù)(U, P)與(U, Q)，當(dāng)：

則

知識(shí)結(jié)構(gòu)之間的依賴性與獨(dú)立性：

（參數(shù)在前文均已介紹過，這里不再贅述）

Inclusion degree（是一種衡量inclusion relationship質(zhì)量的標(biāo)準(zhǔn)），以下定義給出了兩個(gè)集合向量之間的Inclusion degree（3.9取值范圍及定義，3.10計(jì)算方式）：

作者描述了一個(gè)計(jì)算inclusiondegree的例子：

1.首先給出兩個(gè)知識(shí)庫(kù)的知識(shí)結(jié)構(gòu)：

2.計(jì)算inclusiondegree的過程為：

模型與算法

知識(shí)庫(kù)粒度檢測(cè)：

（首先給出粒度定義）

粒度的量化值如以下公式得到（作者在原文中對(duì)獲取過程做了證明）：

并提出定理：

作者認(rèn)為，知識(shí)粒化符合粒運(yùn)算特征，并且從不同的層次重新定義了知識(shí)和信息。粒度測(cè)量值隨類別增加而遞減。缺陷在于無(wú)法區(qū)分粒度相似但結(jié)構(gòu)不同的知識(shí)庫(kù)。

知識(shí)庫(kù)的熵檢測(cè)：

（也是先給出了定義及知識(shí)熵的計(jì)算方式，可以看到這里的熵是完全基于知識(shí)結(jié)構(gòu)的（定理4.8））

并且知識(shí)結(jié)構(gòu)的關(guān)系與熵的關(guān)聯(lián)性如下（原文附帶了證明過程）：

這里還給出知識(shí)結(jié)構(gòu)對(duì)應(yīng)的粗糙熵定義及計(jì)算過程：

知識(shí)庫(kù)的知識(shí)量（注意知識(shí)量是E，上面的粗糙熵是E_r）：

一些屬性：

實(shí)驗(yàn)與結(jié)果

實(shí)驗(yàn)數(shù)據(jù)

為了驗(yàn)證上述測(cè)量方式對(duì)于知識(shí)庫(kù)不確定性的量化衡量能力，作者在三個(gè)UCI數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)，數(shù)據(jù)集的統(tǒng)計(jì)信息如下表：

實(shí)驗(yàn)結(jié)果

首先對(duì)于三個(gè)數(shù)據(jù)集，均獲取到上一節(jié)介紹過的四種測(cè)量方式如下（以Nursery為例），|U|=12960，|A|=8，P_i=ind({a_i})(i = 1,2,…,8), P_i={P₁,P₂,…,P_i}(i = 1,2,…,8)：

圖3，4描述了這三種不同知識(shí)庫(kù)（不同不確定性）的測(cè)量結(jié)果：

從各個(gè)指標(biāo)的散度來(lái)看，知識(shí)量在衡量知識(shí)庫(kù)不確定上表現(xiàn)出了更好的性能。

OpenKG

開放知識(shí)圖譜（簡(jiǎn)稱 OpenKG）旨在促進(jìn)中文知識(shí)圖譜數(shù)據(jù)的開放與互聯(lián)，促進(jìn)知識(shí)圖譜和語(yǔ)義技術(shù)的普及和廣泛應(yīng)用。

點(diǎn)擊閱讀原文，進(jìn)入 OpenKG 博客。

創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎(jiǎng)勵(lì)來(lái)咯，堅(jiān)持創(chuàng)作打卡瓜分現(xiàn)金大獎(jiǎng)

總結(jié)

以上是生活随笔為你收集整理的论文浅尝 | 知识图谱的不确定性衡量的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： java程序员必看经典书单，以及各个阶段
下一篇： Java远程通讯技术及原理分析