日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪(fǎng)問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) >

科普 | 动态本体简介

發(fā)布時(shí)間:2024/7/5 36 豆豆
生活随笔 收集整理的這篇文章主要介紹了 科普 | 动态本体简介 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

本文轉(zhuǎn)載自知乎專(zhuān)欄知識(shí)圖譜和智能問(wèn)答



1

近年來(lái),隨著語(yǔ)義Web的興起,本體技術(shù)受到了廣泛關(guān)注。很多大型跨國(guó)公司都開(kāi)始研究本體技術(shù)。谷歌于2012年提出了知識(shí)圖譜的項(xiàng)目,旨在利用本體技術(shù)來(lái)提高搜索的精度和更智能化的知識(shí)瀏覽。國(guó)內(nèi)的互聯(lián)網(wǎng)公司,如百度、搜狗,也已經(jīng)開(kāi)展這方面的項(xiàng)目。微軟提出了Probase項(xiàng)目,旨在通過(guò)爬取網(wǎng)頁(yè)中的信息來(lái)構(gòu)建大規(guī)模的本體。IBM利用語(yǔ)義Web技術(shù)來(lái)處理異構(gòu)醫(yī)療數(shù)據(jù)的整合以及更準(zhǔn)確的查詢(xún)回答。本體技術(shù)在IBM的著名問(wèn)答系統(tǒng)Watson中發(fā)揮了重要的作用。Oracle實(shí)現(xiàn)了一個(gè)強(qiáng)大的語(yǔ)義數(shù)據(jù)推理和索引系統(tǒng)。本體技術(shù)還受到歐美政府的支持。英國(guó)政府發(fā)起了Data.gov.uk


本體可以被理解成特定領(lǐng)域規(guī)范概念集及其邏輯關(guān)系的描述。本體為特定領(lǐng)域中的信息提供了一個(gè)基本的分類(lèi)框架,同時(shí)也為特定領(lǐng)域中的信息之間的關(guān)聯(lián)性提供了一定程度的邏輯描述,使得特定領(lǐng)域中的信息資源能夠在本體描述的框架上組織成一個(gè)有機(jī)的整體。近十多年來(lái),在許多計(jì)算機(jī)科學(xué)家與許多領(lǐng)域的科學(xué)家及其工程人員的共同努力之下,在許多領(lǐng)域都已經(jīng)創(chuàng)建有對(duì)應(yīng)的元數(shù)據(jù)與本體。使用這些特定領(lǐng)域的元數(shù)據(jù)與本體,我們就可以對(duì)萬(wàn)維網(wǎng)上的現(xiàn)有的許多信息資源采用手工,半自動(dòng)化,或自動(dòng)化的手段進(jìn)行語(yǔ)義標(biāo)注(Semantic Annotation)。這樣,我們就可以通過(guò)針對(duì)特定領(lǐng)域的語(yǔ)義搜索引擎有效地更精準(zhǔn)地提供人們所需要的信息資源。由于許多領(lǐng)域知識(shí)之間都有一定的關(guān)聯(lián)性,某個(gè)元數(shù)據(jù)或本體中的一些概念可能概念等價(jià)于其他一些元數(shù)據(jù)或本體中的另外一些概念,故這些特定領(lǐng)域的本體與元數(shù)據(jù)都存在著一定的語(yǔ)義關(guān)聯(lián)性。這種關(guān)聯(lián)性可以通過(guò)其關(guān)聯(lián)描述來(lái)刻畫(huà)。于是,關(guān)聯(lián)語(yǔ)義數(shù)據(jù)集為我們提供了跨學(xué)科跨領(lǐng)域的語(yǔ)義數(shù)據(jù)的整合體。


一個(gè)本體在生成之后,根據(jù)應(yīng)用發(fā)展的需求,總是處于不斷地發(fā)展和變化之中,這就需要對(duì)之進(jìn)行有效的管理。這些本體管理環(huán)節(jié)包括:

1. 本體演化(Ontology Evolution):研究本體的發(fā)展過(guò)程中的變化規(guī)律及其管理與維護(hù)的相關(guān)技術(shù)。

2. 本體融合(Ontology Integration):研究如何從多個(gè)本體中集成一個(gè)新的本體。

3. 本體驗(yàn)證(Ontology Validation): 研究如何驗(yàn)證本體的正確性。

4. 本體版本化(Ontology Versioning):研究如何維護(hù)與管理本體的演化過(guò)程中所生成的不同版本的本體的相關(guān)技術(shù)。


下面以元素周期表為例介紹本體。


圖1

如圖1所示,元素周期表分為10類(lèi),比如說(shuō)堿金屬和堿土金屬,這些可以看成是本體的類(lèi)。每個(gè)類(lèi)都包含一些化學(xué)元素,比如說(shuō)主族金屬包含鋁和鎵等。每一個(gè)化學(xué)元素通過(guò)百科可以找到各自的屬性等信息。并且不同的化學(xué)元素之間會(huì)有一些關(guān)系。


在Palantir中,一個(gè)本體主要包括以下幾個(gè)成分:

1. 對(duì)象(Object):這里對(duì)象指的是任何被建模的事物, Palantir中對(duì)象分為文檔(document)、實(shí)體(entities)和事件(event)。文檔是基于文本的,實(shí)體是一些類(lèi),比如說(shuō)人、地點(diǎn),而事件是以時(shí)間出現(xiàn)的事物。

2. 屬性(Properties): 這里屬性指的是對(duì)象的品質(zhì),比如說(shuō)人的性別。

3. 關(guān)系(Relationship):這里關(guān)系指的是概念之間的關(guān)聯(lián),比如說(shuō)人物之間的雇傭關(guān)系。


在Palantir中,對(duì)象、屬性和關(guān)系是硬編碼的,基于它們可以設(shè)計(jì)各種靈活的本體和數(shù)據(jù)模型。而這里的對(duì)象又被分為文檔、實(shí)體和事件。這個(gè)分類(lèi)非常有講究,因?yàn)閷?duì)于情報(bào)分析來(lái)說(shuō),很重要的就是對(duì)文檔的檢索以及文檔的分析,對(duì)人物、組織等實(shí)體的畫(huà)像和關(guān)聯(lián),對(duì)事件的建模和分析,而且文檔、實(shí)體和事件之間是一個(gè)自循環(huán)的系統(tǒng)。這種靈活性是通過(guò)給某個(gè)對(duì)象添加不同的屬性,或者給兩個(gè)對(duì)象添加不同的關(guān)系來(lái)實(shí)現(xiàn)。跟一般的本體不一樣的地方在于,動(dòng)態(tài)本體允許對(duì)任何不再使用的對(duì)象、屬性和關(guān)系進(jìn)行移除,并且可以根據(jù)需求添加新的對(duì)象、屬性和關(guān)系,所以本體是時(shí)刻處于動(dòng)態(tài)更新的。另外,還支持對(duì)已有對(duì)象、屬性和關(guān)系的功能的修改,比如說(shuō)可以添加和修改標(biāo)簽、圖標(biāo)、解析器等。


動(dòng)態(tài)本體允許一個(gè)組織對(duì)領(lǐng)域相關(guān)的信息進(jìn)行建模,而且這種建模比較靈活。對(duì)于同一個(gè)概念或者相似概念可以多種方式進(jìn)行建模。比如說(shuō),如果要對(duì)人的職業(yè)進(jìn)行建模,有以下幾種模式:


圖2


圖2中左邊是把職業(yè)作為一種對(duì)象定義,即把Pilot、Lawyer、Doctor作為Person的子類(lèi),這里Pilot和Person一樣都是對(duì)象,可以給出他們的屬性等。圖2中間是把職業(yè)作為Person的屬性,而這里屬性值是Doctor、Pilot、Lawyer。這里假設(shè)了一個(gè)人可以從事多個(gè)職業(yè)。圖2中右邊把職業(yè)看成是一種關(guān)系,這里有三種關(guān)系,即人和人之間的醫(yī)患關(guān)系、人跟飛機(jī)之間的駕駛關(guān)系以及人跟人之間的律師關(guān)系。從圖2可以看出對(duì)于不同的上下文,可以對(duì)一個(gè)事物做不同的建模。


動(dòng)態(tài)本體對(duì)于異構(gòu)數(shù)據(jù)的集成很有幫助。現(xiàn)有關(guān)系數(shù)據(jù)庫(kù)的數(shù)據(jù)管理系統(tǒng)一般采用表和關(guān)系的固定模式來(lái)組織數(shù)據(jù),當(dāng)模式變化是,需要對(duì)表進(jìn)行修改,導(dǎo)致很多重復(fù)勞動(dòng)。另外,基于一個(gè)固定的模式也不利于對(duì)數(shù)據(jù)做集成,特別是對(duì)于數(shù)據(jù)經(jīng)常要更新的場(chǎng)景。動(dòng)態(tài)本體的提出就是為了提供一個(gè)靈活可變的數(shù)據(jù)模型,方便數(shù)據(jù)管理和多源數(shù)據(jù)的集成。在一個(gè)應(yīng)用中,可以構(gòu)建一個(gè)數(shù)據(jù)庫(kù)的動(dòng)態(tài)本體,而該動(dòng)態(tài)本體可以用來(lái)集成各種數(shù)據(jù)。具體思路如下:

1. 通過(guò)一個(gè)對(duì)象類(lèi)型編輯器來(lái)生成數(shù)據(jù)類(lèi)型和數(shù)據(jù)類(lèi)型的特征。

2. 通過(guò)一個(gè)屬性類(lèi)型編輯器生成屬性類(lèi)型并且定義該屬性類(lèi)型的特征。

3. 每個(gè)屬性類(lèi)型都有一個(gè)解析器,該解析器將一些輸入的數(shù)據(jù)跟動(dòng)態(tài)本體做一個(gè)映射,并且把輸入數(shù)據(jù)添加到數(shù)據(jù)庫(kù)中。


Palantir動(dòng)態(tài)本體通過(guò)解析器可以把各種格式的數(shù)據(jù)都集成到一個(gè)數(shù)據(jù)庫(kù)中,從而很好地實(shí)現(xiàn)了異構(gòu)數(shù)據(jù)的集成。為了達(dá)到這個(gè)目前,需要將動(dòng)態(tài)本體的對(duì)象類(lèi)型和屬性類(lèi)型定義完備,同時(shí)需要將解析器的正則表達(dá)式寫(xiě)好,否則很難使用。這也是Palantir的動(dòng)態(tài)本體的缺陷所在。




OpenKG.CN


中文開(kāi)放知識(shí)圖譜(簡(jiǎn)稱(chēng)OpenKG.CN)旨在促進(jìn)中文知識(shí)圖譜數(shù)據(jù)的開(kāi)放與互聯(lián),促進(jìn)知識(shí)圖譜和語(yǔ)義技術(shù)的普及和廣泛應(yīng)用。

點(diǎn)擊閱讀原文,進(jìn)入 OpenKG 博客。

總結(jié)

以上是生活随笔為你收集整理的科普 | 动态本体简介的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。