装备保障性验证知识图谱构建方法研究-学习笔记
裝備保障性驗證知識圖譜構(gòu)建方法研究
領(lǐng)域知識圖譜構(gòu)建
在邏輯層面,知識圖譜通常可以劃分為數(shù)據(jù)層和模式層兩個層次。數(shù)據(jù)層主要是將領(lǐng)域中的多源異構(gòu)數(shù)據(jù)轉(zhuǎn)換為三元組的形式,通過一系列三元組表達領(lǐng)域知識或者常識知識,比如用(實體1,關(guān)系,實體2)、(實體、屬性,屬性值)這樣的三元 組來表達事實,從而實現(xiàn)對知識進行存儲。模式層是在數(shù)據(jù)層的基礎(chǔ)上構(gòu)建的,領(lǐng)域知識圖譜構(gòu)建過程通常通過構(gòu)建領(lǐng)域本體(Ontology)來規(guī)范數(shù)據(jù)層。本體規(guī)范了領(lǐng)域核心結(jié)構(gòu),具有較強的結(jié)構(gòu)層次,有效減少冗余。
由于垂直領(lǐng)域知識圖譜對領(lǐng)域知識準(zhǔn)確性以及領(lǐng)域知識之間深層次關(guān)系要求較高,因此一般采用自頂向下構(gòu)建方式。
雖然垂直領(lǐng)域知識圖譜一般面向不同的特定領(lǐng)域和不同的數(shù)據(jù)模式,現(xiàn)在沒有統(tǒng)一的構(gòu)建標(biāo)準(zhǔn)和規(guī)范。但是一般構(gòu)建過程可以分為六個階段,即知識建模、知識存儲、知識抽取、知識融合、知識計算、知識應(yīng)用。
面向裝備保障性驗證的知識圖譜構(gòu)建
裝備保障性驗證知識圖譜構(gòu)建技術(shù)流程。
D2R將關(guān)系數(shù)據(jù)庫中的數(shù)據(jù)映射到RDF(資源描述框架,表示為三元組形式,RDF本質(zhì)是一種數(shù)據(jù)模型(Data Model),RDF假設(shè)所有語義都可以以三元組形式進行表示,復(fù)雜語義可以由n個三元 組組合表示,它提供了一種統(tǒng)一的描述實體、概念、屬性的標(biāo)準(zhǔn),形式上表示為SPO三元組形式)中。
KBP(知識庫填充,關(guān)系抽取語料)KBP 評測由文本分析會議主辦,其目標(biāo)是開發(fā)和評估從非結(jié)構(gòu)化文本中獲取知識填充知識庫的技術(shù)。KBP 評測覆蓋了知識庫填充的獨立子任務(wù)以及被稱為“冷啟動”的端到端知識庫構(gòu)建任務(wù)。
采用應(yīng)用最為廣泛的OWA形式化定義進行裝備保障性驗證領(lǐng)域本體建模。
C是領(lǐng)域概念集; A是概念的屬性集;R 是關(guān)系集;A 是每個關(guān)系屬性集; H表示概念層次;X 表示公理集。
基于本體的保障性驗證系統(tǒng)分析的核心在于:在OWA形式化規(guī)范下逐層確定裝備保障系統(tǒng)概念和概念之間的關(guān)系。 如此逐層分析,直至確定研究目的下所定義的最小細(xì)粒度概念。 在概念分析的過程中會逐層體現(xiàn)所需建立的模型。
多源異構(gòu)裝備保障性實體抽取和實體關(guān)系構(gòu)建包括裝備保障性驗證知識抽取、關(guān)系鏈接、關(guān)系推理等。
保障性驗證領(lǐng)域知識的來源包括裝備保障本體庫、基礎(chǔ)裝備保障性數(shù)據(jù)、與裝備保障性相關(guān)的國軍標(biāo)、裝備保障性相關(guān)的科研項目成果(報告、模型)、試驗基地的歷史數(shù)據(jù)等。可從中提取裝備保障性驗證相關(guān)概念、裝備保障性驗證實體、裝備保障性驗證相關(guān)屬性、語義關(guān)系、空間關(guān)系、時間關(guān)系。
時間關(guān)系主要描述在裝備壽命周期各階段裝備保障性驗證所處的不同狀態(tài)以及任務(wù)屬性。對時間關(guān)系的形式化描述可分為兩類,
一類是裝備保障性驗證事件、過程等實體之間的時變關(guān)系描述,如事件:“在裝備設(shè)計階段,裝備設(shè)計人員需要考慮加油口蓋消沫功能”可對抽取得到的三元組“設(shè)計人—設(shè)計—加油口蓋消沫功能”添加時間標(biāo)簽拓展為四元組,用來描述時間;
第二類是空間特征的時間變化屬性。可用于實體和關(guān)系的更新,如裝備進行長途奔襲過程中,裝備的空間屬性值以及裝備狀態(tài)屬性值是隨時間而變化的,這也是未來構(gòu)建動態(tài)知識圖譜的時間軸基礎(chǔ)。
經(jīng)過知識抽取得到的知識可以劃分為本體層(抽象知識)和實例層(具體事實)。
雖然通過本體建模的方式構(gòu) 建了裝備保障性驗證領(lǐng)域的本體模型,但是事實上,無法構(gòu)建出一個能夠包含全方面的統(tǒng)一本體,因為面向不同應(yīng)用場景以及面向不同的用戶使得不同本體之間有不同側(cè)重點和差異。大量實例之間也存在異構(gòu)性問題。
由于知識之間可能存在冗余和錯誤的情況,需要通過知識融合來解決本體層和實例層異構(gòu)問題,以提高知識質(zhì)量和精度。
如圖描述了本體映射的基本過程。
基于術(shù)語:自然語言處理技術(shù),比較映射對象之間的相似度
基于術(shù)語的本體映射
? ? ? ? ? ? ?基于字符串
? ? ? ? ? ? ? ? ? ? ? (1)規(guī)范化
? ? ? ? ? ? ? ? ? ? ? (2)相似度量方法:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 漢明距離:計算字符出現(xiàn)位置的不同
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 子串相似度
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 編輯距離:修改其中一個使之與另一個相同所需的最小操作代價
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 路徑距離:考慮父概念
基于規(guī)則的實例匹配
基于EM算法的半監(jiān)督學(xué)習(xí)框架----自動尋找實例匹配規(guī)則
該框架以迭代的方式自動發(fā)現(xiàn)匹配規(guī)則,逐步提高匹配規(guī)則集的質(zhì)量,再利用跟新后的規(guī)則集來尋找高質(zhì)量的匹配對。
在規(guī)范字符串的基礎(chǔ)上,通過度量字符串的相似程度判斷本體的映射關(guān)系,可以使用以下四種方法度量字符串相似度。
導(dǎo)入的任意兩個本體字符s和t。
若存在兩個字符串p和q使得s=p+t+q或t=p+s+q,則稱t是s的子串或s是t的子串,令x為s和t的最大公共子串,則s和t的子串相似度為:
若給定一個字符串操作集合op和一個代價函數(shù)w,對于任意一對字符串s和t,存在將s轉(zhuǎn)化為t的操作序列集合,則兩字符串的編輯距離為:
若給定兩個字符串序列,則路徑距離計算,是某字符串度量函數(shù)
裝備保障性驗證知識圖譜應(yīng)用
?
總結(jié)
以上是生活随笔為你收集整理的装备保障性验证知识图谱构建方法研究-学习笔记的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: KnowIME: A System to
- 下一篇: 华为matepad2023柔光版和华为m