知识图谱基础
本系列是學習七月算法知識圖譜課程的筆記。感覺自己完全就是一個托兒。前面七月算法機器學習,七月算法深度學習的筆記。現在又來了知識圖譜課程的筆記。
文章目錄
- 1 why知識圖譜
- 2 知識圖譜前世今生
- 3 知識圖譜相關技術
- 4 知識圖譜應用案例
1 why知識圖譜
沒有知識圖譜,計算機看到一個文字的時候只能是一個文字。例如看到“Magdalena Carmen Frida Kahlo y Calderón”,不能知道其中文名稱、簡稱、相關作品。
我們想要達到目標:things not strings
如果做到呢?深度學習+目前的知識圖譜。
見過大世面的AI:需要大量數據,不可解釋
知識淵博的AI:需要結構知識、推理邏輯,少量數據,可解釋
相結合之后:就是真實的AI
可以用:學而不思則罔,思而不學則殆 來理解。
好的知識圖譜需要具備學習能力和思考能力。
目前人們對于how why的需求越來越多,希望用知識圖譜來解決。
2 知識圖譜前世今生
- 語義網絡
1960年的語義網絡:是一些概念節點和節點之間的鏈接關系。更多的是is-a part-of這種關系。
缺點:沒有標準,就不利于多個網絡的融合。沒有辦法多節點和邊做定義。
優點:簡單,可以理解。
- 1980年引入本體概念
本體表示可以形式化化的:可以被計算機理解;是精確的:是共享的
- 1989年萬維網
萬維網最代表的技術是超文本標記語言。將文本、文檔互聯。
- 語義網
網頁之間有鏈接,但不知道為什么鏈接
做到機器可理解
對象、數據、事物的相互鏈接
比較對象:之前是比較兩個網頁(描述商品信息的網頁),有了語義網比較的是對象之間的屬性值。常見的兩種型號筆記本比較、兩種型號的車比較。
- 2006年開放數據連接
開放數據之間的鏈接:更多的數據做關聯
- 2012年google提出知識圖譜
google提出知識圖譜概念:是傳統知識工程與大數據知識工程之間的分界線
傳統知識工程:符號主義,本質是符號的操作和運算。解決了一些規則明確,應用封閉的問題。例如蛋白質結構的發現,數學定理的證明。依靠人工與專家獲取結構化知識。
大數據知識工程:利用數據、算力、模型獲取結構化的知識。
什么是知識圖譜:知識圖譜是一種基于圖的數據結構。由點和邊組成。每個節點表示一個實體,每條邊表示一個關系。
知識有哪些類型:事實知識、概念知識、詞匯知識、常識知識。
需要知道的開源知識圖譜:
1 DBpedia 項?始于 2007 年,是?個多語?知識圖譜,致?于從 Wikipedia ??中獲取結構化的知識供?眾使?,可稱作為數據庫版本的Wikipedia。
2 CN-DBpedia是由復旦?學知識?場實驗室(http://kw.fudan.edu.cn/ )研發并維護的?規模通?領域結構化百科,其前身是復旦GDM中?知識圖譜 。
3 YAGO
4 CN-Probase是由復旦?學知識?場實驗室研發并維護的?規模中?概念圖譜,包含約1700萬實體、27萬概念和3300萬isa關系。
5 WordNet
6 Cyc 常識知識庫
7 ConceptNet 始于 2004 年,最早源于 MIT 媒體實驗室,是?個?型的多語?常識知識庫。
8 openkg.cn
3 知識圖譜相關技術
1 業務理解
有哪些業務數據?
需要人工標注嗎?成本多大?
需要專家接入嗎?有專家嗎?
根據業務數據特性選擇存儲的數據庫
工程完成后,能給具體的場景帶來實際好處嗎?
回答:做不做?為什么做的問題
2 圖譜設計
專家法:自上而下,總體規劃
歸納法:單點切入,自下而上
混合法:大的方向上用專家法,小的場景下用歸納法
還可以用參照法,在缺乏知識圖譜經驗的情況下。 UMLS一體化醫學語言系統,可以參考其相關關系的分類體系
3 知識抽取
4 知識表示
RDF/turtle:抽象能力弱,一些知識是需要附加時空條件的,不能表達
5 知識存儲
https://zhuanlan.zhihu.com/p/63378196
6 知識鏈接
有了基礎的知識圖譜,想要加入更多的鏈接
同一個實體有不同的mention。
不同實體有相同的mention
7 知識融合
4 知識圖譜應用案例
1 用于推薦
2 自動生成創意文案
3 智能搜索
4 智能問答
5 智能決策
總結
- 上一篇: php基础教程(三):变量
- 下一篇: 微型计算机原理与应用彭楚武,微型计算机原