知识图谱学习笔记-知识图谱介绍
一、什么是知識圖譜?
解釋1:? 知識圖譜本質上是語義網絡 (本體論是語義網落的重要因素)
解釋2: 知識圖譜也叫做多關系圖,由多種類型的節點和多種類型的邊組成
?
構建知識圖譜系統中所涉及到的技術
數據獲取:數據爬蟲、數據庫讀取
數據預處理:數據清洗、知識抽取、信息抽取、消歧分析等
導入到知識圖譜:數據篩選、知識圖譜設計、批量導入、增量導入
應用層搭建:各類模型搭建、GraphX分布式處理、微服務
?
二、知識圖譜的應用場景
風控知識圖譜、證券知識圖譜(買股票一個事件發生、哪些上漲、下降)、教育知識圖譜(知識點之間的相關關系)、搜索、聊天機器人、醫療..
三、知識圖譜架構圖
授權數據(用戶允許抓取的數據)? ??公開數據(網上披露黑名單)? ? ?三方數據? ? ?業務數據(系統數據、身份證號等)
四、Neo4j與APOC組件介紹
圖數據庫的數據存儲形式
圖數據庫存儲的特點總結:
1、包含節點和關系? ? ?
2、節點可以有屬性(key-value形式存儲)
3、節點可以有一個或者多個標簽(類別)
4、關系有名字和方向,并總是有一個開始節點和一個結束節點
?
五、Neo4j獲取和部署
參考帖子:https://blog.csdn.net/u014032819/article/details/78506606
六、APOC
安裝APOC ,下載apoc-3.4.0.3-all.jar和mysql-connector-java-5.1.21.jar兩個jar包,放到neo4j的plugins目錄下,找到自己對應的版本即可
APOC功能
1、文本和索引查找:提供索引查詢、管理、全文圖標和搜索等功能
2、實用函數:域名提取時間和日期、數字格式轉換等功能
3、圖算法:社區檢測、PageRank、中心算法等
4、空間函數:地理編碼、位置計算、空間與時間搜索等
5、數據集成:JSON、JDBC、csv等格式數據加載
6、圖形重構:節點合并、屬性規范化與分類等
7、虛擬節點/關系:提供虛擬圖的創建
8、Cypher操作:單個和多個Cypher語句運行和腳本運行
9、觸發器:與關系型數據庫的觸發器的理解方式一樣
......
七、JDBC
APOC數據集成-JDBC(Java Databases connect)
apoc.load.jdbc:可以訪問提供JDBC驅動程序的數據庫,并執行查詢。其將結果變成以一行數據為單位的數據流,然后可以使用這些行來更新或者創建圖形數據結構
APOC JDBC語法:
call
apoc.load.jdbc("jdbc:mysql://{IP}:{PORT}/{DBNAME}?user={USERNAME}&password={PASSWORD}","{TABLENAME}") yield row
以行的方式讀取數據表
create
(b:Black{number:row.black_id,type:row.type})
?
?
?
總結
以上是生活随笔為你收集整理的知识图谱学习笔记-知识图谱介绍的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 风控特征学习笔记
- 下一篇: 知识图谱学习笔记-Cypher语句使用