课程 |《知识图谱》第一期
課程詳情
?
課程名稱:?
?
《知識圖譜》第一期?
報名方式:
?
點擊文末“閱讀原文”,即可享受參團優惠報名哦!
主講老師:
王昊奮??著名知識圖譜專家
博士畢業于上海交通大學,CCF術語專委會執委,中文信息學會語言與知識計算委員會副秘書長,共發表75余篇高水平論文。中文知識圖譜zhishi.me創始人,OpenKG聯盟發起人之一,其帶隊構建的語義搜索系統在Billion Triple Challenge中榮獲全球第2名;在著名的本體匹配競賽OAEI的實體匹配任務中斬獲得全球第1名。曾主持并參與多項國家自然科學基金、863重大專項和國家科技支撐項目,以學術負責人身份參與Paypal、Google、Intel、IBM、百度等企業的合作項目。
?
課程簡介:
本次的知識圖譜課程主要包括三大部分:
1. ?知識圖譜的工程方法論。指導學員了解并掌握知識圖譜的基本概念和發展歷史,梳理清知識圖譜的技術體系,掌握知識圖譜的核心技術原理,建立知識圖譜工程的方法論思維。
2. ? 知識圖譜的實戰技術。從實戰出發,圍繞知識表示、知識抽取、語義搜索、知識問答、知識推理、知識融合等系統性介紹知識圖譜相關的實戰技術,使得學員具備研發知識圖譜相關應用的基礎能力。
3. ?知識圖譜的典型應用。結合醫療、金融、電商等實際應用場景,介紹知識圖譜各個技術點的實際應用落地方式,使得學員具備結合自身背景開展知識圖譜技術實踐的應用能力。
面向人群:
1. ?希望學習知識圖譜的學生;
2. ?希望了解知識圖譜實戰技術的IT從業人員;
3. ?未來希望成為知識圖譜工程師的求職者;
4. ?想在知識圖譜方向進行深入研究者。
學習收益:
通過本課程的學習,學員將會收獲:
1. 幫助學員系統性的掌握知識圖譜的核心技術原理,結合近期研究成果,學習從基本概念到各個先進算法和技術的轉化思路2. 了解國內外典型的開源知識庫數據及技術資源
3. 實踐與理論結合,培養學員面對工程及學術問題的思考解決能力
4. 基于百科知識進行各項核心技術的實例訓練,并結合醫療、金融、電商等行業應用幫助學員快速積累知識圖譜工程項目經驗
5. 對有志于從事知識問答工作或學術研究的學員,提供IBM Watson系統實現原理的講解與指導
? ? ?
開課時間:
?
2017年10月24日
?
學習方式:
??
在線直播,共11次課,每次2小時
每周2次(周二、四,20:00 - 22:00)
直播后提供錄制回放視頻,可在線反復觀看,有效期1年
課程大綱:
???????
第一課: ?知識圖譜概論????????????
?
? ? 1. ?知識圖譜的起源和歷史
? ? 2. ?典型知識庫項目簡介
? ? 3. ?知識圖譜應用簡介
? ? 4. ?本次課程覆蓋的主要范圍:知識表示與建模、知識抽取與挖掘、知識存儲、知識融合、知識推理、語義搜索、知識問答和行業知識圖譜應用剖析等內容。
?
第二課: ?知識表示與知識建模?????????
?
? ? 1. ?早期知識表示簡介
? ? 2. ?基于語義網的知識表示框架
? ? ? ? ?a. ?RDF和RDFS
? ? ? ? ?b. ?OWL和OWL2 Fragments
? ? ? ? ?c. ?SPARQL查詢語言
? ? ? ? ?d. ?Json-LD、RDFa、HTML5 MicroData等新型知識表示
? ? 3. ? 典型知識庫項目的知識表示
? ? 4. ? 基于本體工具(Protege)的知識建模最佳實踐
?
第三課: ?知識抽取與挖掘I
?
? ? 1. ?知識抽取任務定義和相關比賽:實體識別、關系抽取和事件抽取
? ? 2. ?面向結構化數據(關系數據庫)的知識抽取,包括D2RQ和R2RML等轉換與映射規范與技術介紹
? ? 3. ?面向半結構化數據(Web tables, 百科站點等)的知識抽取
? ? ? ? ?a. ?基于正則表達式的方法
? ? ? ? ?b. ?Bootstrapping和Wrapper Induction介紹
? ? 4. ?實踐展示:基于百科數據的知識抽取
?????
第四課: ?知識抽取與挖掘II
?
? ? 1. ?面向非結構化數據(文本)的知識抽取
? ? ? ? ?a. ?基于本體的知識抽取,包括NELL和DeepDive系統介紹
? ? ? ? ?b. ?開放知識抽取,包括TextRunner、Reverb和OLLIE等系統介紹
? ? 2. ?知識挖掘
? ? ? ? ?a. ?知識內容挖掘:實體消歧與鏈接
? ? ? ? ?b. ?知識結構挖掘:關聯規則挖掘與社區發現
? ? ? ? ?c. ?知識表示學習與鏈接預測,包括TransE和PRA等算法介紹????
?
第五課: ?知識存儲
?
? ? 1. ?基于關系數據庫的存儲設計,包括各種表設計和索引建立策略
? ? 2. ?基于RDF的圖數據庫介紹
? ? ? ? ?a. ?開源數據庫介紹:Apache Jena、Sesame、gStore、RDF-3X等
? ? ? ? ?b. ?商業數據庫介紹:Virtuoso、AllegroGraph、BlazeGraph等
? ? 3. ? 原生圖數據庫介紹,包括Neo4j、OrientDB、Titan和Cayley等
? ? 4. ?實踐展示:使用Apache Jena存儲百科知識,并使用Fuseki構建圖譜查詢服務
?
第六課: ?知識融合
?
? ? 1. ?知識融合任務定義和相關競賽:本體對齊和實體匹配
? ? 2. ?本體對齊基本流程和常用方法
? ? ? ? ?a. ?基于Linguistic的匹配
? ? ? ? ?b. ?基于圖結構的匹配
? ? ? ? ?c. ?基于外部知識庫的匹配
? ? 3. ?實體匹配基本流程和常用方法
? ? ? ? ?a. ?基于分塊的多階段匹配
? ? ? ? ?b. ?基于規則(配置或通過學習)的實體匹配
? ? 4. ?知識融合工具介紹:包括Falcon-AO、Silk、PARIS、DEDUPE、LIMES和KnowledgeVault
? ? 5. ?實踐展示:使用Falcon-AO融合百度百科與維基百科中的知識
?
第七課: ?知識推理
?
? ? 1. ?本體知識推理簡介與任務分類,包括概念可滿足性、概念包含、實例分類和一致性檢測等
? ? 2. ?本體推理方法與工具介紹
? ? ? ? ?a. ?基于Tableaux運算的方法:Fact++、Racer、Pellet和Hermit等
? ? ? ? ?b. ?基于一階查詢重寫的方法:Ontology-based Data Access的Ontop等
? ? ? ? ?c. ?基于產生式規則的方法(如Rete):Jena、Sesame和OWLIM等
? ? ? ? ?d. ?基于邏輯編程(如Datalog)改寫的方法:KAON2和RDFox等
? ? ?3. ?實踐展示:使用Jena完成百科知識上的上下位推理、缺失類別補全和一致性檢測等
?
第八課: ?語義搜索
?
? ?1. ?語義搜索概述,包括Knowledge Card、Rich Snippet、Facebook Graph Search等
? ?2. ?基于語義標注的網頁搜索
? ? ? ? ?a. ?Web Data Commons項目介紹
? ? ? ? ?b. ?排序算法介紹,擴展BM25
? ?3. ?基于圖譜的知識搜索
? ? ? ? ?a. ?本體搜索(ontology lookup)
? ? ? ? ?b. ?探索式知識檢索,包括查詢構造、結果排序和分面(facets)推薦
? ?4. ?知識可視化,包括本體、查詢、結果等的展現方式和可視化分析
? ?5. ?實踐展示:使用ElasticSearch實現百科數據的語義搜索
?
第九課: 知識問答I
?
? ? 1. ?知識問答概述和相關數據集(QALD和WebQuestions)
? ? 2. ?知識問答基本流程
? ? 3. ?知識問答主流方法介紹
? ? ? ? ?a. ?基于模板的方法,包括模板定義、模板生成和模板匹配等步驟
? ? ? ? ?b. ?基于語義解析的方法,包括資源映射,邏輯表達式候選生成與排序等
? ? ? ? ?c. ?基于深度學習的方法
?
第十課: ?知識問答II
?
? ? 1. ?IBM Watson問答系統及核心組件詳細解讀
? ? ? ? ?a. ?問句理解
? ? ? ? ?b. ?候選答案生成
? ? ? ? ?c. ?基于證據的答案排序
? ? 2. ?實踐展示:面向百科知識的問答baseline實現
?
第十一課: ?行業知識圖譜應用
?
? ? 1. ?行業知識圖譜特點
? ? 2. ?行業知識圖譜應用,包括金融、醫療、數字圖書館等領域應用
? ? 3. ?行業知識圖譜構建與應用的挑戰
? ? 4. ?行業知識圖譜生命周期定義和關鍵組件
?
?
常見問題:
??
Q: 會有實際上機演示和動手操作嗎?
A:?有,幾乎每節課,老師均會準備上機演示部分,學員可以學習老師的實踐經驗。
Q: 參加本門課程有什么要求?
A:?有一定Python編程能力,有基本大學數學基礎。
Q: 有課外學習資料嗎?
A:?有,老師會根據情況提供講義,并給出進階學習資源與項目的建議。
Q: 本課程怎么答疑?
A:?推薦大家到小象問答社區(wenda.chinahadoop.cn)提問,方便知識的沉淀,老師會集中回答,不會因為QQ群信息刷屏而被老師錯過。也會有專門的QQ班級群,同學們可以針對課上知識的問題,或者自己學習與動手實踐中的問題,向老師提問,老師會進行相應解答。
?
Q:在哪里上課?
A:課程直播和回放都在小象學院官網(http://www.chinahadoop.cn)上進行,不需要其他直播軟件;如果希望上下班路上觀看,可以下載小象學院app進行緩存。
?
聯系方式:
?
手機:17746593070
郵件:admin@chinahadoop.cn
網站:http://www.chinahadoop.cn
客服微信:17746593070
OpenKG.CN
中文開放知識圖譜(簡稱OpenKG.CN)旨在促進中文知識圖譜數據的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。
點擊“閱讀原文”,即可享受參團優惠報名哦!
總結
以上是生活随笔為你收集整理的课程 |《知识图谱》第一期的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 快手 算法工程师 0825 笔试题
- 下一篇: 随机森林RF、XGBoost、GBDT和