日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 >

Cognitive Inference:认知推理下的常识知识库资源、常识推理测试评估与中文实践项目索引

發(fā)布時間:2024/7/5 51 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Cognitive Inference:认知推理下的常识知识库资源、常识推理测试评估与中文实践项目索引 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

CognitiveInference

Cognitive Inference,認知推理、常識知識庫、常識推理與常識推理評估的系統(tǒng)項目,以現(xiàn)有國內(nèi)外已有的常識知識庫為研究對象,從常識知識庫資源建設(shè)和常識推理測試評估兩個方面出發(fā)進行整理,并結(jié)合自己近幾年來在邏輯性推理知識庫的構(gòu)建、應(yīng)用以及理論思考進行介紹。具體包括已有常識知識庫項目資源介紹、邏輯推理類知識庫的項目實踐集合、常識推理測試評估項目集合。

項目地址 :https://github.com/liuhuanyong/CognitiveInference/

項目介紹

常識推理是人工智能的高級階段,基于已有知識,運用知識推理機技術(shù),完成限定領(lǐng)域決策行為,能夠在充分減少人為勞動的同時,產(chǎn)生經(jīng)濟效益。例如,基于已知知識進行知識推理,采用如事件驅(qū)動傳導(dǎo)路徑等進行知識發(fā)現(xiàn),能夠輔助于業(yè)務(wù)的推理和輔助決策,在智能投研進行未知風(fēng)險預(yù)警、在輿情分析中對公司進行輿論控制和監(jiān)控。
“邏輯知識庫”+"邏輯推理機"的混合協(xié)作模式,是目前實現(xiàn)以上目的的重要方式。
"邏輯知識庫"作為描述現(xiàn)實社會事件之間傳導(dǎo)關(guān)聯(lián)的庫,需要在規(guī)模、質(zhì)量,領(lǐng)域針對性三個方面入手進行解決。具體地,作者通過對自己所涉及的推理項目進行系統(tǒng)回顧,認為,推理類常識知識庫,應(yīng)該從縱向和橫向兩個維度出發(fā)進行構(gòu)建。

一、縱向常識邏輯

縱項常識邏輯需要考慮的是類人的抽象和概括能力,這個需要抽象、概念性、上下位知識的構(gòu)建,可以讓機器模仿人類的舉一反三和概括總結(jié)的技能。例如,作者對縱向常識邏輯,形成了以下工作:
1、上下位關(guān)系圖譜項目:HyponymyExtraction.

上下位這種語義關(guān)系是整個詞匯語義關(guān)系中的一個重要內(nèi)容,通過上下位關(guān)系,可以將世間萬物進行組織和練聯(lián)系起來,對于增進人們對某一實體或概念的認知上具有重要幫助,自然語言文本中存儲著大量的上下位關(guān)系知識,如經(jīng)過語言專家編輯整理形成的概念語義詞典,如同義詞詞林,中文主題概念詞典,hownet等,也存在開放百科知識平臺當(dāng)中,有效地利用這些信息,能夠支持多項應(yīng)用基于知識概念體系,百科知識庫,以及在線搜索結(jié)構(gòu)化方式的詞語上下位抽取。項目實現(xiàn)為用戶輸入一個需要了解的詞語,后臺通過查詢既定知識庫,從百科知識庫,在線非結(jié)構(gòu)化文本中進行抽取,形成關(guān)于該詞語的上下位詞語網(wǎng)絡(luò),并以圖譜這一清晰明了的方式展示出來。

2、電商商品概念與銷售知識圖譜項目:GoodsKG.

項目以京東電商為實驗數(shù)據(jù)來源,采集京東商品目錄樹,并獲取其對應(yīng)的底層商品概念信息,組織形成商品知識圖譜。目前,該圖譜包括有概念的上下位is a關(guān)系以及商品品牌與商品之間的銷售sale關(guān)系共兩類關(guān)系,涉及商品概念數(shù)目1300+,商品品牌數(shù)目約10萬+,屬性數(shù)目幾千種,關(guān)系數(shù)目65萬規(guī)模。該項目可以進一步增強商品領(lǐng)域概念體系的應(yīng)用,對自然語言處理處理的幾個下游應(yīng)用帶來幫助,如商品品牌識別,商品對象及屬性級別情感分析,商品評價短語庫構(gòu)建,商品品牌競爭關(guān)系梳理等提供基礎(chǔ)性的概念服務(wù)。

3、抽象知識圖譜項目:AbstractKnowledgeGraph.

項目提出了一個抽象知識圖譜的項目,目的是對知識抽象與泛化提供一個思路并初步實踐,介紹了抽象知識圖譜,對抽象圖譜的現(xiàn)實需求進行論述。介紹了中文抽象圖譜的相關(guān)工作。包括 CN-Probase,Hownet,大詞林,百度百科Schema等,并給出了之前關(guān)聯(lián)的項目地址。本項目提出了一個可用的抽象知識圖譜構(gòu)建路線,提出抽象知識圖譜的實施路線并給出抽象接口實踐。建成抽象知識圖譜,目前規(guī)模50萬,支持名詞性實體、狀態(tài)性描述、事件性動作進行抽象,可完成抽象知識,包括抽象實體,抽象動作,抽象事件。基于該知識圖譜,可以進行不同層級的實體抽象和動作抽象,這與人類真實高度概括的認知是保持一致。

二、橫向常識邏輯

橫向上,需要挖掘順承、因果、反轉(zhuǎn)等多個方向的邏輯演化關(guān)系。例如,作者對橫向常識邏輯,形成了以下工作:

4、順承事件圖譜項目:SequentialEventExtration.

以謂詞性短語作為事件表示的方法方興未艾,針對特定領(lǐng)域,構(gòu)建起特定領(lǐng)域的順承事件圖譜,可以支持事件推理,基于事件的意圖識別與推薦等多項運用。本項目基于50W文章領(lǐng)域語料,運用簡單提取方式形成的順承關(guān)系圖譜demo,形成了事件節(jié)點為326781個, 順承事件對為543580條,分別為30W和50W的圖譜規(guī)模。

5、因果事件圖譜項目:CausalityEventExtraction.

項目以構(gòu)造和總結(jié)因果模板,結(jié)合中文語言特點,構(gòu)建因果語言知識庫的方式,對因果事件抽取以及因果知識圖譜構(gòu)建進行嘗試。羅列出了9類顯式因果邏輯抽取模式,通過使用因果連詞庫,結(jié)果詞庫、因果模式庫等,完成因果抽取、對文本進行噪聲移除,非關(guān)鍵信息去除等進行文本預(yù)處理;基于因果模式庫,完成因果對抽取,選擇短語、短句、句子主干等方式進行事件表示;使用知識圖譜中的實體對齊技術(shù)進行事件融合,基于業(yè)務(wù)需求,可以用相應(yīng)的數(shù)據(jù)庫進行存儲,比如圖數(shù)據(jù)庫等完成事件存儲。

6、復(fù)合事件圖譜項目:ComplexEventExtraction.

項目對中文復(fù)合事件抽取,包括條件事件、因果事件、順承事件、反轉(zhuǎn)事件等事件事件圖譜的類型、表現(xiàn)形式進行了歸納,并結(jié)合復(fù)合事件模式與語料進行了實驗。實驗表明,反轉(zhuǎn)事件,其實在某種程度上可以用來構(gòu)造反義詞詞典,例如"不是A而是B"這種模式,可以得到很多反義的詞或短語,可以用wordvector找相近詞,可以靠這種方式收集反義詞。漢語顯示標(biāo)記其實在中文文本當(dāng)中還是用的很普遍,在1000W文本中,有超過半數(shù)的文本中包含以上模式。能夠把顯示事件圖譜做好,感覺用處還是很多的。

三、常識邏輯推理

"邏輯推理機"是支配邏輯知識庫的重要運算機器,通過對現(xiàn)有邏輯知識庫,通過推理規(guī)則傳導(dǎo)、知識關(guān)聯(lián)路徑匹配,完成對現(xiàn)有邏輯知識庫的游走,最終實現(xiàn)單跳或多跳等后續(xù)事件的推理和預(yù)測,在這個方面,需要使用owl本體推理機、圖數(shù)據(jù)庫匹配、圖數(shù)據(jù)庫路徑查找、推理規(guī)則配置、圖結(jié)構(gòu)預(yù)測等多種不同形式。與此同時,與邏輯推理關(guān)聯(lián)的推理能力評估,也是檢驗常識推理智能的必要手段。例如,作者對常識邏輯推理,形成了一下工作:

7、基于問答社區(qū)的邏輯知識問答項目:ZhidaoChatbot.

本項目完成了一個基于線上問答社區(qū)的常識邏輯性問答機器人接口demo,本項目的問答機器人接口可以滿足原因邏輯,結(jié)果邏輯,可以回答為什么,有了會怎么樣等問題,也可以推薦相似性的問題,可以作為基于邏輯事理知識的一種補充,問答機器人接口可以作為開源實體性問答機器人的邏輯性問答補充,也可以為邏輯性知識庫的構(gòu)建提供幫助。

8、基于事理圖譜的未來事件預(yù)測項目:EventPredictBasedOnEG.

基于海量數(shù)據(jù)進行因果挖掘,可以得到大量的因果知識,基于因果邏輯庫,即歷史因果,通過計算當(dāng)前事件與歷史事件的相似性,可以在定性的方式上做出一些方向性的預(yù)測,方向上包括兩種,一種是積極信號,另一種是消極信號,項目介紹了一個基于因果圖譜的既定事件未來預(yù)測的接口預(yù)測demo。

9、學(xué)跡事理實時知識庫終身學(xué)習(xí)項目:EventKGNELL.

事理圖譜版Magi,EventKGNELL, eventuality knowlege graph never end learning system,一個7*24小時不斷學(xué)習(xí)的實時事理學(xué)習(xí)與搜索平臺,力圖緊跟實時網(wǎng)絡(luò)信息,面向公眾提供以“事件”為核心的實時結(jié)構(gòu)化知識搜索服務(wù)的實時事理邏輯知識庫終身學(xué)習(xí)和事件為核心的知識庫搜索項目,項目實現(xiàn)了包括事件概念抽取、事件因果邏輯抽取、事件數(shù)據(jù)關(guān)聯(lián)推薦與推理,

開放常識知識庫與常識推理評測項目

本項目對現(xiàn)有國內(nèi)外已有的常識知識庫為研究對象,從常識知識庫資源建設(shè)和常識推理測試評估兩個方面出發(fā)進行整理,形成已有常識知識庫資源集合、常識推理評測項目集合兩個組成部分。

一、已有常識知識庫資源集合

大類小類名稱地址
語言學(xué)知識庫語言標(biāo)注語料庫Penn Treebank點擊查看
語言學(xué)知識庫語言標(biāo)注語料庫The Penn Discourse Tree- bank (PDTB)點擊查看
語言學(xué)知識庫語言標(biāo)注語料庫The Abstract Meaning Representation (AMR) corpus點擊查看
語言學(xué)知識庫詞匯知識庫WordNet點擊查看
語言學(xué)知識庫詞匯知識庫VerbNet點擊查看
語言學(xué)知識庫詞匯知識庫VerbOcean點擊查看
語言學(xué)知識庫詞匯知識庫VerbCorner點擊查看
語言學(xué)知識庫框架語義知識庫FrameNet點擊查看
語言學(xué)知識庫框架語義知識庫PropBank點擊查看
語言學(xué)知識庫預(yù)訓(xùn)練語義向量GloVe點擊查看
語言學(xué)知識庫預(yù)訓(xùn)練語義向量FastText點擊查看
語言學(xué)知識庫預(yù)訓(xùn)練語義向量wordpiece embeddings點擊查看
常識庫常識庫YAGO點擊查看
常識庫常識庫DBpedia點擊查看
常識庫常識庫WikiTaxonomy點擊查看
常識庫常識庫Freebase點擊查看
常識庫常識庫NELL點擊查看
常識庫常識庫Probase點擊查看
常識庫常識庫Wikidata點擊查看
常識知識庫常識知識庫Cyc點擊查看
常識知識庫常識知識庫ConceptNet點擊查看
常識知識庫常識知識庫SenticNet點擊查看
常識知識庫常識知識庫Isanette and IsaCore點擊查看
常識知識庫常識知識庫COGBASE點擊查看
常識知識庫常識知識庫WebChild.點擊查看
常識知識庫常識知識庫LocatedNear點擊查看
常識知識庫常識知識庫ATOMIC點擊查看
常識知識庫常識知識庫ASER點擊查看
常識知識庫常識知識庫學(xué)跡實時事理系統(tǒng)點擊查看

二、常識推理評測項目資源

大類名稱作者規(guī)模網(wǎng)址
Reference ResolutionWinograd Schema ChallengeMorgenstern et al., 201660點擊查看
Reference ResolutionWinoGrandeSakaguchi et al., 201944.0K點擊查看
Question AnsweringMCTest.Richardson et al., 20132.00K點擊查看
Question AnsweringRACE.Lai et al., 201797.7K點擊查看
Question AnsweringNarrativeQA.Kocˇisky et al., 201846.8K點擊查看
Question AnsweringARCClark et al., 20187.79K點擊查看
Question AnsweringMCScriptOstermann et al., 201813.9K點擊查看
Question AnsweringProParaMishra et al., 2018488點擊查看
Question AnsweringMultiRC.Khashabi et al., 20189.87K點擊查看
Question AnsweringARCTHabernal et al., 20182.45K點擊查看
Question AnsweringSQuAD.Rajpurkar et al., 2018151K點擊查看
Question AnsweringCoQA.Reddy et al., 20188.40K點擊查看
Question AnsweringQuAC.Choi et al., 201898.4K點擊查看
Question AnsweringOpenBookQA.Mihaylov et al., 20185.96K點擊查看
Question AnsweringCommonsenseQATalmor et al., 20199.40K點擊查看
Question AnsweringDREAM.Sun et al., 201910.2K點擊查看
Question AnsweringDROP.Dua et al., 201996.6K點擊查看
Question AnsweringCosmos QA.Huang et al., 201935.6K點擊查看
Question AnsweringMC-TACO.Zhou et al., 20191.89K點擊查看
Textual EnatailmentRTE Challenges.Bentivogli et al., 201148.8K點擊查看
Textual EnatailmentConversational Entailment.Zhang & Chai, 2009875點擊查看
Textual EnatailmentSICK.Marelli et al., 2014a9.84K點擊查看
Textual EnatailmentSNLI.Bowman et al., 2015570K點擊查看
Textual EnatailmentSciTail.Khot et al., 201827.0K點擊查看
Textual EnatailmentSherLIiC.Schmitt & Schütze, 20193.99K點擊查看
Plausible InferenceCOPA.Roemmele et al., 20111.00K點擊查看
Plausible InferenceCBT.Hill et al., 2015687K點擊查看
Plausible InferenceROCStories.Mostafazadeh et al., 201698.2K點擊查看
Plausible InferenceLAMBADA.Paperno et al., 201610.0K點擊查看
Plausible InferenceJOCI.hang et al., 201739.1K點擊查看
Plausible InferenceCLOTH.Xie et al., 201799.4K點擊查看
Plausible InferenceSWAG.Zellers et al., 2018114K點擊查看
Plausible InferenceReCoRD.Zhang et al., 2018121K點擊查看
Plausible InferenceHellaSWAG.Zellers et al., 2019a70.0K點擊查看
Plausible InferenceAlphaNLI.Bhagavatula et al., 2019171K點擊查看
Intuitive PsychologyTriangle-COPA.Gordon, 2016100點擊查看
Intuitive PsychologyStory Commonsense.Rashkin et al., 2018a161k點擊查看
Intuitive PsychologyEvent2Mind.Rashkin et al., 2018b57.1K點擊查看
Intuitive PsychologySocialIQA.Sap et al., 2019b44.8K點擊查看
Multple TasksbAbI.Weston et al., 201640.0K點擊查看
Multple TasksInference is Everything.--點擊查看
Multple TasksGLUE.--點擊查看
Multple TasksDNC.Poliak et al., 2018a570K點擊查看
Multple TasksSuperGLUE.--點擊查看

關(guān)于作者

劉煥勇, Liu Huanyong,2017年碩士畢業(yè),目前就職于中國科學(xué)院軟件研究所,兼任數(shù)據(jù)地平線科技算法總監(jiān)。專注金融、情報兩大領(lǐng)域,從事事件抽取、事件演化、情感分析、事理(知識)圖譜、常識推理、語言資源構(gòu)建與應(yīng)用等研發(fā)工作。主持研發(fā)自然語言處理技術(shù)開放平臺數(shù)地工場、大規(guī)模實時事理知識學(xué)習(xí)系統(tǒng)學(xué)跡、全行業(yè)因果鏈查詢與溯源項目尋鏈系統(tǒng),并在智能金融、智能情報落地中負責(zé)實施了多個項目。致力于面向中文處理的基礎(chǔ)知識庫建設(shè)與理論技術(shù)開源共享,目前累計對外開放自然語言處理實踐項目六十余項,其中知識圖譜和事理圖譜項目十六項。在openkg開放知識圖譜聯(lián)盟中開放工業(yè)應(yīng)用知識庫七類,主筆數(shù)地工場技術(shù)類系列文章二十余篇。

如有自然語言處理、知識圖譜、事理圖譜、社會計算、語言資源建設(shè)等問題或合作,可聯(lián)系我:
1、我的自然語言處理開源項目:https://liuhuanyong.github.io
2、我的csdn技術(shù)博客:https://blog.csdn.net/lhy2014
3、我的聯(lián)系方式: 劉煥勇,中國科學(xué)院軟件研究所,lhy_in_blcu@126.com.
4、我的共享知識庫項目:劉煥勇,事理類知識庫數(shù)據(jù)集,http://www.openkg.cn/organization/datahorizon.
5、我的工業(yè)項目:劉煥勇,以事理為核心的金融情報探索:https://datahorizon.cn.

項目地址:https://github.com/liuhuanyong/CognitiveInference/

總結(jié)

以上是生活随笔為你收集整理的Cognitive Inference:认知推理下的常识知识库资源、常识推理测试评估与中文实践项目索引的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。