评测通知 | 2022年全国知识图谱与语义计算大会评测任务发布
一、任務(wù)簡介
CCKS技術(shù)評測旨在為研究人員提供測試知識圖譜與語義計算技術(shù)、算法、及系統(tǒng)的平臺和資源,促進(jìn)國內(nèi)知識圖譜領(lǐng)域的技術(shù)發(fā)展,以及學(xué)術(shù)成果與產(chǎn)業(yè)需求的融合和對接。去年,CCKS 2021評測競賽環(huán)節(jié)共設(shè)立了5個主題共計14個任務(wù),涵蓋了金融、醫(yī)療、軍事、生物、地理、保險、生活服務(wù)等各個領(lǐng)域,吸引了超過1萬多支參賽隊(duì)伍,在工業(yè)界和學(xué)術(shù)界形成較高影響力。
今年,經(jīng)過評測任務(wù)征集和評測組委會篩選,CCKS2022共設(shè)立五個評測主題,共15個評測任務(wù),任務(wù)列表如下。CCKS2022組委會為每個任務(wù)前三名頒發(fā)證書,其他獎勵參見不同任務(wù)的評測任務(wù)書。最后,組委會將從所有隊(duì)伍中特別評選10個“創(chuàng)新技術(shù)獎”,每支隊(duì)伍獎勵5000元,用于鼓勵創(chuàng)新性技術(shù)的使用。專委會還將協(xié)同Data Intelligence期刊編輯部組織“評測論文主題專刊”,優(yōu)秀評測論文將推薦至該專刊免費(fèi)發(fā)表,同時優(yōu)秀評測論文也將推薦收錄進(jìn)入主會論文集,并有機(jī)會推薦至相應(yīng)期刊發(fā)表。以下為各項(xiàng)任務(wù)簡介,詳細(xì)的評測任務(wù)書請訪問大會官方網(wǎng)站評測版塊獲取。
主題一:信息抽取
任務(wù)一:千言通用信息抽取競賽評測
任務(wù)描述:信息抽取旨在將非結(jié)構(gòu)化文本中的信息進(jìn)行結(jié)構(gòu)化,是自然語言處理的基礎(chǔ)技術(shù)和重要研究領(lǐng)域。傳統(tǒng)的信息抽取任務(wù)與評測通常針對特定的文本領(lǐng)域和單一的抽取任務(wù),難以評估相關(guān)技術(shù)與方法在通用場景和任務(wù)下的抽取性能。
為此,中國科學(xué)院軟件研究所、百度公司與千言開源數(shù)據(jù)集項(xiàng)目聯(lián)合發(fā)起業(yè)界首個通用信息抽取評測——“CCKS-千言通用信息抽取競賽”。本賽事是千言多形態(tài)信息抽取的全新升級,不局限于傳統(tǒng)的單任務(wù)信息抽取的評測范式,而是將多種不同的信息抽取任務(wù)用統(tǒng)一的通用框架進(jìn)行描述,著重考察相關(guān)技術(shù)方法在面對新的、未知的信息抽取任務(wù)與范式時的適應(yīng)與遷移能力,從而滿足當(dāng)下信息抽取領(lǐng)域快速迭代、快速遷移的實(shí)際需求,更貼近實(shí)際業(yè)務(wù)應(yīng)用。
評測地址:https://aistudio.baidu.com/aistudio/competition/detail/161/0/introduction
評測獎勵:
一等獎30000元
二等獎20000元
三等獎10000元
創(chuàng)新獎5000元,共設(shè)立兩個
任務(wù)組織者:
韓先培 (中科院軟件所)
林鴻宇 (中科院軟件所)
陸垚杰 (中科院軟件所)
肖欣延 (百度)
戴岱 ??(百度)
任務(wù)聯(lián)系人:
姓名 陸垚杰yaojie2017@iscas.ac.cn
任務(wù)二:多語言命名實(shí)體識別
任務(wù)描述:命名實(shí)體識別(Named Entity Recognition,簡稱NER),又稱作“專名識別”,是指識別文本中具有特定意義的實(shí)體,主要包括人名、地名、機(jī)構(gòu)名、專有名詞等。NER是信息提取、問答系統(tǒng)、句法分析、機(jī)器翻譯、面向Semantic Web的元數(shù)據(jù)標(biāo)注等應(yīng)用領(lǐng)域的重要基礎(chǔ)工具,在自然語言處理技術(shù)走向?qū)嵱没倪^程中占有重要的地位。然而在實(shí)際多語言環(huán)境的應(yīng)用中,通常只有中文或者英文的標(biāo)注訓(xùn)練語料,如何將模型遷移到一些資源較少語言的命名實(shí)體識別。例如日本,阿語或者韓文。
針對這些難點(diǎn),騰訊海外技術(shù)發(fā)行團(tuán)隊(duì)聯(lián)合CCKS 2022大會舉辦此次地址評測任務(wù)-多語言命名實(shí)體識別。
評測獎勵:
第一名10000元
第二名5000元
第三名2500元
技術(shù)創(chuàng)新獎2500,同時排名前三隊(duì)伍將獲授精美參賽獎牌、證書。
任務(wù)組織者:
劉文強(qiáng) ??(騰訊) masonqliu@tencent.com
蔣益巧 ??(騰訊) gennyjiang@tencent.com
吳蓓 ????(騰訊) bellab@tencent.com
黃東曉 ??(騰訊) donxhuang@tencent.com
郭豪 ????(騰訊) stevehguo@tencent.com
任務(wù)三:基于知識圖譜的優(yōu)質(zhì)文章識別
任務(wù)描述:在移動互聯(lián)網(wǎng)、大數(shù)據(jù)的時代背景下,各類自媒體文章呈爆發(fā)式增長,在搜索和推薦等信息分發(fā)場景下,甄別出優(yōu)質(zhì)文章并分發(fā)給用戶具有重要的研究意義和實(shí)際應(yīng)用價值。除了文章本身的寫作質(zhì)量以外,優(yōu)質(zhì)文章應(yīng)該具備內(nèi)容的深度和新穎性等,因此單純依賴文章本身內(nèi)容無法完整識別優(yōu)質(zhì)文章。本任務(wù)將引入文章相關(guān)的外部知識圖譜,結(jié)合文章內(nèi)在的知識邏輯,在對文章更深入的語義理解基礎(chǔ)上實(shí)現(xiàn)優(yōu)質(zhì)文章識別。
本任務(wù)要求參賽者利用文章的知識圖譜進(jìn)行建模,實(shí)現(xiàn)優(yōu)質(zhì)文章分類。
評測獎勵:
第一名:人民幣10000元
第二名:人民幣3000元
第三名:人民幣2000元
技術(shù)創(chuàng)新獎:人民幣5000元
備注:技術(shù)創(chuàng)新獎和前三名可以兼得
任務(wù)組織者:
曹自強(qiáng) (蘇州大學(xué))
王德瑞 (百度內(nèi)容策略部)
徐揚(yáng) ??(百度內(nèi)容策略部)
謝文睿 (百度內(nèi)容策略部)
任務(wù)聯(lián)系人:
QQ群:471919965
曹自強(qiáng):zqcao@suda.edu.cn
王德瑞:wangderui@baidu.com
徐揚(yáng):xuyang24@baidu.com
謝文睿:xiewenrui01@baidu.com
主題二:知識圖譜構(gòu)建與問答
任務(wù)四:帶條件的分層級多答案問答
任務(wù)描述:文本問答是語言文本分析的一項(xiàng)重要研究任務(wù)。隨著機(jī)器閱讀理解數(shù)據(jù)集的不斷提出和模型水平的長足進(jìn)步,問答系統(tǒng)得到了學(xué)術(shù)界和產(chǎn)業(yè)界的廣泛關(guān)注。抽取式問答是一種重要的問答任務(wù)形式,其要求模型在相應(yīng)的文本中抽取文本片段(span)作為答案。不同于目前常見的單答案(single-span)抽取任務(wù),在實(shí)際應(yīng)用中,一個問題的答案可能存在于文本的多個位置,被稱為多答案(multi-span)抽取式問答。通過對互聯(lián)網(wǎng)問答社區(qū)的樣本進(jìn)行分析,我們發(fā)現(xiàn)多答案樣本往往伴隨著以下兩個特征:1)由于提問用戶缺乏相關(guān)的領(lǐng)域知識,提出的問題不夠明確,導(dǎo)致需要根據(jù)不同的條件分別回答;2)一個問題的多個答案可能分屬于不同的粒度,并且彼此之間存在著層級關(guān)系。這些都為多答案問答提出了嚴(yán)峻的挑戰(zhàn)。
為此,騰訊和中國科學(xué)院自動化研究所聯(lián)合舉辦“帶條件的分層級多答案問答”評測任務(wù),希望通過本次評測任務(wù)以及發(fā)布的中文數(shù)據(jù)集,提升現(xiàn)有閱讀理解模型的水平,并進(jìn)一步幫助問答系統(tǒng)在真實(shí)場景中得到更有價值的應(yīng)用。
評測獎勵:
第一名:10000元
第二名:3000元
第三名:2000元
任務(wù)組織者:
楊韜 ?(騰訊)
鄭孫聰(騰訊)
王唯康(騰訊)
張元哲(中科院自動化所)
劉康 ?(中科院自動化所)
趙軍 ?(中科院自動化所)
任務(wù)聯(lián)系人:
王唯康(騰訊):daxianwang@tencent.com
張元哲(中科院自動化所):yzzhang@nlpr.ia.ac.cn
任務(wù)五:開放知識圖譜問答
任務(wù)描述:在互聯(lián)網(wǎng)軟硬件相關(guān)技術(shù)飛速發(fā)展的今天,人們每天接觸與制造的數(shù)據(jù)量日益上升,理解與應(yīng)用這些數(shù)據(jù)所需的成本也隨之增加。因此,如何高效而準(zhǔn)確地處理海量異質(zhì)數(shù)據(jù)成為了一個亟待解決的問題。知識圖譜以結(jié)構(gòu)化的“知識”來存儲與表示海量數(shù)據(jù),作為承載底層海量知識并支持上層智能應(yīng)用的重要載體,它在智能時代中扮演了極其重要的角色。
然而,由于知識圖譜高度結(jié)構(gòu)化的特點(diǎn),我們常常需要構(gòu)建結(jié)構(gòu)化查詢語句(SPARQL等)來查找相關(guān)知識,這為普通用戶使用知識圖譜造成了不便。因此,在知識圖譜上進(jìn)行自然語言問答(KBQA)近年來成為了前者的熱門應(yīng)用之一。在學(xué)界,semantic parsing、IR等創(chuàng)新性方法與框架百花齊放;在業(yè)界,智能音箱、語音助手、智能問診等應(yīng)用也極大地拓寬了知識圖譜自然語言問答的應(yīng)用場景,進(jìn)一步加強(qiáng)了對高效、準(zhǔn)確、易用、安全、可解釋的KBQA系統(tǒng)的需求。
面對這一需求,我們提出了開放領(lǐng)域中的中文知識圖譜問答這一評測任務(wù),期待參賽者們可以提出創(chuàng)新性的KBQA系統(tǒng),同時處理“專而深”的特定領(lǐng)域和“廣而淺”的開放領(lǐng)域知識圖譜,對用戶提出的復(fù)雜多樣的自然語言問題給出準(zhǔn)確答案。同時,我們更希望此次評測可以為KBQA的下一步研究和落地提供一些理論及實(shí)踐層面的啟發(fā)。
評測獎勵:
第一名10000元
第二名5000元
第三名2500元
技術(shù)創(chuàng)新獎2500,同時排名前三隊(duì)伍將獲授精美參賽獎牌、證書
任務(wù)組織者:
鄒磊(北京大學(xué)王選計算機(jī)研究所)zoulei@pku.edu.cn
林殷年(北京大學(xué)王選計算機(jī)研究所)linyinnian@pku.edu.cn
張旻昊(北京大學(xué)王選計算機(jī)研究所)zhangminhao@pku.edu.cn
張若禹(北京大學(xué)王選計算機(jī)研究所)ry_zhang@pku.edu.cn
任務(wù)六:跨語言知識圖譜問答評測任務(wù)
任務(wù)描述:隨著近年來越來越多的非英語使用者參與到知識圖譜的建立和維護(hù),在線知識的分布已經(jīng)由富資源語言(英語)一家獨(dú)大轉(zhuǎn)變?yōu)槎嗾Z言資源相互補(bǔ)充。然而,當(dāng)前多語言知識圖譜問答模型主要關(guān)注于自然語言問題解析,而忽略了對跨語言知識的聯(lián)合應(yīng)用。以百科知識問答為例,對于新出現(xiàn)的知識,如“COVID-19 (2019新冠病毒病)”,在Wikipedia中文詞條中,關(guān)于“并發(fā)癥”屬性的記錄包含“全身器官衰竭”,而這項(xiàng)記錄未被收錄于英文詞條關(guān)于“Complication(并發(fā)癥)”的條目中。另一方面,在英文詞條中包含了“Duration(癥狀持續(xù)時間) ”的屬性,而中文詞條卻缺乏對這項(xiàng)屬性的收集。因此,諸如:“能夠引起全身器官衰竭這一并發(fā)癥的冠狀病毒,它使人體產(chǎn)生的癥狀一般會持續(xù)多長時間?”,“癥狀一般持續(xù)五天以上,且可能轉(zhuǎn)為慢性的冠狀病毒,是否可能引發(fā)全身器官衰竭這類嚴(yán)重并發(fā)癥?”,對于這類需要聯(lián)合跨語言知識的問題,目前的問答系統(tǒng)難以回答。此次評測任務(wù)的目標(biāo)是利用跨語言知識圖譜回答不同語言提出的問題,我們期望參賽選手的問答系統(tǒng)既能夠解決自然語言問題與知識圖譜間的詞法鴻溝問題, 又能在跨語言知識圖譜中準(zhǔn)確找到問題相關(guān)的知識組合。
評測獎勵:
第一名:冠軍證書
第二名:亞軍證書
第三名:季軍證書
本次任務(wù)將會選出一支隊(duì)伍參與CCKS評測任務(wù)創(chuàng)新獎評選(創(chuàng)新獎金5000元)
任務(wù)組織者:
漆桂林 (東南大學(xué)) gqi@seu.edu.cn
譚亦鳴 (東南大學(xué)) tt_yymm@seu.edu.cn
胡楠 ??(東南大學(xué)) nanhu@seu.edu.cn
李嘉琦 (東南大學(xué)) 494296118@qq.com
任務(wù)聯(lián)系人:
譚亦鳴:tt_yymm@seu.edu.cn
任務(wù)七:教科書示意圖問答
任務(wù)描述:示意圖是一種高度抽象的知識表達(dá)載體,常由矩形、圓形等幾何形狀和箭頭、折線等邏輯符號組成,廣泛被應(yīng)用于教科書、百科、知識博客等教育場景。在上述場景中,學(xué)習(xí)者常通過視覺問答的形式來判斷對知識點(diǎn)的掌握情況,即:給定學(xué)習(xí)者一張示意圖,根據(jù)視覺信息來回答與該知識點(diǎn)相關(guān)的自然語言問題,我們將其定義為教科書示意圖問答任務(wù)。該任務(wù)可能涉及視覺對象的檢測與對齊、知識術(shù)語的理解以及知識表示的動態(tài)變化等復(fù)雜推理過程,良好的完成該任務(wù)是未來跨媒體智能、智慧教育等應(yīng)用的重要基礎(chǔ),也有助于提升計算機(jī)對人類認(rèn)知行為和學(xué)習(xí)習(xí)慣的理解。該任務(wù)主要有兩個挑戰(zhàn):一是示意圖資源稀缺,標(biāo)注代價高昂,具有天然的小樣本場景,在不具備大型語料庫的場景下完成該任務(wù)是一個難題;二是示意圖表達(dá)抽象、特征稀疏,簡單的幾何形狀蘊(yùn)含有豐富、專業(yè)的語義信息,如何較好地提取并理解其視覺特征是一個難題。本次測評任務(wù)的示意圖來源于計算機(jī)科學(xué)領(lǐng)域,希望選手能針對上述兩個難點(diǎn),深入理解示意圖中的關(guān)鍵信息,構(gòu)建模型實(shí)現(xiàn)準(zhǔn)確的示意圖問答表現(xiàn)。
評測獎勵:
一等獎(1名):人民幣5000元
二等獎(2名):人民幣2500元
三等獎(2名):人民幣1000元
技術(shù)創(chuàng)新獎(1名):人民幣3000元
任務(wù)組織者:
張玲玲 (西安交通大學(xué))
劉均 ??(西安交通大學(xué))
武亞強(qiáng) (聯(lián)想)
魏筆凡 (西安交通大學(xué))
王紹偉 (西安交通大學(xué))
任務(wù)聯(lián)系人:
王紹偉:wang97@stu.xjtu.edu.cn
任務(wù)八:化學(xué)元素知識圖譜構(gòu)建及應(yīng)用
任務(wù)描述:隨著AI技術(shù)的發(fā)展和普及,藥物研發(fā)也逐漸進(jìn)入到AI時代,擅長處理大數(shù)據(jù)的AI深度學(xué)習(xí)技術(shù),就成為近年來大家關(guān)注的焦點(diǎn)。化合物的性質(zhì)預(yù)測的主要目的在于及時發(fā)現(xiàn)理化性質(zhì)不達(dá)標(biāo)的化合物,以降低候選化合物進(jìn)入臨床實(shí)驗(yàn)失敗的風(fēng)險,提升藥物研發(fā)的成功率。傳統(tǒng)的化合物性質(zhì)預(yù)測分析一般采取實(shí)驗(yàn)方式,成本高昂且耗時長。很多的研究工作都證明了機(jī)器學(xué)習(xí)技術(shù),特別是深度學(xué)習(xí)在化合物性質(zhì)預(yù)測方面的巨大潛力,這些工作使用序列(SMILES表達(dá)式)或是圖(原子為節(jié)點(diǎn),化學(xué)鍵為邊)來表示化合物,用序列建模或者圖神經(jīng)網(wǎng)絡(luò)(GNN)去預(yù)測化合物的屬性,以輔助進(jìn)行藥物研發(fā),提升效率,降低成本。但是,這些方法往往只考慮了化合物分子的結(jié)構(gòu)信息,而忽略了其中蘊(yùn)含的化學(xué)領(lǐng)域知識。因此我們以化學(xué)元素周期表為核心構(gòu)建了化學(xué)元素知識圖譜,并于此針對知識圖譜構(gòu)建的關(guān)鍵技術(shù)及其核心應(yīng)用提出評測任務(wù)。
本任務(wù)圍繞化學(xué)元素知識圖譜的構(gòu)建及化合物屬性預(yù)測所展開。評測從化合物SMILES表示和初始的簡單知識圖譜開始,根據(jù)需要構(gòu)建和擴(kuò)充化學(xué)元素知識圖譜,并基于該知識圖譜進(jìn)行化合物屬性預(yù)測。評測本身不限制各參賽隊(duì)伍使用的模型、算法和技術(shù),但設(shè)計模型過程中必須使用該化學(xué)元素知識圖譜。可以利用各種外部知識庫擴(kuò)充該化學(xué)元素知識圖譜(例如引入官能團(tuán)知識、wikipedia中的文本、圖像信息等),可以利用各種序列/圖算法模型、預(yù)訓(xùn)練手段等處理化合物分子,并進(jìn)行化合物屬性預(yù)測,共同促進(jìn)知識圖譜技術(shù)的發(fā)展。
評測獎勵:
第一名:人民幣5000元
第二名:人民幣3000元
第三名:人民幣2000元
創(chuàng)新獎:人民幣5000元
備注:同時排名前三的隊(duì)伍將獲授精美參賽獎牌、證書。
任務(wù)組織者:
張建 (浙江大學(xué)) kg_tek@163.com (聯(lián)系人)
方尹 (浙江大學(xué)) fangyin@zju.edu.cn (聯(lián)系人)
張強(qiáng) (浙江大學(xué)) qiang.zhang.cs@zju.edu.cn
主題三:商務(wù)金融知識圖譜
任務(wù)九:面向金融領(lǐng)域的Zero-Shot事件抽取
任務(wù)描述:事件抽取是語言文本分析和金融領(lǐng)域智能應(yīng)用的重要任務(wù)之一。事件抽取需要判斷事件的類型和事件的不同要素,實(shí)際抽取任務(wù)中為了充分覆蓋每個事件類型和事件要素需要標(biāo)注大量的樣本,然而事件類型和要素標(biāo)注本身也是一個比較費(fèi)時費(fèi)力的工作。但是考慮到不同的事件類型可能具有相近的語義,或者相同的要素類型,比如“公交停運(yùn)事件”和“地鐵停運(yùn)事件”本身語義相似,且共有事件要素“列車編號”、“停運(yùn)路線”、“停運(yùn)開始時間”、“停運(yùn)結(jié)束時間”。所以我們希望在只提供部分事件標(biāo)注樣本的情況下,抽取所有的事件。本次評測任務(wù)的文本語料來自于互聯(lián)上的公開新聞、報告,旨在通過部分標(biāo)注事件對未標(biāo)注或者欠標(biāo)注的事件進(jìn)行預(yù)測。
評測獎勵:
第一名:人民幣12000元
第二名:人民幣8000元
第三名:人民幣5000元
創(chuàng)新獎:人民幣5000元
備注:優(yōu)勝者有機(jī)會進(jìn)入2023螞蟻集團(tuán)校園招聘終面或者實(shí)習(xí)生綠色通道。
任務(wù)組織者:
王太峰 (螞蟻集團(tuán))
張可尊 (螞蟻集團(tuán))
陳玉博 (中科院自動化所)
楊航 ??(中科院自動化所)
劉康 ??(中科院自動化所)
趙軍 ??(中科院自動化所)
任務(wù)聯(lián)系人:
張可尊:kezun.zkz@antgroup.com
陳玉博:yubo.chen@nlpr.ia.ac.cn
任務(wù)十:面向數(shù)字商務(wù)的知識圖譜評測
任務(wù)描述:阿里巴巴商品數(shù)據(jù)規(guī)模龐大,商品知識圖譜為海量異構(gòu)的商品數(shù)據(jù)的組織、管理和利用提供了有效的方式。商品數(shù)據(jù)模態(tài)豐富,動態(tài)性高,數(shù)據(jù)存在噪聲,這些都對商品的認(rèn)知和理解帶來了巨大挑戰(zhàn)。2022年1月 ,阿里巴巴聯(lián)合浙江大學(xué)等單位發(fā)布首個數(shù)字商業(yè)開放知識圖譜AliOpenKG: http://kg.alibaba.com。以該開放圖譜數(shù)據(jù)集為基礎(chǔ),在CCKS2022大會組織本次評測任務(wù)。首批評測包括三個子任務(wù):商品常識知識顯著性推理、基于知識圖譜的商品同款挖掘、多模態(tài)商品知識圖譜鏈接預(yù)測,三個評測任務(wù)具體內(nèi)容在下面章節(jié)介紹。本次評測將依托阿里巴巴天池平臺(https://tianchi.aliyun.com/)展開,并將持續(xù)維護(hù)和新增更多的評測任務(wù),請有意向的參賽隊(duì)伍請關(guān)注平臺上的競賽列表。
評測地址:
子任務(wù)1:
https://tianchi.aliyun.com/competition/entrance/531955/information
子任務(wù)2:
https://tianchi.aliyun.com/competition/entrance/531956/information
子任務(wù)3:
https://tianchi.aliyun.com/competition/entrance/531957/information
評測獎勵:
本次評測總獎金池是93000元,每個子任務(wù)的獎金是31000元,獎金設(shè)置如下:
第一名:人民幣10000元,1名
第二名:人民幣6000元,2名
第三名:人民幣3000元,3名
備注:比賽優(yōu)勝者同時有機(jī)會進(jìn)入阿里巴巴校園招聘的優(yōu)招通道。
任務(wù)組織者:
陳輝???(阿里巴巴)
黎洲波?(浙江大學(xué))
姚云志?(浙江大學(xué))
王成名?(阿里巴巴)
包友軍?(阿里巴巴)
王狄烽?(阿里巴巴)
屈垠岑?(阿里巴巴)
陳漠沙?(阿里巴巴)
許澤眾?(浙江大學(xué))
耿玉霞?(浙江大學(xué))
張文???(浙江大學(xué))
任務(wù)聯(lián)系人:
釘釘群:34165350
王成名:aliopenkg@service.alibaba.com
屈垠岑:aliopenkg@service.alibaba.com
陳輝: ?aliopenkg@service.alibaba.com
黎洲波:zhoubo.li@zju.edu.cn?
任務(wù)十一:面向金融領(lǐng)域的因果事件要素抽取及事件相似度計算
任務(wù)描述:金融領(lǐng)域知識圖譜和事件圖譜可以支持智能投顧、風(fēng)險管控等眾多業(yè)務(wù)場景,而事件抽取及事件對齊是知識圖譜、事件圖譜構(gòu)建的重要環(huán)節(jié)。
本任務(wù)旨在從海量財經(jīng)新聞中抽取因果事件并補(bǔ)齊相關(guān)事件要素,并將相同的事件聚合到一起。具體分為兩個子任務(wù):(1)子任務(wù)一為因果事件要素的抽取,該子任務(wù)目標(biāo)是繼因果關(guān)系抽取后,從因果事件所在篇章抽取原因事件要素和結(jié)果事件要素;(2)子任務(wù)二為事件相似度計算,旨在根據(jù)事件描述和事件要素評估事件相似度,并將相同事件進(jìn)行合并。
評測獎勵:
本次任務(wù)總獎金5萬元,每個子任務(wù)2.5萬元,具體分配如下:
第一名(1支隊(duì)伍):人民幣15000元
第二名(1支隊(duì)伍):人民幣5000元
第三名(2支隊(duì)伍):人民幣2500元
任務(wù)組織者:
邊雯皓(NEC中國研究院)
馮璐??(NEC中國研究院)
丁效??(哈爾濱工業(yè)大學(xué))
高靖龍(哈爾濱工業(yè)大學(xué))
任務(wù)聯(lián)系人:
邊雯皓:bian_wenhao@nec.cn
高靖龍:jlgao@ir.hit.edu.cn
任務(wù)十二:金融NL2SQL評測任務(wù)
任務(wù)描述:隨著金融機(jī)構(gòu)數(shù)智化轉(zhuǎn)型,企業(yè)內(nèi)部數(shù)據(jù)正急劇增長。一方面,這些數(shù)據(jù)作為金融機(jī)構(gòu)核心資產(chǎn),能大大提高企業(yè)的運(yùn)作效率;另一方面,數(shù)據(jù)也正在成為幸福的煩惱,在金融領(lǐng)域,投研人員、投資經(jīng)理、運(yùn)營人員和投資者都苦于如何快速精準(zhǔn)地查找需要的數(shù)據(jù)。傳統(tǒng)匹配方法在覆蓋度、準(zhǔn)確性、可遷移性等方面難以滿足需求。
自然語言轉(zhuǎn)SQL(NL2SQL)方法設(shè)想自動將自然語言問句轉(zhuǎn)化為SQL查詢,從而實(shí)現(xiàn)精準(zhǔn)數(shù)據(jù)問答。現(xiàn)有NL2SQL數(shù)據(jù)和方法主要關(guān)注“封閉場景指定庫/表”設(shè)定,這很難滿足業(yè)務(wù)范圍動態(tài)發(fā)展的需求。從領(lǐng)域特性來看,金融數(shù)據(jù)多為時間序列,包括日頻行情、季頻財報、年度GDP、不定期股票質(zhì)押解質(zhì)押等,這種復(fù)雜性無疑會增大問題轉(zhuǎn)SQL難度。考慮到垂直領(lǐng)域知識可能有助于構(gòu)建可遷移系統(tǒng),我們將開放金融股票、基金、宏觀等場景結(jié)構(gòu)化表格及相關(guān)知識,希望和社區(qū)共同努力推動垂直領(lǐng)域下NL2SQL技術(shù)發(fā)展。
評測獎勵:
恒生提供30000元獎金,獎勵評測結(jié)果優(yōu)異的團(tuán)隊(duì),具體設(shè)置如下:
第一名:15000元
第二名:10000元
第三名:5000元
創(chuàng)新獎:5000元 (沒有名次限制,由學(xué)會提供)
任務(wù)組織者:
林金曙:linjs13607@hundsun.com
婁東方:loudf24454@hundsun.com
張少杰:zhangsj41876@hundsun.com
主題四:軍事知識圖譜
任務(wù)十三:開源多模態(tài)軍事裝備數(shù)據(jù)的事件要素抽取
任務(wù)描述:在“信息爆炸”的時代,不同來源的裝備數(shù)據(jù)呈顯著增長趨勢,尤其是互聯(lián)網(wǎng)公開來源的文本、圖像等多模態(tài)內(nèi)容的蓬勃增長,使得裝備數(shù)據(jù)已逐漸成為裝備需求論證中重要的資源和依據(jù)。然而,相關(guān)論證人員在面對這些海量的裝備數(shù)據(jù)時,卻無法高效地從中獲取關(guān)鍵知識,從而也無法依據(jù)數(shù)據(jù)指導(dǎo)裝備論證工作。通過調(diào)研分析發(fā)現(xiàn),導(dǎo)致裝備數(shù)據(jù)中價值信息沒有充分利用的首要問題是,這些數(shù)據(jù)缺乏有效的組織結(jié)構(gòu)與直觀形象的使用方式,沒有形成相應(yīng)的裝備知識體系,難以進(jìn)行深層次的數(shù)據(jù)分析與面向典型論證場景的應(yīng)用。
為此,我們組織本次評測任務(wù),探索如何從互聯(lián)網(wǎng)公開的多模態(tài)軍事裝備數(shù)據(jù)中抽取相關(guān)事件類型及事件要素,為裝備需求論證提供更具條理性的信息,讓用戶盡可能地發(fā)現(xiàn)適用于裝備需求論證的知識及其運(yùn)用模式。
評測獎勵:
第一名:8000元
第二名:4000元
第三名:3000元
技術(shù)創(chuàng)新獎:5000元
備注:最多有一個隊(duì)伍獲得技術(shù)創(chuàng)新獎,技術(shù)創(chuàng)新獎和前三名可以兼得
任務(wù)組織者:
韓君妹(復(fù)雜系統(tǒng)仿真總體重點(diǎn)實(shí)驗(yàn)室)
姜 ?巍(中國電子科技集團(tuán)公司信息科學(xué)研究院)
任務(wù)聯(lián)系人:
李乃鵬:lnp0906@163.com
王 ?歌:wzggtang@163.com
任務(wù)十四:外軍無人系統(tǒng)知識圖譜構(gòu)建評測任務(wù)
任務(wù)描述: 無人系統(tǒng)已成為現(xiàn)代軍事力量的重要組成,在各類軍事行動中發(fā)揮著日趨重要的作用。軍事垂直領(lǐng)域知識圖譜的構(gòu)建,受到數(shù)據(jù)、領(lǐng)域知識、構(gòu)建技術(shù)三方面因素影響。當(dāng)前,外軍無人系統(tǒng)公開數(shù)據(jù)普遍缺乏權(quán)威性和精準(zhǔn)性,導(dǎo)致構(gòu)建的圖譜“難以保障嚴(yán)肅分析任務(wù)、難以服務(wù)實(shí)際業(yè)務(wù)系統(tǒng)、難以嵌入各類應(yīng)用框架”。本次評測任務(wù),組織方著重提供權(quán)威、精準(zhǔn)數(shù)據(jù)以及部分領(lǐng)域知識,數(shù)據(jù)覆蓋陸、海、空、天、潛等各類型無人系統(tǒng),包含背景、技術(shù)、性能、基礎(chǔ)、作戰(zhàn)等信息,支持參賽隊(duì)專注于圖譜構(gòu)建實(shí)踐工作,進(jìn)而促進(jìn)技術(shù)交流進(jìn)步、遴選合作團(tuán)隊(duì),推動軍事垂直領(lǐng)域知識圖譜落地見效。
評測獎勵:
任務(wù)共提供3.5萬元獎金給獲獎團(tuán)隊(duì),獎勵4支隊(duì)伍
第一名:12,000元
第二名:10,000元
第三名: 8,000元
創(chuàng)新獎: 5,000元
任務(wù)組織者:
張 靜?(軍事科學(xué)院系統(tǒng)工程研究院)
任務(wù)聯(lián)系人:
欒瑞鵬:lrp_ph@163.com
主題五:知識存儲
任務(wù)十五:基于圖數(shù)據(jù)庫的自定義圖分析算法評測
任務(wù)描述:知識圖譜本質(zhì)是基于圖的語義網(wǎng)絡(luò),而圖數(shù)據(jù)庫又是以圖模式存儲管理數(shù)據(jù),因此圖數(shù)據(jù)庫用于存儲知識圖譜數(shù)據(jù)具有得天獨(dú)厚的優(yōu)勢。
通過在知識圖譜上進(jìn)行查詢、分析、推理是實(shí)現(xiàn)知識圖譜應(yīng)用的關(guān)鍵核心技術(shù),而反映到圖數(shù)據(jù)庫上則是基于圖數(shù)據(jù)庫上的圖查詢與圖分析。BFS和DFS是圖數(shù)據(jù)庫最核心的算法之一,基于此之上,眾多學(xué)者針對不同需求設(shè)計了衍一系列的圖查詢與圖分析算法,如PageRank、三角形計數(shù)、環(huán)路檢測等,且設(shè)計了不同變種算法。但遺憾的是,傳統(tǒng)的圖數(shù)據(jù)庫查詢語言并不完全內(nèi)置了這些算法,如SPARQL,Gremlin等。
因此,通過本次測評將這些圖查詢和圖分析經(jīng)典算法進(jìn)行實(shí)現(xiàn)并在圖數(shù)據(jù)庫中進(jìn)行驗(yàn)證,對于檢驗(yàn)算法有效性和實(shí)用性具有重要意義。
評測獎勵:
第一名: ?10000
第二名: ?5000
第三名: ?2500
技術(shù)創(chuàng)新獎2500,同時排名前三隊(duì)伍將獲授精美參賽獎牌、證書。
任務(wù)組織者:
鄒 磊 ???(北京大學(xué)王選計算機(jī)研究所)?????zoulei@pku.edu.cn
李文杰 ??(北京大學(xué)重慶大數(shù)據(jù)研究院)?????liwenjiehn@pku.edu.cn
王 劍 ???(北京大學(xué)重慶大數(shù)據(jù)研究院)?????jian.wang@cqbdri.pku.edu.cn
OpenKG
OpenKG(中文開放知識圖譜)旨在推動以中文為核心的知識圖譜數(shù)據(jù)的開放、互聯(lián)及眾包,并促進(jìn)知識圖譜算法、工具及平臺的開源開放。
點(diǎn)擊閱讀原文,進(jìn)入 OpenKG 網(wǎng)站。
總結(jié)
以上是生活随笔為你收集整理的评测通知 | 2022年全国知识图谱与语义计算大会评测任务发布的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 论文浅尝 | 使用循环神经网络的联合事件
- 下一篇: 论文小综 | Pre-training