王海勛被引用量最高的論文是 2003 年在 KDD 會議上發(fā)表的“Mining concept-drifting data streams using ensemble classifiers”。這篇論文提出了一個使用加權(quán)集合分類器挖掘概念漂移數(shù)據(jù)流的一般框架,經(jīng)過實驗證實該篇論文中所提出的方法在預(yù)測精度方面具有優(yōu)于單分類器方法的顯著優(yōu)勢,并且集合框架對于各種分類模型是有效的。
唐杰的高引用論文是 2008 年在 KDD 會議上發(fā)表的“ArnetMiner: extraction and mining of academic social networks”對其負(fù)責(zé)的知識工程實驗室 ArnetMiner 系統(tǒng)關(guān)鍵問題進行討論,整合來自在線 Web 數(shù)據(jù)庫的出版物并提出一個概率框架來處理名稱歧義問題,除此之外,該篇論文還描述了系統(tǒng)的體系結(jié)構(gòu)和專家畫像的主要特征,提出系統(tǒng)應(yīng)用方法的實證評估。
Ralph Grishman 的高引用論文“A maximum entropy approach to named entity recognition”介紹了一種新的統(tǒng)計命名實體(即“專有名稱”)識別系統(tǒng),稱為“MENE”。命名實體(NE)識別是一種信息提取形式,將文檔中的每個單詞分類為人名、組織、位置、日期、時間、貨幣價值、百分比或“以上都不是”。對互聯(lián)網(wǎng)搜索引擎、機器翻譯、文檔的自動索引以及作為更復(fù)雜的工作的基礎(chǔ)具有特別重要的意義。
周國棟高引用論文是 2002 年在 ACL 上發(fā)表的“Named entity recognition using an HMM-based chunk tagger”提出了一種隱馬爾科夫模型和一種基于該模型的模塊標(biāo)記器,從中建立了一個命名實體識別系統(tǒng)用于識別并分類名稱、時間與數(shù)量。
Renée J. Miller 的代表性論文是 2003 年在 ICDT 上發(fā)表的“Data Exchange: Semantics and Query Answering”給出了一個代數(shù)規(guī)范,這種規(guī)范代表了可能解決方案的整個空間從而使其在數(shù)據(jù)交換問題的所有解決方案中能夠選擇通用的特殊解決方案作為問題的解決方法。
Felix Naumann 的高引用論文是 2005 年在 ICDE 上發(fā)表的“Schema Matching Using Duplicates”展示了利用數(shù)據(jù)集中重復(fù)項的存在來自動識別匹配的屬性,論文中介紹的算法能夠通過比較重復(fù)記錄中的數(shù)據(jù)識別相應(yīng)的屬性,經(jīng)過驗證已經(jīng)證實了該方法的有效性。
Roberto Navigli 2013年在ACM上發(fā)表的論文的高引論文“BabelNet: The automatic construction,evaluation and application of a wide-coverage multilingual semantic network”,提出了構(gòu)建BabelNet的自動方法,一個覆蓋廣泛的大型多語言語義網(wǎng)絡(luò)。
Diego Calvanese 的高引用論文是 2007 年發(fā)表的“Tractable Reasoning and Efficient Query Answering in Description Logics: The DL-Lite Family”提出了一個新的專門用于捕捉本體語言同時保持低推理復(fù)雜度的描述邏輯系列 DL-Lite。
S?ren Auer2007 年發(fā)表于 ISWC 的“DBpedia: a nucleus for a web of open data”和 2009年發(fā)表的“DBpedia - A crystallization point for the Web of Data”介紹了 DBpedia 的工作原理。
孫茂松的高引論文是 2018 年發(fā)表于 AAAI 的“Neural Knowledge Acquisition via Mutual Attention Between Knowledge Graph and Text”,提出了一個關(guān)于知識獲取的通用聯(lián)合表示框架,用于知識圖完成(KGC)和文本關(guān)系提取(RE)這兩個任務(wù)。