论文浅尝 | EARL: Joint Entity and Relation Linking for QA over KG
Mohnish Dubey, Debayan Banerjee, Debanjan Chaudhuri, Jens Lehmann: EARL: Joint Entity and Relation Linking for Question Answering over Knowledge Graphs. International Semantic Web Conference (1) 2018: 108-126
鏈接:https://link.springer.com/content/pdf/10.1007%2F978-3-030-00671-6_7.pdf
研究背景
面向知識庫的語義問答是指將用戶的自然語言問句轉換為可以在知識庫上執行的形式化查詢并獲取答案,其面臨的挑戰主要有以下幾點:1)實體的識別和鏈接;2)關系的識別和鏈接;3)查詢意圖識別;4)形式化查詢生成。其中實體鏈接和關系鏈接是指將自然語言問句中的詞匯(或短語)鏈接到知識庫中對應的實體或關系。大多數現有問答系統依次或并行執行實體鏈接和關系鏈接步驟,而本工作將這兩個步驟合并,提出了1)基于廣義旅行商問題的 以及 2)基于連接密度相關特征進行機器學習的 兩種聯合鏈接方法。下表展示了不同種類的鏈接方法的優缺點。
框架及方法
上圖展示了本文提出的聯合的實體關系鏈接框架(EARL,Entity and Relation Linking),主要包括如下兩個步驟:
1)? 預處理步驟(左側紅框內),包括如下三個子過程:
利用SENNA系統從輸入的自然語言問句中抽取出若干關鍵詞短語。對于圖中輸入的問句,這里抽取到的關鍵詞短語是<founder,Tesla, SpaceX, born>。
對于每個關鍵詞,使用基于字符嵌入(character embedding)的LSTM網絡判斷它是知識庫中的關系還是實體。對于上個過程中的關鍵詞短語,這一步將“founder”和“born”識別為關系, 將“Tesla”和“SpaceX”識別為實體。
為每個關鍵詞短語生成候選實體或關系列表。對于問句中的實體名,利用預先收集的URI-label詞典,以及Wikidata中的實體別名、sameas關系等進行生成。對于關系詞,利用Oxford Dictionary API和fastText擴展知識庫上的關系名后進行關聯。
2)? 聯合消歧步驟(右側黃框內),主要包括本文提出的兩個核心方法:
基于廣義旅行商問題(GTSP)的消歧方法。如下圖所示,該方法將每個關鍵詞的候選URI放入同一個簇。邊的權重被設置為兩個URI在知識庫上的距離(hop數),而聯合消歧過程被建模為在該圖上尋找一條遍歷每個簇的邊權總和最小的路(頭尾結點可以不同)。對于GTSP問題的求解,本工作先將其轉換為TSP問題,后使用Lin-Kernighan-Helsgaun近似算法進行求解。圖中加粗的邊表示該示例的求解結果。
????b. 基于連接密度相關特征進行機器學習的消歧方法。對于每個關鍵詞的所有候選URI,分別抽取特征 R_i (候選列表中的排序位置), C (2步以內可達的其他關鍵詞的候選URI的數量),H (到其他關鍵詞的候選URI的平均步數)三個特征,采用xgboost分類器篩選最合適的候選。
下表總結了上述兩個消歧方法的差異:
????c. 額外的,本文提出了一種自適應實體/屬性預測方法。如果消歧后某個實體/關系和它最終鏈接到的URI的置信度低于閾值,則可能預處理步驟的第二個子過程(實體/關系預測)有錯誤。在這種情況下,該工作會更改該關鍵詞的實體/關系標簽,重新執行候選生成和消歧步驟,從而獲得整體精度的提升。
實驗
本文選用了LC-QuAD問答數據集進行實驗,包含5000個問句。其標準答案(實體/關系對應的URI)采用人工標注的方法進行生成,可以在https:// figshare.com/projects/EARL/28218下載。除此以外本文還選用了現有的QALD-7問句集(https://project-hobbit.eu/challenges/qald2017/)進行測試。
實驗結果如下表所示,和對比方法相比,EARL在MRR值上有較大提升。
實體鏈接結果:
關系鏈接結果:
論文筆記整理:丁基偉,南京大學博士生,研究方向為知識圖譜、知識庫問答。
OpenKG.CN
中文開放知識圖譜(簡稱OpenKG.CN)旨在促進中文知識圖譜數據的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。
轉載須知:轉載需注明來源“OpenKG.CN”、作者及原文鏈接。如需修改標題,請注明原標題。
?
點擊閱讀原文,進入 OpenKG 博客。
總結
以上是生活随笔為你收集整理的论文浅尝 | EARL: Joint Entity and Relation Linking for QA over KG的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 论文浅尝 - WSDM20 | 基于弱监
- 下一篇: 论文浅尝 - EMNLP | 通过元强化