當前位置：首頁 >

虚拟专题：知识图谱 | 知识图谱多跳问答推理研究进展、挑战与展望

發布時間：2025/3/15 54 豆豆

生活随笔收集整理的這篇文章主要介紹了虚拟专题：知识图谱 | 知识图谱多跳问答推理研究进展、挑战与展望小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

來源：《大數據》

知識圖譜多跳問答推理研究進展、挑戰與展望

杜會芳¹,?王昊奮¹,?史英慧²,?王萌³

1?同濟大學設計創意學院

2?東南大學網絡空間與安全學院

3?東南大學計算機科學與工程學院

?摘要：近年來，知識圖譜問答在醫療、金融、政務等領域被廣泛應用。用戶不再滿足于關于實體屬性的單跳問答，而是更多地傾向表達復雜的多跳問答需求。為了應對上述復雜多跳問答，各種不同類型的推理方法被陸續提出。系統地介紹了基于嵌入、路徑、邏輯的多跳知識問答推理的最新研究進展以及相關數據集和評測指標，并重點圍繞前沿問題進行了討論。最后總結了現有方法的不足，并展望了未來的研究方向。

關鍵詞：?知識圖譜?;?多跳問答?;?推理

論文引用格式：

杜會芳, 王昊奮, 史英慧, 等. 知識圖譜多跳問答推理研究進展、挑戰與展望[J]. 大數據, 2021, 7(3):60-79.

DU H F, WANG H F, SHI Y H, et al. Progress, challenges and research trends of reasoning in multi-hop knowledge graph based question answering[J]. Big Data Research, 2021, 7(3): 60-79.

1 引言

1.1 背景介紹

隨著大數據時代的來臨，幫助用戶在海量信息中快速找到想要的信息尤為重要。知識圖譜（knowledge graph，KG）以三元組的形式結構化存儲海量信息，一個三元組可以表示為<e_h,r,e_t>，其中e_h表示頭實體，e_t表示尾實體，r表示頭實體與尾實體之間存在的關系。知識圖譜三元組之間也存在關聯關系，如上述三元組中的頭實體e_h可能是另外一個三元組的尾實體。知識圖譜把海量互聯網信息表達成客觀世界可認知的語義表示，具有強大的語義表達、存儲和表達能力，在工業界和學術界得到了廣泛關注和研究應用。智能問答系統旨在針對用戶提出的復雜信息需求，允許用戶用自然語言問句的形式提問，并為用戶直接返回精準的答案。得益于知識圖譜技術的快速發展，基于知識圖譜的問答（knowledge graph based question answering，KGQA）技術利用其豐富的結構化語義信息，能夠深入理解用戶的問題，并給出準確的答案，為用戶提供7×24小時的智能問答服務，在醫療、教育、金融等多個領域凸顯出重要的應用價值。

傳統KGQA以實體、屬性等單一具體對象為主，而在實際應用場景中，用戶不再滿足于單跳的知識問答，如在醫療領域中的咨詢問題“常見的治療感冒藥物有哪些?”。用戶更多地傾向表達復雜的多跳問答推理問題，如“請問伴有中耳炎并發癥的感冒能用哪種藥物治療?”。而知識圖譜多跳問答（以下簡稱多跳知識問答）即針對包含多跳關系的問題，在知識圖譜上進行多步推理，繼而推斷得到答案的一項任務。

1.2 多跳知識問答推理分類

相比單跳問答，多跳知識問答需要在包含大量知識的知識圖譜中找到多個有關聯的三元組，并建模多跳長路徑，這是更加具有挑戰性的任務。同時知識圖譜又是不完備的，長路徑中任意一個三元組的不完整都會導致找不到正確的答案，這為多跳知識問答帶來了更大的挑戰。為了解決沒有明顯答案的復雜多跳查詢問題，模型需要基于知識圖譜已有知識進行推理。作為多跳知識問答的關鍵技術支撐，推理為知識圖譜智能問答更快落地實際應用發揮了重要作用。

本文總結多跳知識問答推理的最新研究方法，并將這些方法分為基于嵌入的多跳知識問答推理、基于路徑的多跳知識問答推理和基于邏輯的多跳知識問答推理3類方法。其中，基于嵌入的多跳知識問答推理方法是將知識圖譜元素（如實體、關系等）關聯到低維連續向量空間，然后通過定義得分函數或解碼器對目標查詢對象進行排名來得到答案。而基于路徑的多跳知識問答推理方法首先需要確定問題中的主題實體，然后在知識圖譜上隨機游走找到答案實體，代表性的工作有路徑排序算法（path ranking approach，PRA）。關于基于邏輯的多跳知識問答推理方法，本文將重點介紹以一階邏輯為主的熱點研究方法。圖1所示為基于知識圖譜的多跳問答推理方法分類，接下來綜述這些分類中最新方法的研究進展、基本思路和存在的挑戰等。

圖1???基于知識圖譜的多跳問答推理方法分類

2 基于嵌入的多跳知識問答推理

基于嵌入的多跳知識問答推理方法是將問題和候選答案轉化為公共向量空間中的語義向量表示來進行操作的方法，基于嵌入的具體操作方法可以分為基于語義匹配的方法、基于圖神經網絡的方法和基于記憶網絡的方法。

（1）基于語義匹配的方法

本類方法首先計算問題和候選答案分布式表示之間的語義匹配，然后通過排序候選答案來得到最終答案。Bordes A等人將問題和知識圖譜三元組用嵌入的方式表示來表達特征的語義。然而，與翻譯模型TransE、TransH、TransR等關注嵌入表示的模型類似，這些方法只能回答簡單問題。為了實現多跳問答推理以及應對多跳知識高效建模的挑戰，很多基于語義匹配的方法被提出。Bordes A等人在原來三元組表示方法的基礎上做了改進，通過對知識圖譜中的問答路徑和周圍子圖進行編碼得到語義更加豐富的表示來推理得到答案。Dong L等人提出的多列卷積神經網絡（multi-column convolutional neural network，MCCNN）模型進一步地利用具有更強學習能力的神經網絡模型來學習答案路徑、答案背景信息以及答案類型的分布式表示，并理解問題，在不使用手動特征及詞庫等的條件下，在問答數據集WebQuestions上取得了不錯的結果。其中，答案路徑是答案節點和被詢問實體之間的一組關系；答案上下文指的是連接到答案路徑的單跳實體和關系；答案類型是如人名、日期等的類型。Hao Y C等人認為MC-CNN模型沒有充分并合理地考慮候選答案的相關信息來訓練問題嵌入的表示，提出了CrossAttention機制的神經網絡模型來學習知識圖譜的全局信息，取得了更好的結果。但是以上幾種方法只能完成淺層多跳知識問答推理，對復雜長路徑多跳問題的處理能力依然不足。

Saxena A等人提出的EmbedKGQA模型通過基于知識圖譜嵌入模型進行鏈接預測來緩解多跳問答面臨的數據不完整問題，使其具有可以在復雜長路徑上的多跳推理能力。EmbedKGQA模型使用C omplEx模型將知識圖譜中的實體和關系嵌入復數向量空間，同時采用ComplEx的打分函數φ預測答案。具體而言，對于一個給定的問題q，首先使用RoBERTa模型編碼初始向量，然后通過一個前饋神經網絡將該向量表示投射到復數嵌入向量空間。問題q和其主題實體h以及知識圖譜中的任一實體a可以構成三元組，其嵌入向量分別表示為q、h和a，如果a是q的目標答案實體，則將(h,q,a)視為正樣本，并且使，否則將(h,q,a)視為負樣本，并使，負樣本可通過將正樣本中的答案實體替換為知識圖譜中其他非答案實體來獲得。EmbedKGQA使用大量的正負樣本訓練數據學習問題和實體的嵌入向量表示，在推理階段則在嵌入空間中通過打分函數選擇得分最高的實體作為可能的目標答案。

He G L等人認為多跳知識問答推理算法只接收最終答案的反饋會使學習不穩定或無效，學習推理過程中的監督信號也非常重要，同時也能提升模型的可解釋性。由此，He G L等人提出了一種創新的Teacher-Student模型。TeacherStudent框架最早由Hinton G等人提出，用來做知識蒸餾，其中復雜的Teacher模型的預測被視為“軟標簽”，一個輕量級Student模型被用于訓練擬合軟標簽。后來，一些Teacher-Student框架的研究逐漸被應用到問答任務中來加快模型的推理速度。在He G L等人提出的模型中， Student網絡的目標是找到問題的正確答案，而Teacher網絡試圖學習預測過程中的監督信號，以提高學生網絡的推理能力。Teacher網絡利用了正向和逆向雙向推理產生可靠的中間監督信號來增強中間實體分布表示學習。在3個公開的數據集上證明了該模型的有效性。

基于語義匹配的方法多采用弱監督學習，減少了人工標注的工作量，同時該方法能夠反映出用戶問題和知識圖譜知識的相似語義，為多跳推理問答的實現做了很好的基礎。如何讓基于語義匹配的方法學到更豐富和全面的知識圖譜信息是這種方法的關鍵。另外，增強表示方法的可解釋性也是重要的考慮因素。

（2）基于圖神經網絡的方法

圖卷積神經網絡（graph convolutional network，GCN）通過聚合知識圖譜中每個實體的鄰居實體來傳遞消息。GCN因為其在圖結構上的有效性和可伸縮性而受到廣泛利用，它是多跳推理方法采用的復雜圖神經網絡的基礎，如圖2所示。Schlichtkrull M等人提出關系圖卷積網絡（relational graph convolutional network，R-GCN），最早將圖卷積神經網絡用于知識圖譜鏈接預測的研究任務，通過聚合特定關系來擴展GCN，使其適用于編碼多關系圖來預測多跳問題的答案。R-GCN模型整體是一個encoderdecoder架構，encoder通過圖卷積神經網絡將實體的鄰域信息進行聚合，更新實體的表示；decoder基于更新后的實體表示，采用打分函數來預測邊。然而，該模型缺乏透明度，無法為關系選擇提供可解釋的依據。相比R-GCN，Teru K等人提出的GraIL框架采用一種基于注意力機制的多關系圖神經網絡模型來解決在知識圖譜上進行歸納式關系預測的問題。該注意力機制不僅和兩個相鄰實體以及它們之間的關系有關，也和需要被預測的目標關系有關。最終利用兩個目標實體的表示、子圖的表示以及預測關系的表示進行打分，將最高得分作為預測結果。歸納學習方法GraIL顯式編碼知識圖譜中的規則以及利用的注意力機制增強了模型的可解釋性。

圖2???圖卷積神經網絡

近年來，BERT（bidirectional encoder representations from transformers）、 RoBERTa等預訓練語言模型在智能問答等自然語言處理（natural language processing，NLP）任務中取得了巨大的成功。但是預訓練模型的知識是隱式學習的，無法明確表示出來，因此無法提供可解釋的預測。為了利用預訓練模型學習到的豐富知識，并且結合知識圖譜中的顯式知識提高可解釋性，許多預訓練模型結合知識圖譜的問答模型被提出，Feng Y L等人提出的多跳圖關系網絡（multi-hop graph relation network，MHGRN）模型就是其中一種。MHGRN模型是一種新穎的多跳圖關系網絡模型，它結合了基于路徑的模型，具有可解釋性和基于GNN模型擴展性強的優點，利用圖神經網絡通過在實體之間傳遞消息來編碼結構化信息，同時為了進一步使模型具有顯式建模關系路徑的能力，將圖分解為路徑，并類似Lin B Y等人提出的知識感知型圖神經網絡（knowledge-aware graph network， KagNet）采用長短期記憶（long shortterm memory，LSTM）網絡對限定連接長度的問題實體和答案實體的所有路徑進行編碼，然后通過注意力機制聚合所有路徑嵌入來預測結果。

傳統智能問答解決方法是單獨從知識圖譜或者文本中推斷出答案。文本雖然是非結構化的知識，但是可以提供豐富的上下文信息，將文本與知識圖譜結構化的優勢結合是最新的研究熱點。

GRAFT-Net（graphs of relations among facts and text network）和PullNet（pull network）將外部文本語料庫和知識圖譜結合起來完成多跳問答任務。GRAFT-Net將Wikipedia語料庫中的文檔和知識圖譜中的實體建模作為節點，將實體和文檔的鏈接關系（句子中包含此實體名詞）以及知識圖譜中實體之間存在的關系建模為邊，構建問題子圖，以執行多跳推理。具體而言，GRAFT-Net從問題出發，首先由問題主題實體鏈接一些種子實體，再以種子實體為起點，通過個性化頁面排名（personalized pagerank，PPR）算法從它們的鄰居實體中取出PPR分數最高的幾個實體及相關聯的邊，并將它們都加入問題子圖中。同時從文本語料庫中檢索出5個與問題高度相關的句子，并將可以鏈接到這些句子的實體一并加入問題子圖中。最終問題子圖由句子節點、實體節點以及句子和實體之間的鏈接關系、實體和實體之間的關系構成。GRAFT-Net將實體節點隨機初始化為一個固定長度的向量，然后基于圖卷積神經網絡學習和更新問題子圖中節點的向量表示，最后對問題子圖中的實體節點進行二分類來預測出哪些是答案實體，以完成推理過程。GRAFT-Net使用啟發式算法構建的問題子圖規模過大，并且很多時候可能不包含答案。PullNet同樣基于圖卷積網絡，但不同于GRAFT-Net， PullNet不要求將整個子圖一步構建完成，而是迭代式學習構建的過程。PullNet迭代地構建問題子圖，初始子圖只包括問題及其中的實體，每一次迭代時，首先使用圖卷積網絡計算將子圖中的實體節點加入下一個迭代過程的概率，確定所有輸出概率大于設定閾值的實體，然后對每一個被選擇的實體，從文本語料庫檢索出相關的句子集合，從知識圖譜檢索出相關的三元組集合，將新檢索到的句子、三元組、句子中的實體以及三元組的頭實體和尾實體都視為新的節點，將新節點之間的聯系視為新邊，用新節點和新邊更新問題子圖。子圖構建完成后，PullNet使用與GRAFT-Net相同的方法對節點進行分類，找出最可能的答案實體。

基于圖神經網絡的方法在處理知識圖譜數據時具有更強的表達力，能夠充分考慮問題中主題實體在圖譜中的相關實體和關系信息，但是依然存在實體鄰居信息稀疏時語義表示效果較差的挑戰。另外，隨著實體和關系不斷加入子圖中，計算成本和內存消耗會迅速增加。盡管基于注意力機制的圖神經網絡能夠自適應地學習鄰居的重要性權重，但是依然不能完全解決此類問題。

（3）基于記憶網絡的方法

傳統的循環神經網絡（recurrent neural network，RNN）、LSTM網絡等深度學習模型使用隱藏層狀態作為其記憶模塊，但是這種方法產生的記憶力太短程，無法精確記住被轉化為稠密向量的長路徑知識。Weston J等人提出了一種可讀寫的外部記憶模塊，聯合記憶模塊保存場景信息，以實現長期記憶的目標。該方法中的記憶網絡包括I（input feature map）、G（generalization）、O（output feature map）、R（response）4個組件。I用來將輸入轉化為內部特征向量表示；G用來更新記憶，并插入記憶槽中；O根據新的輸入和當前的記憶狀態輸出特征映射表示；R把組件O的結果轉化為想要的輸出形式，如文本回答。該模型是本文接下來要介紹的復雜記憶網絡多跳知識問答推理方法的基礎，如圖3所示。

圖3???記憶網絡模型框架

基于Weston J等人提出的記憶網絡模型，Miller A等人提出了鍵值記憶網絡（key-value memory network，KVMemNN）模型，通過迭代更新存儲鍵值對（key-value）的記憶槽來完成多跳推理任務。此處的key指三元組中頭實體和關系的組合，value指尾實體。與Weston J等人提出的記憶網絡相比，該模型能夠處理結構復雜的知識圖譜知識。該模型通過以下過程完成一次迭代更新：首先使用向量表示用戶問題和知識圖譜三元組，通過用戶問題檢索知識圖譜得到相關子集，并作為鍵值記憶槽，然后計算每一個key和問題的相關程度評分，根據評分對每個value加權求和，最后用得到的value向量更新問題向量。經過以上N步迭代后，對問題向量進行分類，最終得到多跳問題的答案。KV-MemNN模型結構簡單，通用性強，通過向量的迭代更新來進行隱式推理。然而，復雜問題需要進行多次迭代表示，同時需要對應構造記憶槽，容易造成內存不足以及訓練時間慢等問題。基于KVMemNN模型，Xu K等人提出了一個新的用戶問題表示更新機制，即在更新時不考慮問題中已經定位到的key值。該模型將問題分解為針對記憶的查詢序列，基于上述更新機制，可以增強多跳復雜問題的推理能力。但是上述方法對問題和知識圖譜三元組分開進行編碼，忽略了兩者之間的交互作用。因此，Chen Y等人提出了雙向注意記憶網絡模型，該模型利用注意機制捕捉問題與知識圖譜信息之間的相關性，并利用此相關性增強問題的表征來提高推理答案的能力。

Das R等人在2017年提出采用記憶網絡并基于通用模式在知識圖譜和文本上進行多跳知識問答推理，該框架通過將結構化知識圖譜和非結構化文本在一個公共嵌入空間中對齊，相比單獨使用知識圖譜或文本取得了更好的效果。動態記憶網絡（dynamic memory network，DMN）模型和動態記憶張量網絡（dynamic memory tensor network，DMTN）模型采用動態記憶網絡，允許模型將注意力集中在之前迭代的輸入和結果上，形成情景記憶，然后在一個層次遞歸序列模型中推理得到答案。兩者不同的是，DMN采用門函數實現注意力機制，而DMTN采用的是神經張量網絡，以實現更好的推理效果。

以上記憶網絡模型都取得了不錯的效果，但是模型依然具有“黑盒”特性，可解釋性差。為了使多跳知識問答推理過程更加可信，一些方法在保證模型準確率的同時也嘗試增強模型的可解釋性。Zhou M T等人提出的解釋推理網絡（interpretable reasoning network， IRN）是一種新穎的具有可解釋性的記憶網絡推理模型，它采用可解釋的逐跳推理過程來回答問題。該模型可以動態地決定輸入問題的哪一部分應該在哪一跳進行分析，預測與當前解析結果相對應的關系，并利用預測的關系更新問題表示和推理過程的狀態，然后驅動下一跳推理。該模型可以為推理分析和故障診斷提供可追蹤和可觀察的中間預測，從而允許人工操作來預測最終答案，這個過程提高了模型的透明度和可信賴度。

3 基于路徑的多跳知識問答推理

為了更好地建模多跳知識，基于路徑的方法受到了廣泛關注。知識圖譜中的結構化知識以三元組的形式存在，基于路徑的多跳知識問答推理以用戶問題中的主題實體為源實體，沿著知識圖譜多個三元組的頭實體、關系、尾實體的逐跳路徑進行搜索，找到答案實體或者關系，通常包括3個階段：處理輸入問題、對知識圖譜進行推理、預測答案。以下將基于路徑的多跳知識問答推理方法分為基于強化學習的方法、基于查詢圖的方法。

（1）基于強化學習的方法

路徑排序算法（path-ranking algorithm，PRA）是一種有效的大規模知識圖譜推理路徑學習方法。基于路徑排序算法的多跳知識問答推理方法的主要思想是利用實體之間的復雜路徑特征來學習隨機游走器，進而推斷出答案。

與PRA基于隨機游走的路徑查找模型不同，Xiong W H等人提出的DeepPath是一種創新的可控多跳推理方法。該方法將路徑搜索轉化為強化學習過程，該過程允許通過控制所找到的路徑的屬性來減小搜索空間。模型如圖4所示，該強化學習方法包括兩部分：第一部分是被建模為馬爾可夫決策過程的外部環境，指定智能體和知識圖譜之間的動態交互；第二部分是策略網絡智能體，將狀態向量映射到隨機策略中。在每一步中，通過與環境的交互，智能體學習選擇一個關系鏈接來擴展推理路徑。為了更好地指導強化學習智能體學習到目標關系路徑，與之前的研究相比，該方法更多地考慮了獎勵的設置，在準確性、多樣性和精確度3個方面采用獎勵機制，監督每一跳的行動，具體方式如下。

圖4???DeepPath模型

環境設置中，強化學習智能體的決策數量包括正確決策的數量以及錯誤決策的數量，總體數量很大。其中，錯誤決策序列的數量會隨著路徑的長度呈指數增長。鑒于此挑戰，DeepPath模型添加的第一個獎勵函數定義如下：

相比長路徑，短路徑通常能提供更多可靠的推理證據。短路徑鏈條通過限制智能體與環境交互的長度，提升推理的效率。因此，DeepPath定義高效獎勵如下：

其中，p為一個序列關系，如。

知識圖譜中存在很多語義相似的實體，這導致智能體有可能尋找到具有相似語法和語義的路徑，這些路徑通常包含冗余信息。為了鼓勵智能體找到多樣化的路徑，DeepPath使用當前路徑和已有路徑之間的余弦相似度定義一個多樣化獎勵函數：

其中，表示的嵌入向量，F表示已經存在的關系路徑個數。

Meilicke C等人提出的AnyBRUL （reinforced anytime bottom up rule learning）方法同樣利用強化學習對路徑進行采樣，基于采樣路徑構造基本規則，并將其推廣為抽象規則。DeepPath和AnyBRUL都要求首先對頭實體和尾實體之間的所有路徑進行取樣，然后利用它們來評估尾實體是否為正確的答案，因此，它無法應對找不到尾實體的情況。與DeepPath和AnyBRUL需要預先計算路徑的方式不同，有些方法通過給定的頭實體和查詢關系利用訓練模型來獲得正確的答案實體。在這些模型中，Das R等人在2018年提出的MINERVA（meandering in networks of entities to reach verisimilar answer）是一個代表性模型。與DeepPath不同的是，MINERVA的狀態由查詢關系和部分路徑的嵌入組成，在抽樣過程中不需要嵌入答案實體。

強化學習模型通常采用一個0/1的硬獎勵來監督抽樣過程，指示抽樣實體是否為正確的答案實體。Lin X V等人提出的RS（reward shaping）在最后一步采用基于正確答案實體和采樣實體之間的軟獎勵，而不是使用0/1的硬獎勵。此外，受dropout技術的啟發，RS模型在訓練過程中為了避免選擇大量的重復路徑，緩解過擬合，采用了dropout技術。Shen Y L等人提出的M-Walk引入了一種基于值的強化學習方法，并使用蒙特卡洛樹搜索來克服稀疏正獎勵的挑戰。Chen W H等人提出的DIVA將推理任務當作一個由尋找路徑和答案推理組成的統一模型，其中路徑建模為隱變量，采用AEVB（autoencoding variational Bayes）對模型進行求解。

基于強化學習的方法把多跳知識問答推理任務當作序列決策過程，只需一些目標即可得到泛化能力較強的模型，無須大量的標注語料。但是在面臨復雜的多跳知識推理場景時，智能體的決策能力往往不足。

（2）基于查詢圖的方法

基于路徑排序的方法容易造成搜索空間爆炸，而基于查詢圖的方法是基于路徑方法的擴展，與基于路徑的方法生成從主題實體到答案的路徑方式不同，基于查詢圖的方法使用圖來表示問題，并圍繞主題實體擴展出一個子圖，基于查詢圖的方法比基于路徑的方法更具表示能力。

早期的基于語義解析的方法將自然語言問題轉換為結構化的查詢（如SPARQL查詢），在知識圖譜上執行查詢可以得到問題的答案。Reddy S等人等人充分使用了組合范疇語法（combinatory categorial grammar，CCG）的表示能力，并提出Graph Parser模型來解析問題，受此啟發，Yih W T等人在2015年定義了查詢圖的概念，并提出了一個分階段的查詢圖生成（staged query graph generation，STAGG）模型來處理知識圖譜問答，查詢圖可以直接匹配為問題的邏輯形式，進而翻譯成查詢，因此語義解析問題可歸結為查詢圖生成問題。STAGG定義了3個階段來生成查詢圖：首先，使用現有的實體鏈接工具獲取候選主題實體，并對其評分；然后，STAGG探索主題實體和答案節點之間的所有關系路徑，為了限制搜索空間，它僅在下一跳的節點是一個復合類型（compound value type，CVT）節點時，探索長度為2的路徑，否則只考慮長度為1的路徑，使用深度卷積神經網絡對所有關系路徑進行打分，以判斷當前選擇的關系與問題的匹配程度；最后，根據啟發式規則將約束節點附加到關系路徑上。在這3個階段的每個階段，都使用對數線性模型對當前的部分查詢圖進行評分，并輸出最佳的最終查詢圖來查詢知識圖譜。STAGG有效地使用了知識圖譜中的信息來裁剪語義解析空間，從而簡化了任務難度。

針對STAGG無法回答涵蓋復雜約束的問題，Bao J W等人擴展了約束類型和運算符，新增了類型約束以及顯式和隱式時間約束等，將多重約束問題轉化為多重約束查詢圖（multi-constraint query graph，MulCG）來實現推理，MulCG仍然遵循STAGG的框架，但提供了更多規則，以應對復雜問題。STAGG和MulCG等方法都要求首先將問題中的候選主題實體鏈接到知識圖譜的實體上，實體鏈接的質量將影響后續的推理效果。Yu M等人將知識圖譜問答分為實體鏈接和關系檢測兩個關鍵的子任務，并提出了一個殘差學習增強的分級的雙向LSTM（hierarchical residual bidirectional LSTM，HRBiLSTM）用于關系檢測。對于實體鏈接，他們觀察到，在SimpleQuestions數據集上主題實體識別的Top-1準確率只有72.7%，因此在由實體鏈接器產生初始的候選主題實體后，又將問題文本輸入HR-BiLSTM中，HR-BiLSTM對問題以及在知識圖譜中與候選主題實體相關聯的關系進行不同抽象級別的編碼，并計算兩者的相似度得分，僅保留與那些得分較高的關系相關聯的候選主題實體。在確定了新的主題實體后，同樣使用HR-BiLSTM選擇新的關系，以逐步地生成查詢。在處理問題約束時，HRBiLSTM也遵循STAGG中的慣例。

為了限制搜索空間，STAGG只能探索2跳之內的路徑，無法回答涉及更多跳推理的問題。Lan Y S等人改進了STAGG方法，使其可以應對更長的關系路徑，即在擴展路徑的同時加入約束，而不是只在建立關系路徑之后再添加約束，如此可以有效地縮減搜索空間，改進的分級查詢圖生成方法可以同時處理包含約束的問答和涉及多跳的問答，該方法在WebQuestionsSP（WebQSP）系列數據集上取得了優異的表現。

基于路徑的多跳知識問答推理方法具有較好的可解釋性。但只能處理關系型知識，在處理屬性型、事實型知識時，建模復雜。

4 基于邏輯的多跳知識問答推理

基于符號邏輯規則的方法因其準確率高、可解釋性強等優點，在多跳知識問答推理研究中被廣泛探討。其中，作為邏輯規則的主要方法，或結合概率邏輯方法，或結合知識嵌入方法，一階邏輯近幾年已成為研究熱點。本節重點介紹基于一階邏輯的多跳知識推理方法的思路。

結合一階邏輯的自然性和概率邏輯模型的不確定性優點，馬爾可夫邏輯網絡方法已被證明在知識圖推理上的有效性。然而，在大規模知識圖譜上由于三元組之間的復雜結構，以上方法推理過程困難，效率較低。基于注意力機制的圖神經網絡擅長處理高度復雜的圖問題， Vardhan V H等人提出的概率邏輯圖注意力網絡（probabilistic logic graph attention network，pGAT）用變分EM算法優化了由馬爾可夫邏輯網絡定義的所有可能三元組的聯合分布。這有助于模型有效地結合一階邏輯和圖注意力網絡。該推理模型的提出為多跳知識問答提供了有利的參考。

近年來，為了解決知識圖譜存在的規模龐大和不完整問題，邏輯規則與知識嵌入相結合的研究受到很多關注。圖查詢嵌入（graph query embedding，GQE）、Query2Box以及BetaE等方法將查詢表示成有向無環的計算圖，計算圖指明了在知識圖譜上進行多跳推理以獲得目標答案的步驟。這些方法將一階邏輯運算符看作可通過訓練習得的幾何操作，它們都以查詢包含的主題實體的嵌入向量為起點，迭代地使用幾何操作生成查詢的嵌入向量，然后通過在向量空間中計算實體嵌入與查詢嵌入的距離來預測答案。

GQE主要關注一階邏輯查詢的一個子集，即只涉及存在量詞和合取運算的查詢。GQE提出了兩個核心的幾何運算符P （projection）和I（intersection），其中P負責根據下一跳的關系r將當前生成的查詢嵌入qq投射為新的查詢嵌入向量，I負責聚集計算圖中出邊指向同一個節點的所有頂點的嵌入向量表示，以模擬邏輯合取運算。P和I由式（4）實現：

其中，和是關于關系r的可訓練的參數矩陣，NNk是一個k層的前饋神經網絡，Ψ是一個對稱的向量函數。

GQE將查詢嵌入為向量空間中的一個點。Query2Box認為復雜的一階邏輯查詢對應一個答案實體集合，但目前一個點不能有效地建模一個集合，并且在向量空間中對兩個點做邏輯運算也不自然，故Query2Box將查詢嵌入為向量空間中的box。box由中心點和偏移兩部分組成，答案實體嵌入為一個點應包含在對應的box中，關系嵌入也表示成中心點和偏移項兩部分。查詢包含的實體節點的嵌入被初始化為偏移項為0的box，對于當前輸入的box嵌入p和下一跳關系嵌入r，關系嵌入也表示成中心點和偏移項兩部分，P操作通過在向量空間中將p和r相加產生新的box，I操作取多個box的交集作為結果，按照計算圖中的運算逐步推理，即可生成查詢最終的box嵌入。Query2Box還在GQE的基礎上增加了析取V運算，擴充了邏輯查詢的功能。GQE和Query2Box等方法將查詢嵌入為閉區域，比如歐幾里得空間中的一個點或一個box，而因為對閉區域取補并不能得到閉區域，所以這些方法不能支持邏輯取負運算，并且不能對不確定性進行建模。有別于Query2Box等，BetaE將實體和查詢嵌入為[0,1]區間上的𝛃分布，并為𝛃向量定義了概率關系投射、概率交和概率取負3個概率邏輯運算符，以支持任何形式的一階邏輯查詢。對𝛃分布的參數取倒數即實現了取負運算，即將高概率密度區域轉換為低概率密度區域，反之亦然。對于概率投射，BetaE為每一種關系類型學習一個多層感知器，以將一個𝛃向量通過下一跳的關系r匹配到另一個𝛃向量，BetaE將概率交定義為多個𝛃向量的帶權積。同樣，按照計算圖中的推理次序對起始的𝛃向量做變換，即可生成查詢對應的𝛃分布，然后在嵌入空間選擇與查詢嵌入概率最相近的實體集作為答案。

基于一階邏輯查詢的多跳知識問答推理方法具有嚴密性、自然性，且準確率高。為了模擬不確定性，一些研究將邏輯運算和概率邏輯結合，或者將邏輯運算轉換為嵌入向量空間的幾何操作，理論上可以進行任意跳數的推理。但這些模型都不能很好地處理復雜知識查詢。

5 實驗評測

對多跳知識問答推理模型在現有的數據集上進行評估可以驗證模型的性能表現。目前常用的自然語言問答數據集有MetaQA、WebQuestionsSP和ComplexWebQuestions （CWQ）等，另外，鏈接預測領域常用的數據集（如FB15k和FB15k-237等）也被用來構造查詢形式的問答，實現在知識圖譜上的推理。本節將介紹這些常用的評測數據集及評測指標，并對前文所述方法在以上數據集上的表現進行了對比分析。

5.1 評測數據集

（1）MetaQA數據集

MetaQA數據集是基于WikiMovies數據集構建的多跳問答數據集，它包含超過40萬個電影領域的多跳問題，這些問題有Vanilla、NTM和Audio 3個版本。Vanilla版本的MetaQA常被用于多跳知識問答推理任務，它除了包含1跳、2跳和3跳3種類型的問答數據，還包含一個知識圖譜，其有約135 000個三元組、43 000個實體以及9種關系。

（2）WebQuestionsSP數據集

Yih W T等人對WebQuestions數據集改進后提出了WebQuestionsSP數據集。WebQuestions是為了解決真實問題而構造的數據集，其問題來源于谷歌建議應用程序接口（Google suggest API），答案由眾包平臺Amazon Mechanic Turk通過人工標注生成。WebQuestions只包含了問題的答案，沒有提供問題對應的查詢語句，針對此缺點，WebQSP為每個問題構造了其對應的SPARQL查詢表達，并刪除了一些表達有歧義以及無清晰意圖或答案的問題。WebQSP包含4 737個1跳或2跳問題，問題的答案可以在Freebase知識庫中找到。

（3）ComplexWebQuestions數據集

Talmor A等人基于WebQSP構建了ComplexWebQuestions數據集。首先從WebQSP中采樣問題及其SPARQL查詢，并自動地構造更復雜的包含組合、連接、比較級以及最高級等形式的SPARQL查詢，最后由Amazon Mechanic Turk眾包平臺將這些SPARQL查詢重組為自然語言問題，問題的答案通過在Freebase中執行SPARQL查詢獲得。CWQ共包含34 689個問題及其對應的答案和SPARQL查詢。

（4）其他數據集

FB15k是Freebase的一個子集，也是知識圖譜補全領域的一個基準數據集，由三元組構成。為了解決FB15k測試集數據泄露的問題，Toutanova K等人在FB15k的基礎上構建了FB15k-237，并且移除了FB15k中反向的關系。NELL995數據集由NELL系統構建而來。

5.2 評測指標

Hits@1、F1分數、平均倒數排名（mean reciprocal rank，MRR）和平均精度均值（mean average precision，MAP）是常用來評估多跳知識問答模型效果的指標。把問答視為問題答案檢索任務，Hits@1是指正確答案是最終排序的第一個的占比。F1分數是指檢索到的答案的精確率和召回率的調和平均，取在所有問題上的F1分數的平均作為模型最終的F1結果。MRR指所有正確答案實體排名的倒數的均值。MAP指對所有查詢的平均正確率（average precision，AP）取均值的結果。

5.3 實驗結果及分析

表1列出了部分多跳知識推理方法在相同實驗數據集（MetaQA、WebQSP和CWQ）上Hits@1的結果，“-”表示在原文獻中對應指標的結果未給出，1-hop、2-hop和3-hop表示由源實體到目標答案實體推理時分別需要經過1跳、2跳和3跳。

由表1可以看出，在MetaQA數據集上，對于單跳問題，幾個模型的Hits@1結果相近，而隨著推理跳數增加，KVMemNN和GRAFT-Net兩個模型的性能有了明顯的下降。相較于KV-MemNN和GRAFT-Net，PullNet在3跳問題上仍然取得了不錯的表現，且PullNet在3個數據集上都取得了顯著的結果，充分顯示了其提出的迭代構建問題子圖方法的有效性以及圖神經網絡在基于知識圖譜的多跳推理問題上的適用性。相比KV-MemNN、GRAFT-Net和PullNet， EmbedKGQA在MetaQA數據集的平均Hits@1值更高，在WebQSP數據集上也表現突出，證明了EmbedKGQA基于語義匹配的方法在解決多跳問答問題上的有效性。NSM_+h總體上優于表1中的其他所有模型，表明了使用Teacher-Student網絡模型學習中間監督信號可以很好地提升推理能力。

表2列出了基于邏輯的模型（GQE、Q2B（Query2Box）、BetaE）在FB15k、FB15k-237和NELL-995 3個數據集上多跳推理的結果。

對比它們的結果可以看出，對于表2中所有數據集，Q2B在1-hop、2-hop、3-hop問題上的表現均優于GQE，證明了在理論上將查詢（問題）嵌入為向量空間中的一個box而不是一個點的思想更合理，而且在實際中也能取得更好的結果。3個模型中BetaE在多跳推理任務上的平均MRR最大，顯示了概率嵌入在邏輯查詢領域相對于傳統方法的有效性。

表3列出了部分基于強化學習的多跳知識問答方法在FB15k、FB15k-237和NELL-995 3個數據集上的結果，采用的評測指標有Hits@1和MAP，“-”表示在原文獻中對應指標的結果未給出。由表3可以看出，在FB15k-237數據集上，RewardShaping的Hits@1結果比MINERVA高出了11%，這很可能因為MINERVA中的智能體在訓練時會受到假負樣本的影響，導致低質量的獎勵，并且由于缺乏正確的動作序列用于訓練，智能體可能被假搜索軌跡誤導卻偶然地被引向了正確答案。RewardShaping針對以上問題做了改進，使智能體探索更廣泛的路徑集合，以抵消對虛假路徑的敏感度。但在NELL-995數據集上，RewardShaping模型的表現并不強于MINERVA，因為RewardShaping適合處理一對多的關系類型，而NELL-995數據集中的關系類型大多是一對一的。從MAP結果來看，DIVA比DeepPath效果要好，這是因為DeepPath關注于找到實體對間的路徑，缺少了對實體對是正樣本還是負樣本的判斷，導致實驗結果對噪聲和對抗樣本敏感，而DIVA更擅長處理噪聲和應對更復雜的推理場景。M-Walk使用RNN編碼狀態，并將蒙特卡洛搜索樹與神經策略結合來應對稀疏獎勵的挑戰，與DIVA、DeepPath相比，取得了更好的結果。

6 結束語

近年來，國內外涌現了很多基于知識圖譜的多跳問答推理方法，這些方法都取得了一定的進展，但仍然存在一些挑戰。

隨著KGQA技術的不斷發展，智能問答越來越多地深入人們的日常生活中，為人們的生活帶來便利。而在復雜的實際場景中，人們更加傾向表達更加復雜的多跳問題，這使得多跳知識智能問答成為必需，知識圖譜多跳問答推理方法也得到越來越多的關注。本文基于3個主流分類，總結了近年來多跳知識問答推理的研究方法。本文中很多方法是多種方式結合的形式，而分類方法是按照具體研究方法的重點創新和貢獻來劃分的。比如基于邏輯的分類中，BetaE方法雖然將知識圖譜實體表示為嵌入的方式，但是該方法表達的是一階邏輯求解答案的思想，是神經網絡增強符號邏輯的一種方法體現，故本文將該方法歸類為基于邏輯的方法。本文也闡述了常用的公開數據集、評價指標，以及不同方法在每個數據集上的最新表現和分析。

本文闡述的方法在實際應用中依然存在瓶頸，主要面臨以下3個挑戰。

● 多跳知識問答建模問題：難以充分理解用戶復雜多跳問題以及建模知識圖譜中的多跳關系。

● 小樣本學習問題：在知識資源和訓練數據有限的條件下，難以有效表征知識和推理答案。

● 可解釋性：深度學習在多跳知識問答任務中有卓越的表現，但是可解釋性差，導致模型缺少可信度。

各類多跳知識問答推理方法的優點和不足見表4。

未來，將從以下兩方面進行更深入的研究。

● 隨著BERT等預訓練模型的出現，多項自然語言處理任務（如智能問答的性能）被刷新紀錄。隨著各類基于Transformer注意力機制的預訓練模型層出不窮，很多研究者看好預訓練模型和知識圖譜結合的方法。通過兩者結合，知識圖譜中的知識可以顯式指導要學習的知識，進而增強BERT對背景知識或常識信息的編碼能力，同時文本上下文和知識上下文的融合能夠增強多跳推理中長路徑的特征表示，從而提升多跳知識問答推理任務的表現性能。

● 越來越多的互聯網數據以及行業數據呈現出多模態的特點，表現為對同一事物采用圖譜知識、文本描述、圖像、信息圖表以及視頻等多種模態進行表達。不久的未來將有更多關于多模態知識圖譜多跳問答的研究，滿足人們日益增長的理解和認知服務需求。多模態知識圖譜能夠提升知識的相關性和多樣性，從而更完整地表達對應的圖譜中的知識。通過多模態豐富的知識表示，能夠進一步保障多模態知識圖譜多跳問答推理的效果。

作者簡介

杜會芳（1991-），女，同濟大學設計創意學院博士生，主要研究方向為知識圖譜、智能問答。

王昊奮（1982-），男，同濟大學設計創意學院特聘研究員，中國計算機學會（CCF）理事、計算機術語審定委員會副主任、CCFTFSIGKG主席，OpenKG聯合創始人，主要研究方向為知識圖譜、自然語言處理、問答對話、智能內容生成。

史英慧（1998-），女，東南大學網絡空間與安全學院碩士生，主要研究方向為知識圖譜、多模態數據。

王萌（1989-），男，博士，東南大學計算機科學與工程學院講師，CCF會員，東南大學“至善青年學者”支持計劃獲得者，主要研究方向為知識圖譜、多模態數據、自然語言處理。

聯系我們:

Tel:010-81055448

? ? ? ?010-81055490

? ? ? ?010-81055534

E-mail:bdr@bjxintong.com.cn?

http://www.infocomm-journal.com/bdr

http://www.j-bigdataresearch.com.cn/

轉載、合作：010-81055307

大數據期刊

《大數據（Big Data Research，BDR）》雙月刊是由中華人民共和國工業和信息化部主管，人民郵電出版社主辦，中國計算機學會大數據專家委員會學術指導，北京信通傳媒有限責任公司出版的期刊，已成功入選中國科技核心期刊、中國計算機學會會刊、中國計算機學會推薦中文科技期刊，以及信息通信領域高質量科技期刊分級目錄、計算領域高質量科技期刊分級目錄，并多次被評為國家哲學社會科學文獻中心學術期刊數據庫“綜合性人文社會科學”學科最受歡迎期刊。

關注《大數據》期刊微信公眾號，獲取更多內容

總結

以上是生活随笔為你收集整理的虚拟专题：知识图谱 | 知识图谱多跳问答推理研究进展、挑战与展望的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。