论文浅尝 | 基于知识图的问答变分推理
Zhang Y, Dai H, Kozareva Z, et al. Variational Reasoning for Question Answering with Knowledge Graph. Proceedings of 32th AAAI 2018
動機
傳統的知識圖譜問答主要是基語義解析的方法,這種方法通常是將問題映射到一個形式化的邏輯表達式,然后將這個邏輯表達轉化為知識圖譜的查詢例如SPARQL。問題的答案可以從知識圖譜中通過轉化后的查詢得到。然而傳統的基于語義解析的知識庫問答會存在一些挑戰,如基于查詢的方法只能獲取一些明確的信息,對于知識庫中需要多跳才能獲取的答案則無法回答。舉例來說當問到這樣一個問題“Who wrote the paper titled paper1?,傳統的基于語義解析的方法可以獲得如下語句進而可以查到 paper1 這個實體
但是在上例中,當我們詢問Who have co-authored paper with author1由于缺乏co-author這個明確的關系,傳統的方法則無法轉換成合適的查詢語句。但實際上在上例中author2則是author1在paper1中的co-author
?
另一個對于傳統方法的挑戰是,在傳統方法中問句中含有的實體通常都使用很簡單的方法來匹配到知識庫上,例如字符串匹配。但是實際的場景中用戶的輸入可能是通過語音識別轉換而來或者是用戶通過打字輸入而來。因此用戶的輸入很難確保不存在一定的噪聲。在具有噪聲的場景下,問句中的實體則很難直接準確的匹配到知識庫上。因此本文提出了一個端到端的知識庫問答模型來解決以上兩個問題。
創新點
模型框架圖
本文提出的模型如上圖所示。這個模型為了克服上述所說的問題則將模型分為兩個部分:
?
第一部分是通過概率模型來識別問句中的實體。如問句 who acted in the movie Passengers? 我們希望能將 Passengers 識別出來。但由于訓練數據中的實體沒有被標注出來,因此這個識別的實體將被看成一個隱變量。整個識別實體的過程如下:
?
1)? 先將輸入的問句 q 進行編碼,將問句 q 轉換為一個維度是 d 的向量
2)? 隨后將圖譜中每個實體都轉化為一個向量
3)? 通過 softmax 計算在 q 下圖譜中每個實體是 q 中實體的概率
?
該過程在整個模型框架圖的左上部分在上例中輸入問句 The actor of lost Christmas also starred in which movies 通過算法在圖中找到 lost Christmas 為問句中對應的實體
?
第二部分則是在問答時在知識圖譜上做邏輯推理,在推理這部分的工作中我們給出了上一步識別的實體和問句希望系統能給出答案。由于在整個系統的學習過程中沒有人來標注在問答時使用的推理規則,因此在問答時使用的規則將被學習出來。整個推理過程如下所示:
?
1)? 通過另一個網絡對問句 q 進行編碼,將 q 轉化為一個維度是 d 的向量
2)? 通過一個Reasoning graph embedding,對 y 的相鄰實體進行編碼
3)? 通過 softmax 計算通過 y 推理找到實體是問題 q 答案的概率
4)? 如果推理沒有達到限定的步數則返回2)將原來y相鄰的實體轉換為y進而進行推理
?
整個推理過程則在上圖的右半部分,該部分分別計算推理時實體是問句答案的概率,最后得到實體 shifty 對于問句 q 概率最大。而概率最大的實體到y的路徑則是推理所獲取的路徑為 lost Christmas acted Jason Flemyng acted Shifty.
?
最后算法通過 EM 進行優化,整體訓練的思路是希望第一部分和第二部分的概率同時最大
?
實驗結果
實驗結果顯示在 Vanilla、NTM 和 Audio 數據集下,算法的效果都超過傳統的 QA 系統,同時在需要推理的問題中性能更為顯著。
?
筆記整理:高桓,東南大學博士生,研究方向為知識圖譜、自然語言處理。
OpenKG.CN
中文開放知識圖譜(簡稱OpenKG.CN)旨在促進中文知識圖譜數據的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。
轉載須知:轉載需注明來源“OpenKG.CN”、作者及原文鏈接。如需修改標題,請注明原標題。
點擊閱讀原文,進入 OpenKG 博客。
總結
以上是生活随笔為你收集整理的论文浅尝 | 基于知识图的问答变分推理的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 玩转算法之面试第十章-贪心算法
- 下一篇: 滴滴 KDD 2018 论文详解:基于强