论文浅尝 | 基于知识图的问答变分推理
Zhang Y, Dai H, Kozareva Z, et al. Variational Reasoning for Question Answering with Knowledge Graph. Proceedings of 32th AAAI 2018
動機(jī)
傳統(tǒng)的知識圖譜問答主要是基語義解析的方法,這種方法通常是將問題映射到一個形式化的邏輯表達(dá)式,然后將這個邏輯表達(dá)轉(zhuǎn)化為知識圖譜的查詢例如SPARQL。問題的答案可以從知識圖譜中通過轉(zhuǎn)化后的查詢得到。然而傳統(tǒng)的基于語義解析的知識庫問答會存在一些挑戰(zhàn),如基于查詢的方法只能獲取一些明確的信息,對于知識庫中需要多跳才能獲取的答案則無法回答。舉例來說當(dāng)問到這樣一個問題“Who wrote the paper titled paper1?,傳統(tǒng)的基于語義解析的方法可以獲得如下語句進(jìn)而可以查到 paper1 這個實體
但是在上例中,當(dāng)我們詢問Who have co-authored paper with author1由于缺乏co-author這個明確的關(guān)系,傳統(tǒng)的方法則無法轉(zhuǎn)換成合適的查詢語句。但實際上在上例中author2則是author1在paper1中的co-author
?
另一個對于傳統(tǒng)方法的挑戰(zhàn)是,在傳統(tǒng)方法中問句中含有的實體通常都使用很簡單的方法來匹配到知識庫上,例如字符串匹配。但是實際的場景中用戶的輸入可能是通過語音識別轉(zhuǎn)換而來或者是用戶通過打字輸入而來。因此用戶的輸入很難確保不存在一定的噪聲。在具有噪聲的場景下,問句中的實體則很難直接準(zhǔn)確的匹配到知識庫上。因此本文提出了一個端到端的知識庫問答模型來解決以上兩個問題。
創(chuàng)新點
模型框架圖
本文提出的模型如上圖所示。這個模型為了克服上述所說的問題則將模型分為兩個部分:
?
第一部分是通過概率模型來識別問句中的實體。如問句 who acted in the movie Passengers? 我們希望能將 Passengers 識別出來。但由于訓(xùn)練數(shù)據(jù)中的實體沒有被標(biāo)注出來,因此這個識別的實體將被看成一個隱變量。整個識別實體的過程如下:
?
1)? 先將輸入的問句 q 進(jìn)行編碼,將問句 q 轉(zhuǎn)換為一個維度是 d 的向量
2)? 隨后將圖譜中每個實體都轉(zhuǎn)化為一個向量
3)? 通過 softmax 計算在 q 下圖譜中每個實體是 q 中實體的概率
?
該過程在整個模型框架圖的左上部分在上例中輸入問句 The actor of lost Christmas also starred in which movies 通過算法在圖中找到 lost Christmas 為問句中對應(yīng)的實體
?
第二部分則是在問答時在知識圖譜上做邏輯推理,在推理這部分的工作中我們給出了上一步識別的實體和問句希望系統(tǒng)能給出答案。由于在整個系統(tǒng)的學(xué)習(xí)過程中沒有人來標(biāo)注在問答時使用的推理規(guī)則,因此在問答時使用的規(guī)則將被學(xué)習(xí)出來。整個推理過程如下所示:
?
1)? 通過另一個網(wǎng)絡(luò)對問句 q 進(jìn)行編碼,將 q 轉(zhuǎn)化為一個維度是 d 的向量
2)? 通過一個Reasoning graph embedding,對 y 的相鄰實體進(jìn)行編碼
3)? 通過 softmax 計算通過 y 推理找到實體是問題 q 答案的概率
4)? 如果推理沒有達(dá)到限定的步數(shù)則返回2)將原來y相鄰的實體轉(zhuǎn)換為y進(jìn)而進(jìn)行推理
?
整個推理過程則在上圖的右半部分,該部分分別計算推理時實體是問句答案的概率,最后得到實體 shifty 對于問句 q 概率最大。而概率最大的實體到y的路徑則是推理所獲取的路徑為 lost Christmas acted Jason Flemyng acted Shifty.
?
最后算法通過 EM 進(jìn)行優(yōu)化,整體訓(xùn)練的思路是希望第一部分和第二部分的概率同時最大
?
實驗結(jié)果
實驗結(jié)果顯示在 Vanilla、NTM 和 Audio 數(shù)據(jù)集下,算法的效果都超過傳統(tǒng)的 QA 系統(tǒng),同時在需要推理的問題中性能更為顯著。
?
筆記整理:高桓,東南大學(xué)博士生,研究方向為知識圖譜、自然語言處理。
OpenKG.CN
中文開放知識圖譜(簡稱OpenKG.CN)旨在促進(jìn)中文知識圖譜數(shù)據(jù)的開放與互聯(lián),促進(jìn)知識圖譜和語義技術(shù)的普及和廣泛應(yīng)用。
轉(zhuǎn)載須知:轉(zhuǎn)載需注明來源“OpenKG.CN”、作者及原文鏈接。如需修改標(biāo)題,請注明原標(biāo)題。
點擊閱讀原文,進(jìn)入 OpenKG 博客。
總結(jié)
以上是生活随笔為你收集整理的论文浅尝 | 基于知识图的问答变分推理的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 玩转算法之面试第十章-贪心算法
- 下一篇: 滴滴 KDD 2018 论文详解:基于强