日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

论文浅尝 | 通过学习中间步骤的监督信号改进多跳知识库问答

發布時間:2024/7/5 编程问答 51 豆豆
生活随笔 收集整理的這篇文章主要介紹了 论文浅尝 | 通过学习中间步骤的监督信号改进多跳知识库问答 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

筆記整理:陳永銳,東南大學博士

論文鏈接:https://arxiv.org/pdf/2101.03737.pdf

概述

該論文處理多跳知識庫問答(KBQA)任務,主要關注訓練過程在中間步驟缺乏監督信號的挑戰。由于這一挑戰,多跳 KBQA 算法只能接收來自最終答案的反饋,這使得學習不穩定或無效。

為了應對這一挑戰,該論文提出了一種師生網絡方法。方法主要由兩個網絡組成,分別是教師網絡和學生網絡。其中,學生網絡旨在找到查詢的正確答案,而教師網絡則試圖學習中間監督信號以提高學生網絡的推理能力。主要的新穎之處在于教師網絡的設計,利用前向和后向推理來增強對中間實體分布的學習。通過考慮雙向推理,教師網絡可以產生更可靠的中間監督信號,從而緩解虛假推理問題。

動機

在某些情況下,推理即使正確找到答案,關系路徑也可能是虛假的。以上圖為例,問題是“what types are the films starred by actors in the nine lives of fritz the cat?”。除了正確的路徑(紅色箭頭)外,包含第一步中的實體的兩條虛假路徑(藍色箭頭)也可以得到正確答案。主要是由于中間推理步驟缺少監督信號(稱之為中間監督信號)。如果將這些虛假路徑作為監督信號進行訓練,會使模型朝向錯誤的方向優化。

該論文受到雙向搜索算法,(例如BFS)的啟發,通過雙向探索可以更有效地識別連接源和目的地的理想路徑。事實上,對于 KBQA,前向推理找到從主題實體(即查詢中的實體)開始到答案實體的路徑,以及從答案實體返回到答案實體的反向推理主題實體。然而大多數現有方法只考慮前向推理。該論文對兩個推理過程進行聯合建模,以便在中間步驟中加入額外的自我監督信號。

在上圖中,第二步正向推理得到的實體分布應該與第一步反向推理得到的實體分布相似。不相關的實體“Devil's Doorway”和“Coffin Rock”很可能在正向推理的第二步推理中到達,但在反向推理的第一步中無法到達。為了保持兩個過程之間的對應關系,應該避免在前向推理的第一步中包含導演“Robert Taylor”。這種潛在的對應關系有助于在中間步驟中改進每個單獨推理過程的學習。這就是該論文如何學習可靠的中間監督信號的關鍵。

NSM模型

本文的基本模型主要基于Neural State Machine(NSM)

上圖展示了兩步的推理過程。模型主要包括兩個組件,指令組件(藍色虛線框)和推理組件(黃色虛線框)。在推理過程的每一步:

?指令組件在推理過程的每一步會關注問句的不同部分,而得到指令向量??。?推理組件先利用??的信息并結合的周圍實體的信息更新每個實體的embedding,得到新實體embedding ??,最后再更新實體分布??。

師生網絡

?學生網絡即使用NSM模型?教師網絡采用兩個NSM分別進行正向和反向的推理,并借此優化每一步的實體分布??。論文提出了以下兩種模式:

1.平行推理(parallel reasoning):

兩個 NSM 網絡相對隔離,不共享任何參數。只考慮在它們之間的中間實體分布上加入對應約束。

2.層級推理(hybrid reasoning)

共享相同的指令組件,將兩個推理過程安排在一個循環的流水線中。除了對應約束之外,兩個進程接收相同的指令向量。此外,前向推理最后一步的派生信息作為初始值輸入后向推理。形式上,在這種情況下,以下等式成立:

訓練過程

訓練教師網絡,考慮兩種loss:

?推理損失:

這里??表示KL散度。

?通信損失:

這里,??表示JS散度。

對于教師網絡,結合上述兩種損失:

?等教師網絡收斂后,利用其得到的中間分布?? 訓練學生網絡,考慮以下兩種loss:

實驗結果

論文使用了CWQ, MetaQA,WebQSP三個數據集進行了實驗。

可見,NSM+h在多跳問答的數據集上均取得了最優的結果。


OpenKG

OpenKG(中文開放知識圖譜)旨在推動以中文為核心的知識圖譜數據的開放、互聯及眾包,并促進知識圖譜算法、工具及平臺的開源開放。

點擊閱讀原文,進入 OpenKG 網站。

總結

以上是生活随笔為你收集整理的论文浅尝 | 通过学习中间步骤的监督信号改进多跳知识库问答的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。