日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

论文浅尝 | 神经网络与非神经网络简单知识问答方法的强基线分析

發布時間:2024/7/5 编程问答 36 豆豆
生活随笔 收集整理的這篇文章主要介紹了 论文浅尝 | 神经网络与非神经网络简单知识问答方法的强基线分析 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

來源:NAACL 2018

鏈接:http://aclweb.org/anthology/N18-2047

?

本文關注任務為面向簡單問題的知識庫問答(僅用KB中的一個事實就能回答問題)。作者將任務劃分為實體檢測,實體鏈接,關系預測與證據整合,探究了簡單的強基線。通過基于SIMPLEQUEST IONS數據集上的實驗,作者發現基本的LSTM或者GRU加上一些啟發式方法就能夠在精確度上接近當前最優,并且在沒有使用神經網絡的情況下依然取得相當不錯的性能。這些結果反映出前人工作中,某些基于復雜神經網絡方法表現出不必要的復雜性。


動機


近期的簡單知識庫問答工作中,隨著神經網絡模型復雜性的增加,性能也隨之提升。作者認為這種趨勢可能帶來對網絡結構有效性理解的缺失, Melis等人的研究也佐證了這一點。他們發現,標準的LSTM通過適當的調參,就可以得到堪比最新網絡模型的性能。

從這一觀點出發,作者嘗試去除不必要的復雜結構,直到獲得一個盡可能簡單但是性能優異的模型


方法


實體檢測(Entity Detection

實體檢測的目標是確認問題相關的實體,可以抽象為序列標注問題,即識別問題中的每個字符是否是實體。考慮到涉及序列處理,采用RNN是相對流行的做法。

在神經網絡策略上,作者以問句的詞嵌入矩陣作為輸入,在雙向LSTMGRU上進行實驗。(因為是構建baseline,作者并未在網絡模型上添加CRF)

非神經網絡方法則選用CRF(特征包括:詞位置信息,詞性標注,n-gram等等)

通過實體檢測,可以得到表達實體的一系列關鍵詞(字符)

?

實體鏈接(Entity Linking

作者將實體鏈接抽象為模糊字符串匹配問題,并未使用神經網絡方法。

對于知識庫中的所有實體,作者預先構造了知識庫實體名稱n-gram的倒排索引,在實體鏈接時,作者生成所有候選實體文本相應的n-gram,并在倒排索引中查找和匹配它們(策略是優先匹配較大粒度的n-gram)。

獲取到可能的實體列表后,采用Levenshtein Distance進行排序篩選。

?

關系預測(Relation Prediction

關系預測的目標是確定問題所問的關系信息,作者將其抽象為句子分類問題。對于這個子任務,作者在神經網絡方法分別嘗試了RNNCNN兩種。

RNNs:與實體檢測類似,作者也采用雙向RNNGRU構建模型,并僅依據隱狀態作為證據進行分類,其他與目標檢測模型一致。

CNNs:這里引用Kim等人(2014)的工作,簡化為單通道,使用2-4寬度做特征映射。

非神經網絡方法則采用了邏輯回歸策略(Logistic Regression),特征方面選擇了兩組,其一是tfidfbi-gram,其二是詞嵌入與關系詞。

?

證據整合(Evidence Integration

該任務的目標是從前面生成的m個候選實體與n個關系中選出(m!=n)一個實體-關系組合。

作者首先生成m*n個候選組合,考慮到實體檢測和關系預測是相對獨立的模型,這意味著很多組合意義不大,可以做初步消除。

在組合打分策略上,考慮到知識庫中相同的共享節點,比如所有姓名為“亞當斯密”的人,作者對出現頻率過高的實體進行打分限制。


實驗


對比實驗基于 SIMPLEQUESTIONS數據集,并劃分數據規模:訓練集75.9K,驗證集10.8K,測試集21.7K

作者進行了實體鏈接,關系預測和end2end問答三組實驗:

從各組實驗的結果可以發現,本文建立的基礎結構模型所得到的baseline在三個任務中,均超過了部分較新的工作。


總結


實驗結果有效驗證了作者的觀點,基本的LSTM或者GRU通過有效的調試,能夠在精確度上接近當前最優,而非神經網絡方法配合新的特征組合也能夠取得相當不錯的性能。

?

論文筆記整理:譚亦鳴,東南大學博士,研究方向為知識庫問答、自然語言處理。


?

OpenKG.CN


中文開放知識圖譜(簡稱OpenKG.CN)旨在促進中文知識圖譜數據的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。

點擊閱讀原文,進入 OpenKG 博客。

總結

以上是生活随笔為你收集整理的论文浅尝 | 神经网络与非神经网络简单知识问答方法的强基线分析的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。