當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

关于知识图谱，我们接下来该研究什么？斯坦福教授们给出了答案

發(fā)布時間：2024/7/5 编程问答 66 豆豆

生活随笔收集整理的這篇文章主要介紹了关于知识图谱，我们接下来该研究什么？斯坦福教授们给出了答案小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

星標/置頂小屋，帶你解鎖

最萌最前沿的NLP、搜索與推薦技術(shù)

文 |?舒意恒（南京大學(xué)碩士生，知識圖譜方向）

編 |? 北大小才女小軼

本文整理了斯坦福大學(xué) CS 520 知識圖譜研討會課程的第 10 集的內(nèi)容，主要是關(guān)于知識圖譜未來的研究方向，推薦給研究知識圖譜的同學(xué)們～

1 使用強化學(xué)習(xí)進行多跳知識圖譜推理

第一位演講者：Richard Sochar

Richard 認為知識圖譜未來的一個重要研究方向是使用強化學(xué)習(xí)進行多跳知識圖譜推理。

知識圖譜的缺陷之一是不完整性，即知識圖譜能存儲的事實是有限的。對于知識圖譜的重要應(yīng)用——聊天機器人（Chatbot），也就是對話系統(tǒng)或者問答系統(tǒng)，其交互形式可以是文本或是圖像。在對話過程中需要根據(jù)知識圖譜進行推理，但知識圖譜關(guān)于目標問題的知識可能是殘缺或者有噪音的，所以算法應(yīng)當具有一定的魯棒性。對于知識圖譜的不完整性，有以下解決方案：

知識圖譜嵌入

知識圖譜嵌入是一種發(fā)現(xiàn)缺失事實的有效方法。它將知識圖譜中的所有實體或關(guān)系嵌入到連續(xù)向量空間中。采用強化學(xué)習(xí)進行推理時，可以使用知識圖譜嵌入，便于神經(jīng)網(wǎng)絡(luò)對實體進行處理。但是知識圖譜嵌入通常缺少可解釋性。

多跳推理模型

現(xiàn)有的多跳推理模型通常采用序列決策的思路。從問題中提取實體，然后在知識圖譜中學(xué)習(xí)如何在實體間進行推理。

強化學(xué)習(xí)框架

強化學(xué)習(xí)中需要關(guān)注五個要素：

環(huán)境 environment：在該任務(wù)中，環(huán)境是一個知識圖譜
狀態(tài) state：例如，當前已經(jīng)遍歷過的一個子圖
動作 action：例如，選擇一個結(jié)點進行擴展
轉(zhuǎn)換 transition：采取一個動作后，狀態(tài)發(fā)生改變，直到一個定義的推理終點
獎勵 reward：在推理正確時獲得獎勵

使用強化學(xué)習(xí)進行推理可解釋性較強，可以從算法給出的推理路徑中分析結(jié)果的產(chǎn)生原因。

多跳推理是可解釋的，但是準確較低。常常將知識圖譜嵌入與強化學(xué)習(xí)框架結(jié)合使用，從而兼顧可解釋性和準確性。

該方法還可以推廣到聯(lián)合知識圖譜和文本的多跳推理上。

2 知識圖譜到底知道什么？

第二位演講者：Mark A. Musen 博士

Mark 想討論的是非常根本的一個問題——我們知道了什么是圖，但什么是知識？我們?nèi)绾未_保知識被存儲到了圖中？關(guān)于這個問題的答案，Mark從早年的研究歷史開始談起。

上世紀中葉，Stanford 想要開發(fā)一個專家系統(tǒng)，幫助醫(yī)生做臨床決策。他們先是考慮用語義網(wǎng)絡(luò)來實現(xiàn)這一任務(wù)。還有一個早期用于幫助決策的專家系統(tǒng)，叫做MYCIN，出現(xiàn)于 70~80 年代。它是包含大量復(fù)雜的規(guī)則供專家進行決策。在這個年代，符號化的人工智能也被認為是醫(yī)療健康行業(yè)的未來。但是，對這類方法的質(zhì)疑逐漸顯現(xiàn)。包含大量規(guī)則的系統(tǒng)真的是可以維護的嗎？語義網(wǎng)絡(luò)（知識圖譜）能夠支持查找之外的任何形式的推理嗎？什么樣的知識表示可能可以支持一個最智能的系統(tǒng)呢？

Allen Newell 在 1980 年提出：我們應(yīng)該停止爭論如何表示知識，真正重要的是系統(tǒng)中有怎樣的知識，而不是如何用計算機進行表示。知識是觀察者賦予智能體的。知識是解決問題的能力。

我們無法“看見”知識，或?qū)⑺鼘懴聛怼Ｋ^“道可道，非常道。名可名，非常名。”
我們永遠無法得知智能體到底懂得了什么。所謂“子非魚，安知魚之樂。子非我，安知我不知魚之樂。”
我們只能認為智能體有知識的條件是：
- 似乎有目標
- 似乎能選擇行為能實現(xiàn)目標
- 似乎能理智地選擇行為

語義網(wǎng)被認為有希望在 Web 級別的數(shù)據(jù)上解決問題。但Mark 認為相關(guān)研究者似乎忽視了本體論和 Web 服務(wù)的作用，只顧玩弄鏈接數(shù)據(jù)的概念。日益增長的鏈接數(shù)據(jù)被表示為知識圖譜。正如上個世紀那樣，我們又開始過分關(guān)注知識表示的狀態(tài)，而越來越少地討論如何利用它解決問題。只有圖，我們?nèi)匀蛔霾涣巳魏问虑椤?/p>

我們又重新開始研究如何將知識表示為圖。如今，龐大的知識圖譜相比當年的語義網(wǎng)絡(luò)，擁有更加豐富的信息。我們已經(jīng)知道一些表示和生成智能行為的方法了，但還有很多應(yīng)用沒有開始研究，有很多行為還沒有想到如何去建模——這是我們未來可以努力的方向。

3 Data Commons

第三位演講者：RV Guha

數(shù)據(jù)正在驅(qū)動很多應(yīng)用，政策、新聞、健康、科學(xué)等。目前的問題不在于數(shù)據(jù)的缺乏，而是數(shù)據(jù)有太多的格式和規(guī)范。我們搜尋數(shù)據(jù)源、清洗數(shù)據(jù)、搞定數(shù)據(jù)存儲……在這個過程中存在啟動成本高昂，生態(tài)系統(tǒng)不完整，工具較少的問題。我們?nèi)绾问箶?shù)據(jù)的使用變得更加簡單？

Data Commons 是一個 Google 發(fā)起的項目，嘗試解決知識圖譜構(gòu)建中的上述問題，從不同數(shù)據(jù)源合成一個開放知識圖譜。Guha 團隊想要做的是，從原本搜索數(shù)據(jù)集、下載、清洗、歸一化、融合的繁瑣流程，簡化到直接搜索谷歌即可獲得數(shù)據(jù)集。

該項目的優(yōu)勢在于，通過清洗、歸一化和將多個數(shù)據(jù)集進行融合的方式，輕松構(gòu)建一個知識圖譜，無需清理和加入數(shù)據(jù)。

目前通過 Data Commons 構(gòu)建的知識圖譜包括按地理區(qū)域的美國人口普查公報、美國國家海洋和大氣管理局提供的天氣歷史與預(yù)報、美國勞工統(tǒng)計局的就業(yè)與失業(yè)統(tǒng)計等。

以上是對課程的簡單的筆記，并不足以涵蓋課程中的細節(jié)，感興趣的同學(xué)們可以刷起來啦～

喜歡本文的小伙伴，強烈建議加入賣萌屋的CS520追劇群，不僅可以認識眾多志同道合的優(yōu)秀小伙伴，而且還有若干賣萌屋美麗小姐姐（劃掉）、頂會審稿人、大廠研究員、知乎大V等你來撩哦。

如果提示已滿或過期，或希望加入領(lǐng)域大群（自然語言處理、搜索技術(shù)、推薦系統(tǒng)、算法崗求職等）或其他垂類討論群，請在后臺回復(fù)關(guān)鍵詞【入群】獲取入口哦。

記得掃描下方二維碼關(guān)注并星標置頂，我才能來到你面前哦。

夕小瑤的賣萌屋

關(guān)注&星標小夕，帶你解鎖AI秘籍

訂閱號主頁下方「撩一下」有驚喜

總結(jié)

以上是生活随笔為你收集整理的关于知识图谱，我们接下来该研究什么？斯坦福教授们给出了答案的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：直击行业痛点！端侧模型部署的成熟解决方案
下一篇：史上最全提升GPU的tricks合集