當(dāng)前位置：首頁 > 运维知识 > windows >内容正文

windows

论文浅尝 | 中科院百度微软等学者最新综述论文40+最新方法阐述知识图谱提升推荐系统准确性与可解释性...

發(fā)布時(shí)間：2024/7/5 windows 42 豆豆

生活随笔收集整理的這篇文章主要介紹了论文浅尝 | 中科院百度微软等学者最新综述论文40+最新方法阐述知识图谱提升推荐系统准确性与可解释性... 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

本文轉(zhuǎn)載自公眾號(hào)：先知。

【導(dǎo)讀】近來，知識(shí)圖譜用于推薦系統(tǒng)是關(guān)注的焦點(diǎn)，能夠提升推薦系統(tǒng)的準(zhǔn)確性與可解釋性。如何將知識(shí)圖譜融入到推薦系統(tǒng)呢? ?最近中科院計(jì)算所百度微軟等學(xué)者最新綜述論文《A Survey on Knowledge Graph-Based Recommender ?Systems》，闡述對(duì)基于知識(shí)圖譜的推薦系統(tǒng)進(jìn)行了系統(tǒng)的研究。

地址：

https://www.zhuanzhi.ai/paper/90d0d696560bc88ea93f629b478a2128

為了解決各種在線應(yīng)用中的信息爆炸問題，提高用戶體驗(yàn)，推薦系統(tǒng)被提出來進(jìn)行用戶偏好建模。盡管人們已經(jīng)做出了許多努力來實(shí)現(xiàn)更加個(gè)性化的推薦，但是推薦系統(tǒng)仍然面臨著一些挑戰(zhàn)，比如數(shù)據(jù)稀疏性和冷啟動(dòng)。近年來，以知識(shí)圖譜作為邊信息生成推薦引起了人們的極大興趣。這種方法不僅可以緩解上述問題，提供更準(zhǔn)確的推薦，而且可以對(duì)推薦的項(xiàng)目進(jìn)行解釋。本文對(duì)基于知識(shí)圖譜的推薦系統(tǒng)進(jìn)行了系統(tǒng)的研究。我們收集了這一領(lǐng)域最近發(fā)表的論文，并從兩個(gè)角度進(jìn)行了總結(jié)。一方面，我們通過研究論文如何利用知識(shí)圖譜進(jìn)行準(zhǔn)確和可解釋的推薦來研究所提出的算法。另一方面，我們介紹了這些工作中使用的數(shù)據(jù)集。最后，我們提出了幾個(gè)可能的研究方向。

概述

隨著互聯(lián)網(wǎng)的快速發(fā)展，數(shù)據(jù)量呈指數(shù)級(jí)增長。由于信息量過大，用戶在眾多的選擇中很難找到自己感興趣的。為了提高用戶體驗(yàn)，推薦系統(tǒng)已被應(yīng)用于音樂推薦[1]、電影推薦[2]、網(wǎng)上購物[3]等場景。

推薦算法是推薦系統(tǒng)的核心要素，主要分為基于協(xié)同過濾(CF)的推薦系統(tǒng)、基于內(nèi)容的推薦系統(tǒng)和混合推薦系統(tǒng)[4]。基于CF的推薦基于用戶或交互數(shù)據(jù)項(xiàng)的相似度來建模用戶偏好，而基于內(nèi)容的推薦利用了物品項(xiàng)的內(nèi)容特征。基于CF的推薦系統(tǒng)得到了廣泛的應(yīng)用，因?yàn)樗梢杂行У夭东@用戶的偏好，并且可以很容易地在多個(gè)場景中實(shí)現(xiàn)，而不需要在基于內(nèi)容的推薦系統(tǒng)[5]、[6]中提取特征。然而，基于CF的推薦存在數(shù)據(jù)稀疏性和冷啟動(dòng)問題[6]。為了解決這些問題，提出了混合推薦系統(tǒng)來統(tǒng)一交互級(jí)相似度和內(nèi)容級(jí)相似度。在這個(gè)過程中，我們探索了多種類型的邊信息，如項(xiàng)目屬性[7]、[8]、項(xiàng)目評(píng)論[9]、[10]，以及用戶的社交網(wǎng)絡(luò)[11]、[12]。

近年來，將知識(shí)圖譜(KG)作為邊信息引入推薦系統(tǒng)引起了研究者的關(guān)注。KG是一個(gè)異構(gòu)圖，其中節(jié)點(diǎn)作為實(shí)體，邊表示實(shí)體之間的關(guān)系。可以將項(xiàng)目及其屬性映射到KG中，以了解項(xiàng)目[2]之間的相互關(guān)系。此外，還可以將用戶和用戶端信息集成到KG中，從而更準(zhǔn)確地捕捉用戶與物品之間的關(guān)系以及用戶偏好。圖1是一個(gè)基于KG的推薦示例，其中電影“Avatar”和“Blood ? Diamond”被推薦給Bob。此KG包含用戶、電影、演員、導(dǎo)演和類型作為實(shí)體，而交互、歸屬、表演、導(dǎo)演和友誼是實(shí)體之間的關(guān)系。利用KG，電影與用戶之間存在不同的潛關(guān)系，有助于提高推薦的精度。基于知識(shí)的推薦系統(tǒng)的另一個(gè)優(yōu)點(diǎn)是推薦結(jié)果[14]的可解釋性。在同一個(gè)示例中，根據(jù)user-item圖中的關(guān)系序列可以知道向Bob推薦這兩部電影的原因。例如，推薦《阿凡達(dá)》的一個(gè)原因是，《阿凡達(dá)》與鮑勃之前看過的《星際穿越》屬于同一類型。最近提出了多種KGs，如Freebase[15]、DBpedia[16]、YAGO[17]、谷歌的知識(shí)圖譜[18]，方便了KGs的推薦構(gòu)建。

圖1 一個(gè)基于kg的推薦的例子

本次綜述的目的是提供一個(gè)全面的文獻(xiàn)綜述利用KGs作為側(cè)信息的推薦系統(tǒng)。在我們的研究過程中，我們發(fā)現(xiàn)現(xiàn)有的基于KG的推薦系統(tǒng)以三種方式應(yīng)用KGs: ? 基于嵌入的方法、基于路徑的方法和統(tǒng)一的方法。我們?cè)敿?xì)說明了這些方法的異同。除了更準(zhǔn)確的推薦之外，基于KG的推薦的另一個(gè)好處是可解釋性。我們討論了不同的作品如何使用KG來進(jìn)行可解釋的推薦。此外，根據(jù)我們的綜述，我們發(fā)現(xiàn)KGs在多個(gè)場景中充當(dāng)了輔助信息，包括電影、書籍、新聞、產(chǎn)品、興趣點(diǎn)(POIs)、音樂和社交平臺(tái)的推薦。我們收集最近的作品，根據(jù)應(yīng)用程序?qū)λ鼈冞M(jìn)行分類，并收集在這些作品中評(píng)估的數(shù)據(jù)集。

本次綜述的組織如下: ? 在第二部分，我們介紹了KGs和推薦系統(tǒng)的基礎(chǔ);在第3節(jié)中，我們介紹了本文中使用的符號(hào)和概念;在第4節(jié)和第5節(jié)中，我們分別從方法和評(píng)價(jià)數(shù)據(jù)集的角度對(duì)基于知識(shí)的推薦系統(tǒng)進(jìn)行了綜述;第六部分提出了該領(lǐng)域的一些潛在研究方向;最后，我們?cè)诘?節(jié)總結(jié)了這次調(diào)查。

術(shù)語概念

圖2 常用知識(shí)圖譜集合

圖3?符號(hào)

知識(shí)圖譜推薦系統(tǒng)方法

Embedding-based方法

基于嵌入的方法通常直接使用來自KG的信息來豐富項(xiàng)目或用戶的表示。為了利用KG信息，需要使用知識(shí)圖嵌入(KGE)算法將KG編碼為低秩嵌入。KGE算法可分為兩類[98]:翻譯距離模型，如TransE[99]、TransH[100]、TransR[101]、TransD[102]等;語義匹配模型，如DistMult[103]等。

根據(jù)KG中是否包含用戶，可以將基于嵌入的方法分為兩個(gè)類。在第一種方法中，KGs由項(xiàng)目及其相關(guān)屬性構(gòu)成，這些屬性是從數(shù)據(jù)集或外部知識(shí)庫中提取的。我們將這樣的圖命名為項(xiàng)目圖。注意，用戶不包括在這樣的項(xiàng)目圖中。遵循這一策略的論文利用知識(shí)圖嵌入(KGE)算法對(duì)圖進(jìn)行編碼，以更全面地表示項(xiàng)目，然后將項(xiàng)目側(cè)信息集成到推薦框架中。其大意可以如下所示。

另一種embedding-based方法直接建立user-item圖,用戶,項(xiàng)目,以及相關(guān)屬性函數(shù)作為節(jié)點(diǎn)。在用戶-項(xiàng)目圖中，屬性級(jí)關(guān)系(品牌、類別等)和用戶級(jí)關(guān)系(共同購買、共同查看等)都是邊。

Path-based Methods

基于路徑的方法構(gòu)建一個(gè)用戶-項(xiàng)目圖，并利用圖中實(shí)體的連接模式進(jìn)行推薦。基于路徑的方法在2013年就已經(jīng)開發(fā)出來了，傳統(tǒng)的論文將這種方法稱為HIN中的推薦方法。通常，這些模型利用用戶和/或項(xiàng)的連接性相似性來增強(qiáng)推薦。

統(tǒng)一方法

基于嵌入的方法利用KG中用戶/項(xiàng)的語義表示進(jìn)行推薦，而基于路徑的方法使用語義連接信息，并且兩種方法都只利用圖中信息的一個(gè)方面。為了更好地利用KG中的信息，提出了將實(shí)體和關(guān)系的語義表示和連通性信息結(jié)合起來的統(tǒng)一方法。統(tǒng)一的方法是基于嵌入傳播的思想。這些方法以KG中的連接結(jié)構(gòu)為指導(dǎo)，對(duì)實(shí)體表示進(jìn)行細(xì)化。

總結(jié)：

基于嵌入的方法使用KGE方法對(duì)KG(項(xiàng)目圖或用戶-項(xiàng)目圖)進(jìn)行預(yù)處理，以獲得實(shí)體和關(guān)系的嵌入，并將其進(jìn)一步集成到推薦框架中。然而，這種方法忽略了圖中信息的連通性模式，很少有文獻(xiàn)能夠給出有原因的推薦結(jié)果。基于路徑的方法利用用戶-項(xiàng)圖，通過預(yù)先定義元路徑或自動(dòng)挖掘連接模式來發(fā)現(xiàn)項(xiàng)的路徑級(jí)相似性。基于路徑的方法還可以為用戶提供對(duì)結(jié)果的解釋。將基于嵌入的方法與基于路徑的方法相結(jié)合，充分利用雙方的信息是當(dāng)前的研究趨勢。此外，統(tǒng)一的方法還具有解釋推薦過程的能力。

圖4 收集論文表。在表格中，Emb代表基于嵌入的方法，Uni代表統(tǒng)一方法，Att’代表注意力機(jī)制，’RL’代表強(qiáng)化學(xué)習(xí)，’AE’代表自動(dòng)編碼器，’MF’代表矩陣分解。

代表數(shù)據(jù)集

圖5 不同應(yīng)用場景和相應(yīng)論文的數(shù)據(jù)集集合

未來方向

在以上幾節(jié)中，我們從更準(zhǔn)確的推薦和可解釋性方面展示了基于知識(shí)的推薦系統(tǒng)的優(yōu)勢。雖然已經(jīng)提出了許多利用KG作為側(cè)信息進(jìn)行推薦的新模型，但仍然存在一些改進(jìn)的機(jī)會(huì)。在這一部分中，我們概述并討論了一些未來的研究方向。

動(dòng)態(tài)推薦。雖然基于KG的推薦系統(tǒng)在GNN或GCN架構(gòu)下取得了良好的性能，但是訓(xùn)練過程是耗時(shí)的。因此，這些模型可以看作是靜態(tài)的偏好推薦。然而，在某些情況下，如網(wǎng)上購物、新聞推薦、Twitter和論壇，用戶的興趣會(huì)很快受到社會(huì)事件或朋友的影響。在這種情況下，使用靜態(tài)偏好建模的推薦可能不足以理解實(shí)時(shí)興趣。為了捕獲動(dòng)態(tài)偏好，利用動(dòng)態(tài)圖網(wǎng)絡(luò)可以是一個(gè)解決方案。最近，Song等[127]設(shè)計(jì)了一個(gè)動(dòng)態(tài)圖-注意力網(wǎng)絡(luò)，通過結(jié)合來自朋友的長期和短期興趣來捕捉用戶快速變化的興趣。按照這種方法，很自然地要集成其他類型的側(cè)信息，并構(gòu)建一個(gè)KG來進(jìn)行動(dòng)態(tài)推薦。
多任務(wù)學(xué)習(xí)。基于kg的推薦系統(tǒng)可以看作是圖中鏈接預(yù)測。因此，考慮到KG的性質(zhì)，有可能提高基于圖的推薦的性能。例如，KG中可能存在缺失的事實(shí)，從而導(dǎo)致關(guān)系或?qū)嶓w的缺失。然而，用戶的偏好可能會(huì)被忽略，因?yàn)檫@些事實(shí)是缺失的，這可能會(huì)惡化推薦結(jié)果。[70]、[95]已經(jīng)證明了聯(lián)合訓(xùn)練KG完成模塊和推薦模塊以獲得更好的推薦是有效的。其他的工作利用多任務(wù)學(xué)習(xí)，將推薦模塊與KGE ?task[45]和item relation regulation ?task聯(lián)合訓(xùn)練[73]。利用從其他kg相關(guān)任務(wù)(例如實(shí)體分類和解析)遷移知識(shí)來獲得更好的推薦性能，這是很有趣的。
跨域推薦。最近，關(guān)于跨域推薦的研究已經(jīng)出現(xiàn)。其動(dòng)機(jī)是跨域的交互數(shù)據(jù)不相等。例如，在Amazon平臺(tái)上，圖書評(píng)級(jí)比其他域更密集。使用遷移學(xué)習(xí)技術(shù)，可以共享來自具有相對(duì)豐富數(shù)據(jù)的源域的交互數(shù)據(jù)，以便在目標(biāo)域內(nèi)進(jìn)行更好的推薦。Zhang等[128]提出了一種基于矩陣的跨域推薦方法。后來，Zhao等人[129]引入了PPGN，將來自不同領(lǐng)域的用戶和產(chǎn)品放在一個(gè)圖中，并利用user ?item交互圖進(jìn)行跨領(lǐng)域推薦。雖然PPGN的性能顯著優(yōu)于SOTA，但是user ?item圖只包含交互關(guān)系，并不考慮用戶和項(xiàng)目之間的其他關(guān)系。通過將不同類型的用戶和項(xiàng)目端信息合并到用戶-項(xiàng)目交互圖中，以獲得更好的跨域推薦性能。
知識(shí)增強(qiáng)語言表示。為了提高各種自然語言處理任務(wù)的性能，有將外部知識(shí)集成到語言表示模型中的趨勢。知識(shí)表示和文本表示可以相互細(xì)化。例如，Chen等人[130]提出了短文本分類的STCKA，利用來自KGs(如YAGO)的先驗(yàn)知識(shí)，豐富了短文本的語義表征。Zhang等人[131]提出了ERNIE，該方法融合了Wikidata的知識(shí)，增強(qiáng)了語言的表示能力，該方法已被證明在關(guān)系分類任務(wù)中是有效的。雖然DKN模型[48]既利用了文本嵌入，也利用了新聞中的實(shí)體嵌入，但這兩種嵌入方式只是簡單地串聯(lián)起來，得到新聞的最終表現(xiàn)形式，而沒有考慮兩個(gè)向量之間的信息融合。因此，將知識(shí)增強(qiáng)的文本表示策略應(yīng)用于新聞推薦任務(wù)和其他基于文本的推薦任務(wù)中，能夠更好地表示學(xué)習(xí)，從而獲得更準(zhǔn)確的推薦結(jié)果，是很有前景的。
知識(shí)圖譜嵌入方法。基于不同約束條件的KGE方法有兩種:翻譯距離模型和語義匹配模型。在本次綜述中，這兩種類型的KGE方法被用于三種基于KGE的推薦系統(tǒng)和推薦任務(wù)中。但是，還沒有全面的工作建議在什么情況下，包括數(shù)據(jù)源、推薦場景和模型架構(gòu)，應(yīng)該采用特定的KGE方法。因此，另一個(gè)研究方向是比較不同KGE方法在不同條件下的優(yōu)勢。
用戶端信息。目前，大多數(shù)基于KG的推薦系統(tǒng)都是通過合并項(xiàng)目側(cè)信息來構(gòu)建圖的，而很少有模型考慮用戶側(cè)信息。然而，用戶側(cè)信息，如用戶網(wǎng)絡(luò)和用戶的人口統(tǒng)計(jì)信息，也可以很自然地集成到當(dāng)前基于KGbased的推薦系統(tǒng)框架中。最近，Fan等人[132]使用GNN分別表示用戶-用戶社交網(wǎng)絡(luò)和用戶-項(xiàng)目交互圖，該方法在用戶社交信息方面優(yōu)于傳統(tǒng)的基于cf的推薦系統(tǒng)。在我們最近的調(diào)查[96]中，一篇論文將用戶關(guān)系整合到圖表中，并展示了這種策略的有效性。因此，在KG中考慮用戶側(cè)信息可能是另一個(gè)研究方向。

OpenKG

開放知識(shí)圖譜（簡稱 OpenKG）旨在促進(jìn)中文知識(shí)圖譜數(shù)據(jù)的開放與互聯(lián)，促進(jìn)知識(shí)圖譜和語義技術(shù)的普及和廣泛應(yīng)用。

點(diǎn)擊閱讀原文，進(jìn)入 OpenKG 博客。

總結(jié)

以上是生活随笔為你收集整理的论文浅尝 | 中科院百度微软等学者最新综述论文40+最新方法阐述知识图谱提升推荐系统准确性与可解释性...的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：参加完阿里蚂蚁金服Java中间件6轮面试
下一篇：会议交流 | 如何提升推荐系统的可解释性

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

windows

论文浅尝 | 中科院百度微软等学者最新综述论文40+最新方法阐述知识图谱提升推荐系统准确性与可解释性...

總結(jié)