论文浅尝 | DSKReG:基于关系GNN的推荐知识图谱可微抽样
筆記整理:李爽,天津大學(xué)碩士
鏈接:https://dl.acm.org/doi/pdf/10.1145/3459637.3482092
動(dòng)機(jī)
在信息爆炸的時(shí)代,推薦系統(tǒng)被廣泛研究和應(yīng)用,以發(fā)現(xiàn)用戶的偏好信息。RS在冷啟動(dòng)時(shí)性能較差,如果將知識(shí)圖譜(Knowledge graph, KG)作為輔助信息,可以緩解冷啟動(dòng)問(wèn)題。然而,現(xiàn)有的研究大多忽略了KGs中的節(jié)點(diǎn)度是偏移的,并且在KGs中的大量交互是推薦不相關(guān)的。為了解決這些問(wèn)題,本文提出了基于關(guān)系GNN的推薦知識(shí)圖譜可微抽樣(DSKReG),該方法從KGs中學(xué)習(xí)連通項(xiàng)的相關(guān)分布,并根據(jù)該分布選取適合推薦的項(xiàng)目。作者設(shè)計(jì)了一種可微抽樣策略,使相關(guān)項(xiàng)目的選擇與模型訓(xùn)練過(guò)程共同優(yōu)化。實(shí)驗(yàn)結(jié)果表明,該模型的性能優(yōu)于目前最先進(jìn)的基于KG的推薦系統(tǒng)。
亮點(diǎn)
DSKReG的亮點(diǎn)主要包括:
1.根據(jù)關(guān)聯(lián)關(guān)系和項(xiàng)目類型計(jì)算相關(guān)分?jǐn)?shù)進(jìn)行抽樣,可以引導(dǎo)模型選擇推薦相關(guān)的項(xiàng)目;2.設(shè)計(jì)一種可微抽樣策略,使得模型在優(yōu)化的同時(shí)細(xì)化抽樣過(guò)程。
概念及模型
模型的整體框架如下圖所示。
?問(wèn)題定義
知識(shí)感知推薦的目標(biāo)是預(yù)測(cè)用戶u是否對(duì)給定歷史交互和KG的項(xiàng)目v有興趣。在形式上,用戶U與項(xiàng)目V的歷史交互被表示為用戶-項(xiàng)目二部圖 。KG包含與項(xiàng)目相關(guān)的屬性,如電影的類型、導(dǎo)演和演員。作者將KG格式化為有向異構(gòu)圖,例如(James Cameron, isdirectorof, Titanic),其中E和R分別表示實(shí)體和關(guān)系的集合。因此,知識(shí)感知的推薦任務(wù)可以形式化為:
?關(guān)系的鄰居構(gòu)建
節(jié)點(diǎn)度偏度限制了KG中稀疏連接的節(jié)點(diǎn)的可用鄰居項(xiàng)目池。作者提出了“協(xié)同交互”模式來(lái)建立高階項(xiàng)目與項(xiàng)目之間的關(guān)系,從而縮短相關(guān)項(xiàng)目之間的路徑距離。從輸入KG ??中提取協(xié)同交互模式,構(gòu)造一個(gè)具有新的協(xié)同關(guān)系集的項(xiàng)目-項(xiàng)目協(xié)同交互無(wú)向圖??,其定義如下:
在這些關(guān)系的訪問(wèn)之后,將具有協(xié)同交互模式的項(xiàng)目連接起來(lái),并構(gòu)造如框架圖(a)所示的項(xiàng)目-項(xiàng)目圖。這樣可以直接連接高階鄰域,避免接收域的指數(shù)增長(zhǎng)。將用戶-項(xiàng)目二部圖??和項(xiàng)目-項(xiàng)目協(xié)同交互圖??統(tǒng)一為一個(gè)關(guān)系圖。
?可微的抽樣
引入可微抽樣的鄰居選擇。交互關(guān)系對(duì)推薦的相關(guān)性因用戶而異,并且交互關(guān)系是不平衡的。這就帶來(lái)了一個(gè)問(wèn)題:當(dāng)潛在鄰居池很大時(shí),高度相關(guān)的鄰居就會(huì)減少。為了過(guò)濾噪聲,保留真正的相關(guān)信息,作者引入關(guān)系感知采樣方法,從關(guān)系的角度分配權(quán)重。抽樣過(guò)程首先為每個(gè)項(xiàng)目定義一種新的關(guān)系感知的相關(guān)性得分分布,然后對(duì)其進(jìn)行抽樣。項(xiàng)目i的關(guān)系感知相關(guān)性分?jǐn)?shù)分布??定義如下:
關(guān)聯(lián)項(xiàng)和鄰接項(xiàng)共同決定了其鄰接相關(guān)概率,強(qiáng)調(diào)了抽樣相關(guān)計(jì)算中關(guān)系感知的必要性。
考慮到計(jì)算出的相關(guān)性分布,只選擇top-k最相關(guān)的項(xiàng)。為了使該過(guò)程具有可微性并與優(yōu)化過(guò)程相結(jié)合,應(yīng)用Gumbel-Softmax重參數(shù)化技巧:
?偏好感知聚合
在top-k鄰居消息傳播過(guò)程中,除了考慮關(guān)系因素外,還應(yīng)考慮用戶偏好。由于用戶可能對(duì)各種關(guān)系有不同的偏好,所以在聚合中考慮這些關(guān)系。項(xiàng)目i的嵌入如下:
?預(yù)測(cè)和優(yōu)化
使用點(diǎn)積生成用戶u對(duì)項(xiàng)目i的偏好分?jǐn)?shù),并推斷出用戶/項(xiàng)目嵌入分別為??和??。預(yù)測(cè)計(jì)算如下:
使用成對(duì)BPR損失優(yōu)化top-N推薦:
理論分析
實(shí)驗(yàn)
作者在三個(gè)基準(zhǔn)數(shù)據(jù)集Last.FM, BookCrossing和MovieLens-Sub上進(jìn)行了實(shí)驗(yàn)。為了評(píng)估top-N推薦和偏好排名的性能,使用三個(gè)標(biāo)準(zhǔn)指標(biāo):Recall, Precision和NDCG。分別計(jì)算前5項(xiàng)、前10項(xiàng)和前20項(xiàng)的Recall、Precision和NDCG。
如上表所示,本文的模型DSKReG在大多數(shù)情況下顯著優(yōu)于最先進(jìn)的方法。與最強(qiáng)的基線模型相比,DSKReG模型在Last.FM上對(duì)于Recall、Precision和NDCG平均分別提高了7.73%、6.2%和9.03%的性能。同樣,在BookCrossing上的表現(xiàn)比最佳基線模型高出9.43%、4.97%和19.83%。在MovieLens-Sub數(shù)據(jù)集上,分別提高了11.47%、15.60%和45.47%的性能。這些結(jié)果表明了模型的有效性。令人驚訝的是,DSKReG模型顯著提高了NDCG。其中,NDCG@20在三個(gè)數(shù)據(jù)集上分別提高了14.2%、32.0%和37.5%。由于NDCG考慮了位置重要性和項(xiàng)目數(shù)來(lái)衡量推薦質(zhì)量,這些結(jié)果顯示了DSKReG模型在推薦方面的優(yōu)越性。
作者還做了幾個(gè)消融實(shí)驗(yàn)。
1、關(guān)系感知抽樣的效果
實(shí)驗(yàn)結(jié)果如圖2所示,結(jié)果表明,在Last.FM和MovieLens-Sub上GS的性能優(yōu)于其他抽樣方法。在BookCrossing上,使用L2距離和內(nèi)積度量的方法可以獲得與GS類似的結(jié)果。原因可能是這個(gè)數(shù)據(jù)集中的項(xiàng)目之間的關(guān)系相對(duì)簡(jiǎn)單,L2距離和內(nèi)積度量足以建模項(xiàng)目關(guān)系。然而,在處理復(fù)雜的物品關(guān)系方面,GS明顯優(yōu)于其他指標(biāo)。
2、抽樣規(guī)模的影響
為了檢驗(yàn)鄰域大小的有效性,作者使用不同的K進(jìn)行實(shí)驗(yàn),K是采樣后鄰域的大小。如圖3所示,Last.FM、BookCrossing和MovieLens-Sub的最佳鄰居大小是8。這表明只有一小部分項(xiàng)目是相關(guān)的。本文的模型可以為聚合選擇有價(jià)值的信息,使得模型在只有8個(gè)鄰居的情況下獲得最佳性能。
總結(jié)
文章提出了一種新的框架DSKReG來(lái)緩解基于KG的推薦節(jié)點(diǎn)度偏移和干擾交互的限制。DSKReG是一種基于采樣的關(guān)系GNN,它從KGs中提取與推薦相關(guān)的信息。作者設(shè)計(jì)了一種可微分的DSKReG采樣策略,并與模型共同優(yōu)化,學(xué)習(xí)如何選擇top-k相關(guān)項(xiàng)目進(jìn)行聚合。作者在三個(gè)公共數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),驗(yàn)證了DSKReG在提高推薦性能方面的有效性。
OpenKG
OpenKG(中文開(kāi)放知識(shí)圖譜)旨在推動(dòng)以中文為核心的知識(shí)圖譜數(shù)據(jù)的開(kāi)放、互聯(lián)及眾包,并促進(jìn)知識(shí)圖譜算法、工具及平臺(tái)的開(kāi)源開(kāi)放。
點(diǎn)擊閱讀原文,進(jìn)入 OpenKG 網(wǎng)站。
總結(jié)
以上是生活随笔為你收集整理的论文浅尝 | DSKReG:基于关系GNN的推荐知识图谱可微抽样的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 综述 | 事件抽取及推理 (上)
- 下一篇: 论文浅尝 | 知识库问答中关系检测的学习