GCN-Based User Representation Learning for Unifying Robust Recommendation and Fraudster Detection
GCN-Based User Representation Learning for Unifying Robust
Recommendation and Fraudster Detection
點(diǎn)擊率預(yù)測(cè):其主要思想是根據(jù)用戶(hù)的歷史行為對(duì)一組未評(píng)級(jí)的項(xiàng)目進(jìn)行評(píng)級(jí)預(yù)測(cè),然后從預(yù)測(cè)評(píng)級(jí)最高的項(xiàng)目中選擇個(gè)性化推薦。
欺詐檢測(cè):推薦系統(tǒng)的評(píng)論評(píng)級(jí)數(shù)據(jù)通常來(lái)自于開(kāi)放平臺(tái),這可能會(huì)吸引一群惡意用戶(hù)故意插入虛假反饋,使推薦系統(tǒng)偏向于自己。(此類(lèi)攻擊的出現(xiàn)可能會(huì)違反建模假設(shè),即高質(zhì)量的數(shù)據(jù)總是可用的,這些數(shù)據(jù)真實(shí)地反映了用戶(hù)的興趣和偏好。)
GCN:圖卷積神經(jīng)網(wǎng)絡(luò),用來(lái)做推薦任務(wù),可以很好的利用rating圖的局部結(jié)構(gòu)信息和用戶(hù)本身的信息來(lái)學(xué)習(xí)用戶(hù)的表示。
NRF:神經(jīng)隨機(jī)森林,用來(lái)做異常檢測(cè)任務(wù),NRF是一個(gè)很好的分類(lèi)器。
在其端到端學(xué)習(xí)過(guò)程中,用戶(hù)在欺詐者檢測(cè)組件中被識(shí)別為欺詐者的概率自動(dòng)決定該用戶(hù)的評(píng)級(jí)數(shù)據(jù)在推薦組件中的貢獻(xiàn);而在推薦分量中輸出的預(yù)測(cè)誤差是欺騙者檢測(cè)分量中的一個(gè)重要特征。因此,這兩個(gè)組成部分可以相互增強(qiáng)。
item表示的學(xué)習(xí):
user,item 二部圖
zv: item emb 隨機(jī)初始化 (user emb 不是隨機(jī),而是根據(jù)特征初始化)
er: rating emb
‘+’ : concatenation
g : MLP
wb:參數(shù)
6 : relu激活函數(shù)
agg: 整合函數(shù),最簡(jiǎn)單的比如求平均,這里使用attentaion機(jī)制
user表示的學(xué)習(xí):
zu: user emb ,根據(jù)特征初始化
g‘:l - lyear MLP
r: user 對(duì) item 的評(píng)分
在異常檢測(cè)的時(shí)候,加入error u 的原因:認(rèn)為正常用戶(hù)是更加穩(wěn)定和可預(yù)測(cè)的,異常用戶(hù)的預(yù)測(cè)誤差會(huì)更大。所以error就可以給異常檢測(cè)提供一個(gè)強(qiáng)有力的信號(hào)。
zu*: dence emb , NRF的輸入
決策節(jié)點(diǎn)d:有一個(gè)決策函數(shù)fd,決定接收到的input zu將被轉(zhuǎn)發(fā)到左子樹(shù)還是右子樹(shù)
葉節(jié)點(diǎn)p:預(yù)測(cè)節(jié)點(diǎn)節(jié)點(diǎn),遵循概率分布 p
有o個(gè)決策樹(shù),每個(gè)決策樹(shù)都是標(biāo)準(zhǔn)的二叉樹(shù)
點(diǎn)擊預(yù)測(cè):加入了異常概率作為權(quán)重
異常檢測(cè):user emb 加入了誤差信息
聯(lián)合訓(xùn)練:超參數(shù)平衡兩個(gè)任務(wù)權(quán)重
總結(jié)
以上是生活随笔為你收集整理的GCN-Based User Representation Learning for Unifying Robust Recommendation and Fraudster Detection的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: KerasSeq2seqGenerati
- 下一篇: 知识图谱之语言计算与信息抽取