當(dāng)前位置：首頁 > 运维知识 > windows >内容正文

windows

推荐系统--矩阵分解(4)

發(fā)布時間：2024/8/23 windows 39 豆豆

生活随笔收集整理的這篇文章主要介紹了推荐系统--矩阵分解(4) 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

推薦系統(tǒng)–矩陣分解(1)
推薦系統(tǒng)–矩陣分解(2)
推薦系統(tǒng)–矩陣分解(3)
推薦系統(tǒng)–矩陣分解(4)
推薦系統(tǒng)–矩陣分解(5)
推薦系統(tǒng)–矩陣分解(6)

7 基于情感分析的矩陣分解

7.1 引入

【摘要】推薦系統(tǒng)旨在基于豐富的信息預(yù)測用戶的偏好，例如用戶評分、人口統(tǒng)計(jì)和評論。盡管評論比評級更稀疏，但它們提供了有關(guān)用戶真實(shí)偏好的更詳細(xì)和可靠的信息。目前，評論通常用于提高推薦系統(tǒng)的可解釋性。在本文中，我們提出了基于情感的具有可靠性的矩陣分解（SBMF+R）算法來利用評論進(jìn)行預(yù)測。首先，我們開發(fā)了一種情感分析方法，使用一種新的基于星的字典構(gòu)建技術(shù)來獲得情感分?jǐn)?shù)。其次，我們設(shè)計(jì)了一個結(jié)合用戶一致性和評論反饋的用戶可靠性度量。第三，我們將用戶評分、評論和反饋納入概率矩陣分解框架進(jìn)行預(yù)測。對八個亞馬遜數(shù)據(jù)集的實(shí)驗(yàn)表明，SBMF+R 比最先進(jìn)的算法更準(zhǔn)確。

核心思想：分析發(fā)現(xiàn)，用戶評論和用戶評分存在一定的偏差（圖1所示），為此我們將用戶評論轉(zhuǎn)換為情感分?jǐn)?shù)，將用戶評分、評論和反饋納入概率矩陣分解框架進(jìn)行預(yù)測。

7.2 評論的情感分析

在第一階段，我們從評論文本構(gòu)建基于星級的情感詞典。表 2 顯示了從基于星的字典中選擇的一些具有情感分?jǐn)?shù)的單詞。基于星級的意思是我們在情感詞的分類中考慮評分星級。我們的直覺是 5 星的評論主要傳達(dá)積極的情緒，反之亦然。
因此，評論中的關(guān)鍵詞應(yīng)該符合評論的整體情緒。我們設(shè)計(jì)了兩種構(gòu)建字典的技術(shù)。大多數(shù)現(xiàn)有的情感詞典只用二個值（正或負(fù)）標(biāo)記單詞。我們根據(jù)不同的情緒強(qiáng)度分配不同的分?jǐn)?shù)以獲得更準(zhǔn)確的結(jié)果。同一個詞可以對不同類別的產(chǎn)品表達(dá)不同的情感。因此，我們?yōu)槊總€類別構(gòu)建了一個不同的字典來緩解這個問題。

否定可用于拒絕或拒絕語句。我們考慮兩種類型的否定反轉(zhuǎn)來檢查是否應(yīng)該調(diào)整情緒分?jǐn)?shù)。一種否定完全顛倒了情緒的極性。例如，如果我們假設(shè)“舒適”的分?jǐn)?shù)是+1，那么“不舒服”的分?jǐn)?shù)就反轉(zhuǎn)為-1。另一種類型的否定是非常積極（否定）的形容詞，它稍微顛倒了極性。例如，如果我們假設(shè)“優(yōu)秀”的分?jǐn)?shù)是+2，那么“不優(yōu)秀”的分?jǐn)?shù)乘以-0.5 到1。
情態(tài)是在句子中嵌入可能性、必要性或能力的語法表達(dá)。它通過情態(tài)動詞如“maybe”、“certainly”和“may”在語法上表達(dá)。我們采用并考慮減弱情感強(qiáng)度的情態(tài)動詞的方法。因此，出現(xiàn)在情態(tài)范圍內(nèi)的情感詞乘以0.5以抑制其強(qiáng)度。
表 3 顯示了否定和模態(tài)操作后的最終情緒分?jǐn)?shù)。

7.3 SBMF

考慮情感分?jǐn)?shù)的矩陣分解優(yōu)化目標(biāo)函數(shù)為：

$L(θ)=∑u,iIui[(rui?puTqi)2]+∑u,iIui[(Sui?puTqi)2]+λ(∥pu∥F2+∥qi∥F2)L(\theta)=\sum_{u, i} I_{u i}\left[\left(r_{u i}-p_{u}^{T} q_{i}\right)^{2}\right]+\sum_{u, i} I_{ui}\left[\left(S_{ui}-p_{u}^{T} q_{i}\right)^{2}\right]+\lambda(\|p_u\|_{F}^{2}+\|q_i\|_{F}^{2})$
注意：為了保持上下文符號統(tǒng)一，圖中的 $S_{ij}$ 在公式中用 $S_{ui}$ 替換了。

7.4 SBMF+R

只有少數(shù)作者討論了評分或評論在預(yù)測任務(wù)中是否更可靠。我們同時考慮用戶一致性和評論反饋?zhàn)鳛榭煽啃院饬繕?biāo)準(zhǔn)。然后我們計(jì)算每個評級的可靠性度量，為它們分配個性化的權(quán)重。
我們將用戶 $u$ 的評分向量表示為 $ru=[ru1,…,run]r_u = [r_{u1}, \dots, r_{un}]$ 。設(shè) $Su=[Su1,…,Sun]S_u = [S_{u1}, \dots, S_{un}]$ 是我們使用情感分析計(jì)算的用戶情感得分向量。用戶 $u$ 的一致性定義為用戶評分向量與用戶情感得分向量之間的歐氏距離 $C_u$ 。評分和評論之間的距離越大，用戶的一致性越低。用戶一致性定義為
$Cu=∑i=1n(Rui?Sui)2C_{u}=\sqrt{\sum_{i=1}^{n}\left(R_{ui}-S_{ui}\right)^{2}}$
除了用戶一致性之外，我們還會考慮每條評論的有用性。大多數(shù)電子商務(wù)網(wǎng)站都允許用戶以贊成或反對的方式提供評論反饋。此反饋被視為評論的有用性，反映了評論的真實(shí)性。因此，我們使用正面反饋?zhàn)鳛樵u論的有用性。一些研究人員提出自動評估每個評論的反饋。讓 $F_{ui}$ 和 $F_{ui}^P$ 表示用戶 $u$ 對項(xiàng)目 $t_i$ 評論的總票數(shù)和正面票數(shù)。然后，評論 $H_{ui}$ 的有用性由下式給出：
$H_{ui}=F_{ui}^{P} / F_{ui}$
讓 $W_{ui}$ 表示用戶 $u$ 對項(xiàng)目 $t_i$ 的評論的可靠性。那么評分 $r_{ui}$ 的可靠性因子為：
$Wui=Hui1?CuW_{ui}=\frac{H_{ui}}{1-C_{u}}$
類似地，情感得分 $S_{ui}$ 的可靠性因子是 $1 ? W_{ui}$ 。我們將可靠性區(qū)間歸一化為 [0, 1]。使用可靠性估計(jì)，我們最終獲得每個評級的個性化權(quán)重。
我們根據(jù)其可靠性為評分和評論分配不同的權(quán)重。計(jì)算可靠性因子 $W_{ui}$ 后，誤差平方和目標(biāo)函數(shù)由下式給出：
$L(θ)=∑u,iIui[Wui(rui?puTqi)2]+∑u,iIui[(1?Wui)(Sui?puTqi)2]+λ(∥pu∥F2+∥qi∥F2)\begin{aligned} L(\theta)=&\sum_{u, i} I_{u i}\left[W_{ui}\left(r_{u i}-p_{u}^{T} q_{i}\right)^{2}\right] \\ &+\sum_{u, i} I_{ui}\left[(1-W_{ui})\left(S_{ui}-p_{u}^{T} q_{i}\right)^{2}\right]+\lambda(\|p_u\|_{F}^{2}+\|q_i\|_{F}^{2}) \end{aligned}$

參考文獻(xiàn)

Sentiment based matrix factorization with reliability for recommendation

總結(jié)

以上是生活随笔為你收集整理的推荐系统--矩阵分解(4)的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： java对象与c网络语言通信,JAVA与
下一篇： 2021年第3周推荐系统方向的周报