日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > windows >内容正文

windows

推荐系统--矩阵分解(4)

發布時間:2024/8/23 windows 34 豆豆
生活随笔 收集整理的這篇文章主要介紹了 推荐系统--矩阵分解(4) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

推薦系統–矩陣分解(1)
推薦系統–矩陣分解(2)
推薦系統–矩陣分解(3)
推薦系統–矩陣分解(4)
推薦系統–矩陣分解(5)
推薦系統–矩陣分解(6)

7 基于情感分析的矩陣分解

7.1 引入

【摘要】推薦系統旨在基于豐富的信息預測用戶的偏好,例如用戶評分、人口統計和評論。 盡管評論比評級更稀疏,但它們提供了有關用戶真實偏好的更詳細和可靠的信息。 目前,評論通常用于提高推薦系統的可解釋性。 在本文中,我們提出了基于情感的具有可靠性的矩陣分解(SBMF+R)算法來利用評論進行預測。 首先,我們開發了一種情感分析方法,使用一種新的基于星的字典構建技術來獲得情感分數。 其次,我們設計了一個結合用戶一致性和評論反饋的用戶可靠性度量。 第三,我們將用戶評分、評論和反饋納入概率矩陣分解框架進行預測。 對八個亞馬遜數據集的實驗表明,SBMF+R 比最先進的算法更準確。

核心思想:分析發現,用戶評論和用戶評分存在一定的偏差(圖1所示),為此我們將用戶評論轉換為情感分數,將用戶評分、評論和反饋納入概率矩陣分解框架進行預測。

7.2 評論的情感分析

在第一階段,我們從評論文本構建基于星級的情感詞典。 表 2 顯示了從基于星的字典中選擇的一些具有情感分數的單詞。 基于星級的意思是我們在情感詞的分類中考慮評分星級。 我們的直覺是 5 星的評論主要傳達積極的情緒,反之亦然。
因此,評論中的關鍵詞應該符合評論的整體情緒。 我們設計了兩種構建字典的技術。 大多數現有的情感詞典只用二個值(正或負)標記單詞。 我們根據不同的情緒強度分配不同的分數以獲得更準確的結果。 同一個詞可以對不同類別的產品表達不同的情感。 因此,我們為每個類別構建了一個不同的字典來緩解這個問題。

否定可用于拒絕或拒絕語句。 我們考慮兩種類型的否定反轉來檢查是否應該調整情緒分數。 一種否定完全顛倒了情緒的極性。 例如,如果我們假設“舒適”的分數是+1,那么“不舒服”的分數就反轉為-1。 另一種類型的否定是非常積極(否定)的形容詞,它稍微顛倒了極性。 例如,如果我們假設“優秀”的分數是+2,那么“不優秀”的分數乘以-0.5 到1。
情態是在句子中嵌入可能性、必要性或能力的語法表達。 它通過情態動詞如“maybe”、“certainly”和“may”在語法上表達。 我們采用并考慮減弱情感強度的情態動詞的方法。 因此,出現在情態范圍內的情感詞乘以0.5以抑制其強度。
表 3 顯示了否定和模態操作后的最終情緒分數。

7.3 SBMF

考慮情感分數的矩陣分解優化目標函數為:

L(θ)=∑u,iIui[(rui?puTqi)2]+∑u,iIui[(Sui?puTqi)2]+λ(∥pu∥F2+∥qi∥F2)L(\theta)=\sum_{u, i} I_{u i}\left[\left(r_{u i}-p_{u}^{T} q_{i}\right)^{2}\right]+\sum_{u, i} I_{ui}\left[\left(S_{ui}-p_{u}^{T} q_{i}\right)^{2}\right]+\lambda(\|p_u\|_{F}^{2}+\|q_i\|_{F}^{2})L(θ)=u,i?Iui?[(rui??puT?qi?)2]+u,i?Iui?[(Sui??puT?qi?)2]+λ(pu?F2?+qi?F2?)
注意:為了保持上下文符號統一,圖中的SijS_{ij}Sij?在公式中用SuiS_{ui}Sui?替換了。

7.4 SBMF+R


只有少數作者討論了評分或評論在預測任務中是否更可靠。 我們同時考慮用戶一致性和評論反饋作為可靠性衡量標準。 然后我們計算每個評級的可靠性度量,為它們分配個性化的權重。
我們將用戶uuu 的評分向量表示為 ru=[ru1,…,run]r_u = [r_{u1}, \dots, r_{un}]ru?=[ru1?,,run?]。 設 Su=[Su1,…,Sun]S_u = [S_{u1}, \dots, S_{un}]Su?=[Su1?,,Sun?] 是我們使用情感分析計算的用戶情感得分向量。 用戶uuu 的一致性定義為用戶評分向量與用戶情感得分向量之間的歐氏距離 CuC_uCu?。 評分和評論之間的距離越大,用戶的一致性越低。 用戶一致性定義為
Cu=∑i=1n(Rui?Sui)2C_{u}=\sqrt{\sum_{i=1}^{n}\left(R_{ui}-S_{ui}\right)^{2}} Cu?=i=1n?(Rui??Sui?)2?
除了用戶一致性之外,我們還會考慮每條評論的有用性。 大多數電子商務網站都允許用戶以贊成或反對的方式提供評論反饋。 此反饋被視為評論的有用性,反映了評論的真實性。 因此,我們使用正面反饋作為評論的有用性。 一些研究人員提出自動評估每個評論的反饋。讓 FuiF_{ui}Fui?FuiPF_{ui}^PFuiP?表示用戶 uuu對項目 tit_iti?評論的總票數和正面票數。 然后,評論HuiH_{ui}Hui?的有用性由下式給出:
Hui=FuiP/FuiH_{ui}=F_{ui}^{P} / F_{ui} Hui?=FuiP?/Fui?
WuiW_{ui}Wui? 表示用戶uuu對項目tit_iti?的評論的可靠性。 那么評分ruir_{ui}rui? 的可靠性因子為:
Wui=Hui1?CuW_{ui}=\frac{H_{ui}}{1-C_{u}} Wui?=1?Cu?Hui??
類似地,情感得分SuiS_{ui}Sui?的可靠性因子是 1?Wui1 ? W_{ui}1?Wui?。 我們將可靠性區間歸一化為 [0, 1]。 使用可靠性估計,我們最終獲得每個評級的個性化權重。
我們根據其可靠性為評分和評論分配不同的權重。 計算可靠性因子 WuiW_{ui}Wui? 后,誤差平方和目標函數由下式給出:
L(θ)=∑u,iIui[Wui(rui?puTqi)2]+∑u,iIui[(1?Wui)(Sui?puTqi)2]+λ(∥pu∥F2+∥qi∥F2)\begin{aligned} L(\theta)=&\sum_{u, i} I_{u i}\left[W_{ui}\left(r_{u i}-p_{u}^{T} q_{i}\right)^{2}\right] \\ &+\sum_{u, i} I_{ui}\left[(1-W_{ui})\left(S_{ui}-p_{u}^{T} q_{i}\right)^{2}\right]+\lambda(\|p_u\|_{F}^{2}+\|q_i\|_{F}^{2}) \end{aligned} L(θ)=?u,i?Iui?[Wui?(rui??puT?qi?)2]+u,i?Iui?[(1?Wui?)(Sui??puT?qi?)2]+λ(pu?F2?+qi?F2?)?

參考文獻

Sentiment based matrix factorization with reliability for recommendation

總結

以上是生活随笔為你收集整理的推荐系统--矩阵分解(4)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。