【论文阅读】A social recommender system using item asymmetric correlation
Abstract
推薦系統在近幾年極大突出的信息篩選技術之一,然而,有兩個主要的問題:
- 數據稀疏:數據太稀疏了,沒辦法操作
- 冷開始:一開始數據不多(或者),推薦效果不好或無法進行
有一類系統,叫做社會推薦系統被提出,可以有效地解決數據稀疏度和冷開始的問題。
給定一個社會關系并不是在每一個推薦系統都是可行的,這個隱含的在物品之間的關系算的上是一個代替限制的一個比較好的選擇。
在這篇paper中,作者發現了將隱含的物品之間的關系矩陣和用戶-物品矩陣結合起來,在提高推薦系統的精度上的比較好的效果。
- IAC(Item Asysmmetric Correlation)方法,通過考慮一個非對稱的關系矩陣,檢測在每對物品之間的隱含的關系。
- 兩個數據集類型,IAC的輸出和用戶-物品矩陣,被融入在協同過濾之中(通過Matrix Factorization MF技術)。
這個技術在處理稀疏矩陣上表現不錯。
Introduction
社會信息逐漸變多,讓用戶越來越難尋找到想要的東西,所以需要有推薦系統來提高用戶的滿意度并留住客戶。
推薦系統遇到了很多問題。隨著用戶數量的增加和越來越多的商品種類,使得存在有很多問題,例如:
- 數據稀疏
- 冷開始
- Cold start is the inability of the system to deal with new users or new items due to the lack of prior knowledge.
- 其實new-item的冷開始還好解決,畢竟商家都想賣出自己的商品,所以這個profile應該是很好建立的。主要是用戶側的冷開始問題,其實用戶一般不是很愿意添麻煩在買商品前去填寫個人的profile。
Therefore, addresssing these issues is crucial for any recommender system to make accurate recommendations.
Introduction to matrix factorization
Matrix factorization 是一個線性代數方式,通過因子去分解矩陣,使得變成一個更低維度的矩陣。
Rn?mR_{n*m}Rn?m?是用戶產品矩陣。中間再添加一個新的維度。使得
Rn?m=Pf?nT?Qf?mR_{n*m} = P^{T}_{f*n} * Q _{f*m}Rn?m?=Pf?nT??Qf?m?
其中,fff比min(n,m)min(n,m)min(n,m)要小。
這個分解其實很容易理解。
- 就是說,每個人喜歡了這些東西,在本質上映射到一個空間上,其實就是喜歡某些特征,這里假設為f。
- 然后,這里我們就直接量化每個人對于這些特征的喜好程度
- 同時,我們考量每個物品在這些特征上具有的分布情況,即可完成。
The pu∈Pp_u \in Ppu?∈P measures the extent of user’s interest in items that are high on the corresponding factors.
問題是這個分解emmm
一般來說,我們完成這個分解,會需要考慮這樣的一個目標函數
min?l(R,P,Q)=∑u=1n∑i=1m(rui?puTqi)2+λ(∣∣pu∣∣F2+∣∣qi∣∣F2)\min{l(R,P,Q)} = \sum_{u=1}^{n}{\sum_{i=1}^{m}{(r_{ui}-p^T_uq_i)^2+\lambda(||p_u||^2_F+||q_i||^2_F)}}minl(R,P,Q)=u=1∑n?i=1∑m?(rui??puT?qi?)2+λ(∣∣pu?∣∣F2?+∣∣qi?∣∣F2?)
The Frobenius norm, sometimes also called the Euclidean norm (a term unfortunately also used for the vector L^2-norm), is matrix norm of an m×n matrix A defined as the square root of the sum of the absolute squares of its elements1
其中這個矩陣范數,用的是Frobenius norm
∣∣A∣∣F=∑u=1n∑i=1m(Aij)2||A||_F = \sqrt{\sum_{u=1}^{n}{\sum_{i=1}^{m}{(A_{ij})^2}}}∣∣A∣∣F?=u=1∑n?i=1∑m?(Aij?)2?
有兩個經典辦法可以算出這個P和Q
- SGD
- ALS
SGD
ALS
- 很明顯,這個r在兩個不同的等式上對應的維度不一樣。
- 第一個 對應用戶
- 第二個 對應商品
明顯SGD只需要O(f)O(f)O(f)的計算,ALS需要有O(f3)O(f^3)O(f3),但是SGD需要有更多的周期,才能達到ALS類似的效果。
The devised approach
- U 用戶集合
- I 商品集合
- R: U-I matrix。0或者正
Item asymmetric correlation IAC
- 很明顯,前半部分,就是CosSim(余弦相似度),后面乘的部分是對這個觀測的長度的的考量。而這個部分,前一部分是非對稱的結構,后一部分任然屬于對稱的結構。
- 后一部分的 對稱結構的 部分,可以用于比較不同item組之間的相似度問題。
這里的IAC會構建矩陣SSS,
這樣,就需要解決這個目標函數就好了。
之后的結果跟傳統的是一樣的。
只需要在之后得到兩個向量之后,做一個乘積就知道了結果了。
http://mathworld.wolfram.com/FrobeniusNorm.html ??
總結
以上是生活随笔為你收集整理的【论文阅读】A social recommender system using item asymmetric correlation的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: LVQ模型Python实现
- 下一篇: 【论文阅读】Clustering by