推荐系统笔记:基于矩阵分解(总结篇)
推薦系統(tǒng)筆記:基于潛在因子模型的協(xié)同過(guò)濾(latent factor model)_UQI-LIUWJ的博客-CSDN博客
推薦系統(tǒng)筆記:無(wú)任何限制的矩陣分解_UQI-LIUWJ的博客-CSDN博客
推薦系統(tǒng)筆記:基于SVD的協(xié)同過(guò)濾_UQI-LIUWJ的博客-CSDN博客
推薦系統(tǒng)筆記:基于非負(fù)矩陣分解的協(xié)同過(guò)濾_UQI-LIUWJ的博客-CSDN博客
1 矩陣分解 X 協(xié)同過(guò)濾 家族
????????很明顯,前面幾節(jié)中各種形式的矩陣分解有很多共同點(diǎn)。 所有上述優(yōu)化公式都使殘差矩陣的 Frobenius 范數(shù)最小化,與此同時(shí)因子矩陣 U 和 V 需要滿(mǎn)足各種特定的約束。? 對(duì)因子矩陣的不同約束實(shí)現(xiàn)了不同的可解釋性屬性。
???????? 事實(shí)上,更廣泛的矩陣分解模型系列可以使用任何其他目標(biāo)函數(shù)或約束來(lái)強(qiáng)制逼近。 這個(gè)更廣泛的家庭可以寫(xiě)成如下形式:
?????????在大多數(shù)情況下,正則化項(xiàng)被添加到目標(biāo)函數(shù)中以防止過(guò)擬合。
1.1 不同的約束?
????????各種約束通常對(duì)因素施加不同類(lèi)型的可解釋性。 這種可解釋性的兩個(gè)例子是正交性(SVD分解,提供幾何可解釋性)和非負(fù)性(非負(fù)矩陣分解,提供’部分總和‘可解釋性)。
????????此外,即使這些約束增加了觀(guān)測(cè)值上的誤差,當(dāng)它們具有有意義的語(yǔ)義解釋時(shí),它們有時(shí)也可以改善未觀(guān)察條目的準(zhǔn)確度。 這是因?yàn)榧s束減少了未觀(guān)察條目的方差,同時(shí)增加了偏差。 因此,該模型具有更好的泛化性。
????????例如,將 U 和 V 中的各一列中的條目固定為1幾乎總是會(huì)導(dǎo)致更好的性能。
推薦系統(tǒng)筆記:無(wú)任何限制的矩陣分解_UQI-LIUWJ的博客-CSDN博客
???????? 選擇要使用的正確約束通常取決于數(shù)據(jù),并且需要深入了解手頭的應(yīng)用和目標(biāo)。
????????
2??PLSA
?????????存在其他形式的因式分解,其中可以為因子分配概率可解釋性。
???????? 例如,考慮一個(gè)非負(fù)一元評(píng)級(jí)矩陣 R 被視為相對(duì)頻率分布的場(chǎng)景,其條目總和為 1。
????????
? ? ? ? ?我們可以很容易地將R矩陣規(guī)約化到條目之和為1(每個(gè)條目除以 條目總和)
? ? ? ? 這種矩陣R的分解可以用一種和SVD類(lèi)似,但是不是SVD的方法來(lái)進(jìn)行
????????
? ? ? ? ?這種分解只是長(zhǎng)得像SVD分解,但實(shí)際的內(nèi)容和SVD分解還是相差甚遠(yuǎn):
- ?此時(shí)Qk的列、Pk的列不用再是正交的
- Qk的每一列、Pk的每一列值都是非負(fù)的,每一列數(shù)值之和為1
- 對(duì)角矩陣Σk的每個(gè)條目(對(duì)角線(xiàn)上的值)也均為非負(fù),它們的和也是1
?這里我們說(shuō)明一下,比如我們令此時(shí)Qk為,Pk為,Σk為
滿(mǎn)足如下式子
這個(gè)矩陣所有條目的和為:
=1
????????這種因式分解具有概率解釋:矩陣 Qk、Pk 和 Σk 包含創(chuàng)建評(píng)分矩陣的生成過(guò)程的概率參數(shù)。這種方法被稱(chēng)為概率潛在語(yǔ)義分析(PLSA),它可以被視為非負(fù)矩陣分解的概率變體。
????????顯然,這種分解的概率性質(zhì)為其提供了不同類(lèi)型的可解釋性。
3 匯總
????????這里匯總了幾種較為主流的MF模型。需要注意的是,模型的選擇取決于問(wèn)題設(shè)置、數(shù)據(jù)中的噪聲以及所需的可解釋性水平。沒(méi)有單一的解決方案可以實(shí)現(xiàn)所有這些目標(biāo)。仔細(xì)理解問(wèn)題域?qū)τ谶x擇正確的模型很重要。 ?
| 模型 | 限制 | 目標(biāo)函數(shù) | 優(yōu)點(diǎn) | 缺點(diǎn) |
| 無(wú)限制矩陣分解 | 無(wú) | frobenius 范數(shù) | 對(duì)于有觀(guān)測(cè)值的條目,可以有很好的準(zhǔn)確度 適用于大多數(shù)情況 | 對(duì)于沒(méi)有觀(guān)測(cè)值的條目,不一定有很好的準(zhǔn)確度 缺乏可解釋性 |
| SVD | U和V各自的列向量正交 | frobenius 范數(shù) | 很好的幾何解釋性 外推推薦 稠密矩陣效果很好 | 稀疏矩陣效果一般 |
| 非負(fù)矩陣分解 | 所有條目非負(fù) | frobenius 范數(shù) | 很好的語(yǔ)義可解釋性 適用于隱式反饋矩陣 | |
| PLSA | 所有條目非負(fù) 所有條目之和為1 | 有觀(guān)測(cè)值的這些條目的最大概率 | 很好的語(yǔ)義可解釋性 適用于隱式反饋矩陣 |
總結(jié)
以上是生活随笔為你收集整理的推荐系统笔记:基于矩阵分解(总结篇)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 推荐系统笔记:基于非负矩阵分解的协同过滤
- 下一篇: 推荐系统笔记:矩阵分解+基于邻居的模型