當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

协同过滤算法_机器学习 | 简介推荐场景中的协同过滤算法，以及SVD的使用

發(fā)布時間：2023/12/1 编程问答 35 豆豆

生活随笔收集整理的這篇文章主要介紹了协同过滤算法_机器学习 | 简介推荐场景中的协同过滤算法，以及SVD的使用小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

本文始發(fā)于個人公眾號：TechFlow，原創(chuàng)不易，求個關(guān)注

今天是機器學習專題的第29篇文章，我們來聊聊SVD在上古時期的推薦場景當中的應用。

協(xié)同過濾的原理

協(xié)同過濾的原理非常簡單，一句話概括，就是尋找相似的商品以及相似的人。

因為在平臺當中的商品和人可能數(shù)量都非常大，當我們要進行推薦的時候，我們不可能窮舉所有的商品來進行預測點擊率，這顯然是機器無法抗住的。所以我們希望把用戶在平臺上的行為使用起來，讓用戶的行為給平臺作為指引。根據(jù)用戶的行為尋找出行為相似的用戶以及相似的商品。

所以協(xié)同過濾有兩套邏輯，也可以認為是兩種做法。第一種做法是user-based也就是尋找偏好相似的用戶，這個不難理解，比如說經(jīng)常買文具、買書的大概率是學生。假設我們知道了A和B行為相似，也就是說他們可能有相似的喜好。那么假設A購買過商品1并且給出了好評，而B沒有購買過，那么很有可能B也會喜歡這個商品，所以我們就可以推薦給B。

第二種做法自然就是item-based，比如你搜索點擊了一個商品A，平臺會將和這個商品類似的商品BCD推薦給你，會放在商品詳情頁的下方的猜你喜歡當中。比如你看的是襯衫，它可能會給你推薦別家的襯衫，也可能給你推薦西褲或者是領(lǐng)帶。本質(zhì)上邏輯是一樣的，因為這些商品和這件襯衫的相關(guān)度比較高。

下一個問題是用戶和用戶，商品和商品之間的相關(guān)度是怎么來的呢？

答案很簡單，是通過這個矩陣來的：

我們觀察一下這個矩陣，這是一個用戶和商品的相關(guān)行為矩陣，每一行表示一個用戶的行為，每一列表示每一個商品的銷售情況。也就是說我們可以用這個矩陣當中的行向量表示用戶，列向量表示商品。既然我們把用戶和商品用向量表示出來了，接下來的事情就很簡單了，我們只需要計算向量之間的相似度就可以找到相似的用戶以及商品了。

我們要計算向量的相似度有很多種辦法，我們可以計算兩個向量的余弦值，可以計算歐式距離、皮爾遜值等等。

SVD的作用

其實到這里關(guān)于協(xié)同過濾就介紹完了，但問題是這和SVD看起來好像沒什么關(guān)系呀？

我們仔細琢磨一下就能發(fā)現(xiàn)它們之間的關(guān)系，對于規(guī)模比較小的公司或者場景來說，這當然是沒問題的。比如說電影評分網(wǎng)站，因為電影的數(shù)量往往不會很大，充其量也在萬這個量級，所以這個矩陣可能還是存的下的。如果是電商公司，商品和用戶都是億這個維度的，這個矩陣顯然是非常巨大的，根本不可能在內(nèi)存當中存儲得下，更別提相似度計算了。并且這樣的矩陣必然存在大量稀疏和空缺，我們將它使用SVD壓縮也是非常合理的做法。

首先我們開發(fā)出一個輔助函數(shù)，根據(jù)我們設置的百分比計算出最少需要的奇異值的數(shù)量：

def

其次我們對原矩陣進行svd分解，并且設置閾值對原矩陣進行壓縮：

data

最后壓縮之后得到的是item的矩陣，其中的每一個行向量對應一個item。

這只是一個模擬，如果是在實際上的應用，我們可以將幾億甚至是更多的維度壓縮到幾百甚至更少，極大的縮減了存儲所需要的開銷。而且svd的計算是可以分布式并發(fā)進行的，所以即使原始數(shù)據(jù)非常龐大，也是可以支撐的。

總結(jié)

到這里關(guān)于協(xié)同過濾算法以及SVD的應用就結(jié)束了，雖然算法非常簡單，實現(xiàn)起來也容易，但是這其中還有很多問題沒有解決。比如說這個用戶和商品的矩陣并不是一成不變的，因為我們隨時都會有新商品上架以及新用戶注冊，對于這些沒有行為的新商品和新用戶應該怎么辦？

另外一個問題是，這個算法沒有改進的空間，一旦實現(xiàn)完成了上線之后，我們做不了太多的改進。如果是其他的模型或者是算法，我們可以通過迭代算法以及模型的方法來獲取更好的效果，但是協(xié)同過濾不行。這也是為什么逐漸被淘汰的原因。

今天的文章到這里就結(jié)束了，如果喜歡本文的話，請來一波素質(zhì)三連，給我一點支持吧（關(guān)注、轉(zhuǎn)發(fā)、點贊）。

創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎勵來咯，堅持創(chuàng)作打卡瓜分現(xiàn)金大獎

總結(jié)

以上是生活随笔為你收集整理的协同过滤算法_机器学习 | 简介推荐场景中的协同过滤算法，以及SVD的使用的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：算法设计与分析_算法设计与分析（第2版）
下一篇：用imspost制作catia后处理_新

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

生活随笔

生活随笔

编程问答

协同过滤算法_机器学习 | 简介推荐场景中的协同过滤算法，以及SVD的使用

推薦的背后邏輯

協(xié)同過濾的原理

SVD的作用

總結(jié)

總結(jié)