日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 运维知识 > windows >内容正文

windows

推荐系统中协同过滤算法实现分析

發(fā)布時(shí)間:2023/12/4 windows 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 推荐系统中协同过滤算法实现分析 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

原創(chuàng)博客,歡迎轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)注明:http://my.oschina.net/BreathL/blog/62519

??????最近研究Mahout比較多,特別是里面協(xié)同過濾算法;于是把協(xié)同過濾算法的這個(gè)實(shí)現(xiàn)思路與數(shù)據(jù)流程,總結(jié)了一下,以便以后對(duì)系統(tǒng)做優(yōu)化時(shí),有個(gè)清晰的思路,這樣才能知道該如何優(yōu)化且優(yōu)化后數(shù)據(jù)亦能正確。

? ? ?推薦中的協(xié)同過濾算法簡(jiǎn)單說明下:

?????首先,通過分析用戶的偏好行為,來挖掘出里面物品與物品、或人與人之間的關(guān)聯(lián)。

? ? ?其次,通過對(duì)這些關(guān)聯(lián)的關(guān)系做一定的運(yùn)算,得出人與物品間喜歡程度的猜測(cè),即推薦值。

? ? ?最后,將推薦值高的物品推送給特定的人,以完成一次推薦。

? ? ?這里只是籠統(tǒng)的介紹下,方便下邊的理解,IBM的一篇博客對(duì)其原理講解得淺顯易懂,同時(shí)也很詳細(xì)《深入推薦引擎相關(guān)算法 - 協(xié)同過濾》,我這里就不細(xì)講了。

? ? ?協(xié)同過濾算法大致可分為兩類,基于物品的與基于用戶的;區(qū)分很簡(jiǎn)單,根據(jù)上面的邏輯,若你挖掘的關(guān)系是物品與物品間的,就是基于物品的協(xié)同過濾算法,若你挖掘的關(guān)系是用戶與用戶間的,就是基于用戶的協(xié)同過濾算法;由于它們實(shí)現(xiàn)是有所不同,所以我分開整理,先來看看基于物品的協(xié)同過濾實(shí)現(xiàn),我自己畫了一幅圖:



? ? ?我通過數(shù)字的順序,來標(biāo)示數(shù)據(jù)變化的方向(由小到大);下面分析下每一個(gè)步驟的功能以及實(shí)現(xiàn)。

? ? ?首先,說明下兩個(gè)大的數(shù)據(jù)源,用戶偏好數(shù)據(jù):UserID、ItemID、Preference:表示一個(gè)對(duì)一個(gè)物品的喜好程度;關(guān)系數(shù)據(jù):ItemIDA(UserIDA)、ItemIDB(UserIDB)、Similarity:表示兩個(gè)人或物品間的相似程度;接著一個(gè)用戶來了,我們需要為其推薦,得拿到他的身份標(biāo)示,一般是UserID,于是:

? ? ?.? ? 查找這個(gè)用戶喜歡過的物品(即偏好的產(chǎn)品,并查出偏好值后面會(huì)用),以及還沒有喜歡過的商品,前者是推薦運(yùn)算的根據(jù),后者作為一個(gè)產(chǎn)生推薦的一個(gè)集合;如②?畫的那樣。

? ? ?.? ? 這里是一個(gè)可擴(kuò)展的地方(我自己理解);因?yàn)檫@兩部分的數(shù)據(jù)的作用非常明顯,修改這兩個(gè)集合對(duì)后面產(chǎn)生的推薦結(jié)果可產(chǎn)生非常直觀的影響,比如清洗過濾,或根據(jù)用戶屬性縮小集合;不僅使后面推薦效果更優(yōu),運(yùn)算性能也可以大幅度提高。

? ? ?.? ? 查找這兩個(gè)集合之間的關(guān)系,這是一對(duì)多的關(guān)系:一個(gè)沒有偏好過的物品與該用戶所有偏好過的物品間的關(guān)系,有一個(gè)值來衡量這個(gè)關(guān)系叫相似度Similarity;這個(gè)關(guān)系怎么來的,看藍(lán)色箭頭的指向。步驟

? ? ?.? ? 得到這個(gè)一對(duì)多的關(guān)系后,就可以計(jì)算這個(gè)物品對(duì)于這個(gè)用戶的推薦值了,圖中similarity_i-x表示Item_i 與 Item_x 之間的相似度,Item_x是該用戶偏好過得,該用戶對(duì)其偏好值記為 value_x ,相乘;Item_i 與 該用戶偏好過的所有物品以此做以上運(yùn)算后,得到的值取平均值 便是 Item_i的推薦值了。注:有可能Item_i 不是與所有 該用戶偏好過的物品都都存在相似性,不存在的,不計(jì)算即可;另外這里方便理解介紹的都是最簡(jiǎn)單的實(shí)現(xiàn);你也可以考一些復(fù)雜的數(shù)學(xué)元素,比如方差來判斷離散性等。

? ? ?.? ? 這步就簡(jiǎn)單多了,剛才對(duì)該用戶沒有偏好過的集合中的所有Item都計(jì)算了推薦值,這里就會(huì)得到一個(gè)list,按推薦值由大到小排序,返回前面的一個(gè)子集即可。

? ? ?。 前面已經(jīng)提到,關(guān)系數(shù)據(jù)時(shí)怎么來的,也是根據(jù)用戶的偏好數(shù)據(jù);你把其看成一個(gè)矩陣,橫著看過來,參考兩個(gè)Item間的共同用戶,以及共同用戶的偏好的值的接近度;這里的可選擇的相似度算法很多,不一一介紹了,前面提到的IBM博客也詳細(xì)講解了。

? ? ?基于物品的協(xié)同過濾算法分析完了,下面是基于用戶的協(xié)同過濾算法,還是自己畫了一幅圖:



? ? ?.? ? 同樣也是查詢,只是查詢的對(duì)象不一樣了,查詢的是與該用戶相似的用戶,所以一來直接查了關(guān)系數(shù)據(jù)源。以及相似用戶與該用戶的相似度。

? ? ?.? ? 與剛才類似,也是對(duì)數(shù)據(jù)集的一個(gè)優(yōu)化,不過作用可能沒那么大。(個(gè)人感覺)

? ? ?.? ? 查詢關(guān)系數(shù)據(jù)源,得到相似用戶即鄰居偏好過的物品;如步驟;圖中由于空間小,沒有把所有鄰居的偏好關(guān)系都列出來,用……表示。其次還要得到該用戶偏好過的物品集合。

? ? ?.? ? 被推薦的Item集合是由該用戶的所有鄰居的偏好過的物品的并集,同時(shí)再去掉該用戶自己偏好過的物品。作用就是得到你的相似用戶喜歡的物品,而你還沒喜歡過的。

? ? ?.? ? 集合優(yōu)化同基于物品的協(xié)同過濾算法的步驟

? ? ?.? ? 也是對(duì)應(yīng)類似的,依次計(jì)算被推薦集合中Item_i 的推薦值,計(jì)算的方式略有不同,Value_1_i表示鄰居1對(duì),Item_i的偏好值,乘以該用戶與鄰居1的相似度 Similarity1;若某個(gè)鄰居對(duì)Item_i偏好過,就重復(fù)上述運(yùn)算,然后取平均值;得到Item_i的推薦值。

? ? ?⑦、.?與上一個(gè)算法的最后兩部完全類似,只是步驟??你豎著看,判斷兩個(gè)用戶相似的法子和判斷兩個(gè)物品相似的法子一樣。

? ? ?詳細(xì)的實(shí)現(xiàn)過程分析完了,但Mahout里面的實(shí)現(xiàn)時(shí),似乎不太考慮查詢的成本,并非一次全部查出,每計(jì)算個(gè)Item的推薦值查一次,你計(jì)算5000個(gè)就查5000次,若數(shù)據(jù)源都使用的是MySQL的話,我有點(diǎn)根兒顫,但一次全部查出再計(jì)算,肯定是個(gè)慢查詢,且查詢后的數(shù)據(jù)不是規(guī)則的,需要整,又添加了計(jì)算量;若各位有好的優(yōu)化思路,望能分享下,先謝過。

? ? ?

總結(jié)

以上是生活随笔為你收集整理的推荐系统中协同过滤算法实现分析的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 男男毛片| 欧美放荡办公室videos4k | 日本不卡影院 | 欧美成人精品欧美一级乱黄 | 色噜噜狠狠狠综合曰曰曰88av | 伊人日韩| 欧美在线另类 | 亚洲视频 一区 | 性生生活大片又黄又 | 91视频在线网站 | 国产成人8x视频一区二区 | 日本黄色小视频 | 亚洲一区日韩精品 | 成人片在线视频 | 欧美激情久久久久久 | 一区二区免费在线观看视频 | 日本a免费 | 老头老太吃奶xb视频 | 国产av无码国产av毛片 | 大地资源影视在线播放观看高清视频 | brazzers欧美一区二区 | 麻豆久久久9性大片 | 国产一区久久久 | 亚洲性少妇| 91精品国产高潮对白 | いいなり北条麻妃av101 | 欧美成人免费在线观看 | 波波野结衣 | 影音先锋中文字幕一区二区 | 免费网站观看www在线观看 | 综合网在线视频 | 久久九九久久九九 | 久久牛牛 | 日本电影大尺度免费观看 | 激情在线观看视频 | 国产女人和拘做受视频免费 | 日韩av一区在线 | 日韩亚洲视频 | 草久久免费视频 | 亚洲一区二区三区在线 | 人妻无码一区二区三区久久99 | 人妻无码久久一区二区三区免费 | 精品国产一区二区三区性色av | av片免费在线 | 欧美日韩国产在线 | 国产精品毛片久久久久久久av | 亚洲天堂av在线免费观看 | 天天摸天天操天天干 | 欧美日韩一二三 | 98av视频 | 丁香综合网| 91.xxx.高清在线 | 久久久精品电影 | 在线播放91灌醉迷j高跟美女 | 欧美精品久久久久久久多人混战 | 国产稀缺精品盗摄盗拍 | jzjzjzjzj亚洲成熟少妇 | 国产午夜精品一区二区理论影院 | 国产a级淫片 | 少妇被躁爽到高潮无码人狍大战 | 国产视频播放 | av在线h| av网站地址 | 伊人久久成人网 | 婷婷色婷婷 | 打开免费观看视频在线 | 欧美一级一区二区 | 国产乱子伦农村叉叉叉 | 秋霞福利影院 | 亚州国产精品视频 | 天天干女人 | 国产夫妻性生活视频 | 欧美特一级 | 欧美亚洲视频 | 亚洲videos| 97在线视频观看 | 亚洲一区欧美二区 | 男男gay动漫 | 亚洲欧美在线免费观看 | 91大片在线观看 | 香蕉在线观看 | 8x国产一区二区三区精品推荐 | 天堂va蜜桃一区二区三区 | 精品视频久久久久久久 | 制服丝袜在线播放 | 国内偷拍久久 | 精品人妻伦一二三区久 | 免费看裸体网站视频 | 久久中文字幕人妻 | 亚洲欧美日韩系列 | 亚洲一级黄色大片 | 精品国产一区二区在线观看 | 丁香婷婷成人 | 色综合图区 | 国产福利影院 | 撸大师av | 久久福利社 | 国产美女网站 | 日韩资源网 |