日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > windows >内容正文

windows

推荐系统笔记(模型融合)

發布時間:2025/4/5 windows 23 豆豆
生活随笔 收集整理的這篇文章主要介紹了 推荐系统笔记(模型融合) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

思維導圖:

? ? ? ? ? ? ? ? ? ? ? ?

?

推薦系統在技術實現上一般劃分三個階段:挖掘、召回、排序。

模型融合:

挖掘的工作就是對用戶和物品做非常深入的結構化分析,對各個角度的特征都被呈現出來,并且建好索引,供召回階段使用,大部分挖掘工作都是離線進行的。

召回:

因為物品太多,每次給一個用戶計算推薦結果時,如果對全部物品挨個計算,那將是一場災難,取而代之的是用一些手段從全量的物品中篩選出一部分比較靠譜的

最后就是排序,針對篩選出的一部分靠譜的做一個統一的論資排輩,最后這個統一的排序就是融合

示意圖如下:

在召回階段,其實就是各種簡單的,復雜的推薦算法,比如說基于內容的推薦,會產生一些推薦結果,比如基于物品的協同過濾會產生一些結果,矩陣分解會產生一些結果,等等。

總之,每種算法都會產生一些推薦結果,一般同時還附帶給每個結果產生一個推薦結果,是各自算法給出來的。不同算法只負責推舉出候選結果,真正最終是否推薦給用戶,由另一個統一的模型說了算,這個叫做模型的融合。

典型的模型融合:邏輯回歸和梯度提升決策樹組合

組合原理:

在推薦系統的模型融合階段,就要以產品目標為導向。

簡單的例子:信息流推薦,如果以提高ctr為目標,則模型融合就要把預估ctr作為本職工作,這個工作一直一來就是邏輯回歸完成

邏輯回歸:

ctr 預估就是在推薦一個物品之前,預估一下用戶點擊它的概率有多大,再根據這個預估的點擊率對物品排序輸出。

邏輯回歸經常被選來執行這個任務,它的輸出值范圍就是0和1之間,剛好滿足點擊率預估的輸出,這是一個基礎。因為邏輯回歸是廣義線性模型,相比于傳統線性模型,在線性模型基礎上增加了 sigmoid函數。

?在對召回階段不同算法給出的候選物品計算ctr預估時,需要:特征、權重

第一個是特征,就是向量化、向量的方式把一個用戶和一個物品的成對組合表示出來。量化方式包括兩種:實數和布爾。實數好理解,比如一個用戶的年齡,一個用戶平均在某個類上每個月的花銷等,布爾,就是取值0或1,針對兩種類別形式的,比如用戶所在的省市,物品的每一個標簽。

用戶和每一個候選物品都組一下,然后以這種特征化的方式表達出來,就可以計算了,否則類別形式的字段不能直接參與計算。

第二個就是權重,每個特征都有一個權重,權重就是特征的話語權,在決定那些物品最終有機會能走到前臺的選秀過程中,用戶和物品對這對組合的所有特征都有投票權,只是每個特征的權重不一樣,對最終計算ctr影響??大有小。

有了特征x,還有特征的權重,也是一個維度和特征一樣的向量w,通過對 x和w做點擊運算,就得到一個傳統線性模型的輸出,再用sigmoid函數對這個值做一個變換,就得到一個0到1之間的值,也就是預估的ctr

特征工程+線性模型,就是模型融合、ctr預估必備的方法

權重主要是損失函數最小化,就是模型的偏差是否足夠小,另一個就是模型的正則化,就是看模型的方差是否足夠小,學習模型的權重,經典的方法就是梯度下降一類,但是梯度下降效果收斂很慢。后來google在2013年發表新的學習算法:FTRL,一種結合L!正則和L2正則的在線優化算法

梯度提升決策樹GBDT部分請看:https://blog.csdn.net/weixin_41362649/article/details/82803279

模型融合的原理雖然比較簡單,但是實際應用中非常的有效。

?

?

打盡協同過濾、矩陣分解和線性模型

?

? ? ? ? ? ? ? ? ? ? ? ? ? ? ??

??

?

?

?

總結

以上是生活随笔為你收集整理的推荐系统笔记(模型融合)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。