推荐系统笔记(简单概念)
本部分思維導圖:
?
? ? ? ? 推薦系統從搜索引擎借鑒很多技術和思想,比如內容推薦有不少技術就來自搜索引擎, 基于用戶和基于物品的協同過濾將推薦系統技術從內容延伸到協同關系,超越內容本身,后來Netflix舉行一個比賽,以矩陣分解為代表的評分預測算法出現,推薦系統是AI的分支之一,AI落地都需要具備幾個元素:數據、算法、場景、計算力
1、概念:
推薦系統:
1)、能做什么:可以把那些最終會在用戶和物品之間產生的鏈接提前找出來
2)、需要什么:需要根據已經存在的連接,從已有的連接去預測未來的連接
3)、它怎么做:預測用戶評分和偏好---》定義抽象實現方式分類是:機器推薦和人工推薦,也就是常說的個性化推薦和編輯推薦
總結:推薦系統就是用已有的連接去預測未來用戶和物品之間會出現的連接
注:
世界的發展趨勢是萬物傾向于建立越來越多的聯系,人是一起意義所在,根據已有的連接預測和人有關的連接
例如:一個電商平臺,用戶剛買過什么,常買什么,這些都是用戶和商品之間的連接,用這些連接去預測還會買什么,還會瀏覽什么
?
2、怎么評判公司是否需要構建推薦系統?
1)、產品的目的:如果產品是建立越多連接越好,那么它最終需要一個推薦系統
2)、產品現有的連接:如果產品中物品很少,可以用人工就可以應付過來,則不適合搭建推薦系統
3、推薦系統的問題模式
推薦系統是為用戶和物品建立連接,建立的方式是提前找出那些隱藏的鏈接呈現給用戶,這也屬于一個預測問題:
針對推薦系統的預測問題模式,主要分為兩大類:1)、評分預測(顯式反饋)? 2)、行為預測(隱式反饋)
1) 評分預測:
? ? ? ?例如用戶消費完一個物品會給出一個評分,或者有的網站是用星星的棵數表示。提前預測一個用戶對每一個物品會打多少分,找出那些可能會打高分,但是還沒消費的物品,然后推薦給用戶。
評分預測存在的問題:
? ? ? 1)數據不易收集? ?2)數據質量不能保證? ?3)評分的分布不穩定
2)行為預測
只要用戶瀏覽相關信息,就會有各種行為數據產生,從登錄、瀏覽到購買收藏,都是用戶行為,這些行為都是在用戶不知不覺下的情況下產生,數據量比較多。
? ? ? ?推薦系統目前預測行為方式主要有兩種:直接預測行為本身發生的概率、預測物品的相對排序。直接預測行為本身稱為:CTR預估(Click Through Rate).把每一個推薦給用戶的物品按照是否點擊二分類,構建分類模型,預估其中一種分類的概率,就是ctr預估。
行為預測,就簡單的來說是利用隱式反饋數據預測隱式反饋發生的概率。
行為預測有幾個特點:
? ? ?1) 數據比顯示反饋更加稠密? ?2)隱式反饋更代表用戶的真實想法? 3)隱式反饋常常和模型的目標函數關聯更密切
4、推薦系統常見問題
1)冷啟動問題
新用戶或者不活躍用戶,以及新物品或展示次數比較少的物品,這些用戶和物品,由于缺乏相關數據,這就是冷啟動問題的關注對象
2)探索和利用問題(exploration?& exploitation )
如果知道用戶喜好,一般會有三種方式應對:1、全部推薦用戶目前肯定感興趣的物品? 2、無視用戶興趣,按照其它邏輯推薦 3、大部分推薦感興趣的,小部分去試探新的興趣。顯然第3種更科學一些
3)? 安全問題:
推薦系統被攻擊的影響主要有幾個方面:1、給出不準確的推薦結果? 2、收集很多臟數據? 3、損失產品的利益
總結:從模型的角度,推薦系統的模型可以分成預測評分和預測行為,另一個角度可以看看推薦系統中存在一些潛在的問題,包括冷啟動、搜索和利用問題、安全問題。
5、推薦系統關鍵元素的重要性
開發推薦系統產品,幾個元素需要注意:
1)UI和UE:人機交互設計和用戶體驗設計
2)數據
3)領域知識
4)算法
6、建立思維模式
1)目標思維:
對于結構有預期,可以提前推演出來。
可以把推薦系統看做一個函數,輸入有很多:UI、UE、數據、領域知識、算法等等;輸出是我們關注的指標:留存率、新聞的閱讀時間、電商的GMV、視頻的VV等等
2)不確定性思維:
不需要用因果邏輯地提前推理出來,而是用概率的眼光去看結果。
推薦系統的產品負責人一定要有不確定性思維,原因如下:
1)絕大多數推薦算法都是概率算法,無法保證得到確切的結果,只是概率上得到好的效果
2)推薦系統追求的是目標的增長,而不是一城一池的得失
3)如果花時間為一個事件增加補丁,那么付出的成本和得到的收益將大打折扣
4)出現意外的推薦也是有益的,可以探索用戶的新興趣
?
總結
以上是生活随笔為你收集整理的推荐系统笔记(简单概念)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: GBDT基本原理及应用
- 下一篇: 推荐系统笔记(内容推荐)