推荐系统之冷启动问题
前言
冷啟動(dòng)問(wèn)題同比于啟動(dòng)車(chē)輛,通常車(chē)正式開(kāi)啟之前需要有熱車(chē)階段,這個(gè)過(guò)程就是冷啟動(dòng)過(guò)程。冷啟動(dòng)在推薦系統(tǒng)也是常見(jiàn)的問(wèn)題,大家知道類(lèi)似于抖音、淘寶等工具,都會(huì)根據(jù)用戶(hù)的興趣去推薦內(nèi)容,如果一個(gè)新用戶(hù)進(jìn)來(lái),系統(tǒng)完全不清楚他的興趣,該如何推薦呢?這就是本文要給大家介紹的內(nèi)容。
?
冷啟動(dòng)對(duì)于一個(gè)推薦系統(tǒng)是至關(guān)重要的,因?yàn)樾掠脩?hù)最初使用APP階段也是這名用戶(hù)最可能卸載APP的時(shí)候,如果新用戶(hù)進(jìn)入產(chǎn)品不能快速給用戶(hù)帶來(lái)價(jià)值,是非常危險(xiǎn)的。今天介紹的內(nèi)容會(huì)圍繞下面這張圖展開(kāi):
首先把冷啟動(dòng)問(wèn)題歸為3個(gè)類(lèi)別:
系統(tǒng)冷啟動(dòng):整個(gè)系統(tǒng)都是新做的,沒(méi)有任何數(shù)據(jù)和經(jīng)驗(yàn)基礎(chǔ)
推薦主體冷啟動(dòng):通常指的是缺少新注冊(cè)用戶(hù)的歷史購(gòu)買(mǎi)或點(diǎn)擊數(shù)據(jù)
被推薦對(duì)象冷啟動(dòng):通常指的是缺少商城中的新商品或者新的內(nèi)容歷史被點(diǎn)擊或購(gòu)買(mǎi)的數(shù)據(jù)
下面分別針對(duì)以上內(nèi)容講下處理方法。
?
1. 系統(tǒng)冷啟動(dòng)
系統(tǒng)冷啟動(dòng)這個(gè)其實(shí)真的沒(méi)太好的辦法,萬(wàn)事開(kāi)頭難,系統(tǒng)冷啟動(dòng)缺少的是專(zhuān)家經(jīng)驗(yàn),建議系統(tǒng)在運(yùn)行前務(wù)必請(qǐng)有經(jīng)驗(yàn)的架構(gòu)師或者產(chǎn)品經(jīng)理參與設(shè)計(jì),如果架構(gòu)或者整個(gè)推薦策略不合理,上線后是比較難調(diào)整的。
?
2.推薦主體冷啟動(dòng)
?
當(dāng)推薦主體冷啟動(dòng)時(shí),往往是新用戶(hù)進(jìn)來(lái)之后,大方向上要從兩個(gè)角度去想解決方案,一個(gè)方向是盡可能擴(kuò)展用戶(hù)畫(huà)像,增加更多維度的信息。第二個(gè)方向在初期推薦的內(nèi)容上也要有所策略。
?
2.1 擴(kuò)充用戶(hù)畫(huà)像
?
用戶(hù)畫(huà)像的擴(kuò)充有很多手段,常用的方法如下:
-
賬號(hào)注冊(cè)信息:注冊(cè)的時(shí)候可以讓用戶(hù)填寫(xiě)年齡、性別等內(nèi)容、手機(jī)號(hào)等內(nèi)容,同時(shí)也可以通過(guò)LBS信息了解用戶(hù)的活動(dòng)區(qū)域。針對(duì)這些信息可以給用戶(hù)興趣做一個(gè)初步判斷,比如年輕的都市女性,往往有較高的消費(fèi)能力,在推薦策略上可以推薦高規(guī)格的一些內(nèi)容
-
身份證信息:現(xiàn)在很多系統(tǒng)都需要實(shí)名認(rèn)證,身份證號(hào)其實(shí)可以帶來(lái)很多有用的信息,比如前兩位是省級(jí)代碼,34位是市級(jí)代碼,7-14位是生日代碼,第17位是性別代碼(奇數(shù)代表男性、偶數(shù)代表女性)
-
社交賬號(hào)登錄:如果系統(tǒng)可以設(shè)計(jì)成支持淘寶、微信等賬號(hào)登錄,也可以通過(guò)這些系統(tǒng)拿到部分用戶(hù)畫(huà)像信息
-
預(yù)采集:現(xiàn)在很多APP,當(dāng)用戶(hù)初次進(jìn)入都有一個(gè)興趣愛(ài)好勾選的按鈕,這個(gè)就是為了解決冷啟動(dòng)的一個(gè)手段,在推薦之前先通過(guò)用戶(hù)標(biāo)記獲取用戶(hù)信息
-
數(shù)據(jù)交換:注冊(cè)的時(shí)候其實(shí)可以拿到用戶(hù)的手機(jī)號(hào)碼,現(xiàn)在有很多賣(mài)數(shù)據(jù)的公司都提供用戶(hù)畫(huà)像數(shù)據(jù)的交易,只要提供手機(jī)號(hào)就能獲取特別全的用戶(hù)數(shù)據(jù)(這個(gè)貌似是個(gè)黑產(chǎn)業(yè))
2.2 推薦策略
對(duì)于這種冷啟動(dòng)問(wèn)題推薦策略有兩個(gè)方向可以選擇,可以結(jié)合著來(lái)使用。
-
熱門(mén)推薦法:反正也不清楚用戶(hù)的信息,就挑平臺(tái)上最熱門(mén)的內(nèi)容推薦,總歸從概率層面上被大多受眾認(rèn)可的東西也有大概率被新用戶(hù)認(rèn)可
-
老虎機(jī)算法:學(xué)名叫Bandit算法,意思是假設(shè)用戶(hù)前方有10個(gè)老虎機(jī),每個(gè)都有不同的概率出錢(qián),用戶(hù)不知道這個(gè)概率,那用戶(hù)該怎么選呢,就是懵!落到冷啟動(dòng)問(wèn)題上,就是先隨便推薦用戶(hù)幾個(gè)不同Topic的內(nèi)容(一定是不同的),看看用戶(hù)的反饋再?zèng)Q定下一步的推薦安排
?
3.?被推薦對(duì)象冷啟動(dòng)
?
被推薦對(duì)象往往是平臺(tái)上新增加的內(nèi)容,不同于推薦主體,被推薦對(duì)象如商品、短視頻、廣告等,平臺(tái)是有辦法通過(guò)一些分析拿到內(nèi)容屬性的。可以通過(guò)以下兩個(gè)步驟建立推薦推薦策略:
挖掘?qū)傩?#xff1a;先對(duì)新增內(nèi)容屬性進(jìn)行挖掘,比如增加的是個(gè)手機(jī),可以通過(guò)標(biāo)簽獲取手機(jī)價(jià)格、顏色等信息,再進(jìn)行下一步推薦
ICF聚類(lèi):在之前推薦系統(tǒng)相關(guān)的文章中已經(jīng)多次介紹過(guò)協(xié)同過(guò)濾算法,本質(zhì)上是先將內(nèi)容分類(lèi)。比如新增加的是一個(gè)美女跳舞的視頻,那么再找哪些用戶(hù)瀏覽過(guò)類(lèi)似的視頻,就把新增視頻推薦給對(duì)應(yīng)的用戶(hù),這種策略本質(zhì)上是一種聚類(lèi)算法。比如新增內(nèi)容是個(gè)紅色的手機(jī),就找到歷史上購(gòu)買(mǎi)過(guò)紅色手機(jī)的用戶(hù)來(lái)推薦
?
文末,全文針對(duì)冷啟動(dòng)問(wèn)題的不同細(xì)節(jié)介紹了具體的一些實(shí)踐路徑。具體如何把其中的細(xì)節(jié)實(shí)現(xiàn)其實(shí)對(duì)推薦系統(tǒng)有很高的架構(gòu)要求,比如被推薦對(duì)象冷啟動(dòng)問(wèn)題,每當(dāng)新來(lái)一個(gè)商品就需要快速的做協(xié)同過(guò)濾找到商品所屬類(lèi)別,這其實(shí)要依賴(lài)一個(gè)流式的計(jì)算引擎才可以實(shí)現(xiàn)。ok,關(guān)于架構(gòu)的事情之前已經(jīng)寫(xiě)過(guò)一些,過(guò)一段會(huì)有一個(gè)總結(jié)。感謝觀看,希望能有收獲~
?
?
?
?
總結(jié)
以上是生活随笔為你收集整理的推荐系统之冷启动问题的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 谈谈对搜索技术Elastic Searc
- 下一篇: 推荐系统之业务架构总览