信息流推荐多样性
信息流推薦多樣性
一、問題現(xiàn)狀
信息流產(chǎn)品中一個常見的問題是多樣性越來越差,造成這種問題的原因在于機器學(xué)習算法本身。下面通過一副系統(tǒng)循環(huán)圖來介紹多樣性差的問題。
隨著時間的推移,我們的推薦系統(tǒng)就是娛樂app了,沒有其他類別了。
下圖反映了去看看比例的變化。
6月12號的資訊曝光分類占比
11月18號的資訊曝光分類占比
由上圖可以發(fā)現(xiàn),娛樂占比已經(jīng)從6月12日的29%上升到11月18日的45%;女人的占比從6%上升到25%。
二、解決方案
解決方案也很簡單,只要將系統(tǒng)循環(huán)圖中的正反饋切斷或進行干擾即可。這里選擇進行人工干擾。
為什么選擇在資訊入庫時進行干擾呢?由圖中可以看到,其他推薦給用戶的資訊都是算法根據(jù)用戶興趣進行計算的,進行干擾對用戶體驗和用戶使用會產(chǎn)生較大的影響。資訊入庫這里雖然也會對用戶產(chǎn)生影響,但是,相對于其他途徑影響較小。
具體怎樣進行干擾?固定每個類別的每天資訊入庫比例,按照類別比例進行選擇。具體設(shè)置的類別比例如下:
三、多樣性風險和應(yīng)對策略
3.1 可能的風險
(1)人均閱讀篇數(shù)和人均閱讀時長下降
多樣性執(zhí)行加入了人工干擾,會將質(zhì)量較好的娛樂類文章丟棄。預(yù)計會對目前的指標有影響,我們將這2個指標控制在下降3%之內(nèi)。同時,資訊庫類別占比達到預(yù)設(shè)值。
(2)新增用戶對其他類別不感興趣
多樣性的改觀會在一定程度上對新用戶造成影響,如果新用戶群體興趣點只是娛樂,有可能會導(dǎo)致新用戶轉(zhuǎn)化降低。
(3)短時間內(nèi)很難選出其他類別的高質(zhì)量文章
短時間內(nèi),由于曝光不充分,在其他類別資訊選擇上,置信度不是很高。選出的資訊質(zhì)量并不能充分保證,其他類別的效果會明顯不如娛樂。
3.2 應(yīng)對策略
針對以上三種問題,應(yīng)對策略如下:
(1) 逐步調(diào)整,不會一步到位,在控制類別比例的過程中,密切關(guān)注數(shù)據(jù)的變化。使得下降的幅度與多樣性修正帶來的好處達到一個平衡。
(2) 關(guān)注新用戶的表現(xiàn),新用戶如果是興趣多樣性的用戶,會提升新用戶的點擊轉(zhuǎn)化。
(3) 隨著時間的推移,曝光量的增加,其他類別的高質(zhì)量文章選擇將會越來越精確。
3.3 多樣性評估
評估多樣性應(yīng)結(jié)合長期指標,目前列了如下,后續(xù)將繼續(xù)跟蹤:
四、 計劃說明
計劃12月4日與產(chǎn)品達成一致方案,若未按時出,則按此方案執(zhí)行。
總結(jié)
- 上一篇: undefined reference
- 下一篇: 第五部分 自定义的Calendar接口示