人工智能AI实战100讲(十)-一文读懂推荐系统负采样
推薦系統(tǒng)負(fù)采樣作為推薦模型訓(xùn)練的重要一環(huán),對模型的訓(xùn)練效果有著重要影響,也是推薦系統(tǒng)領(lǐng)域的一個(gè)重要研究分支。本文將從研究背景到現(xiàn)有的經(jīng)典工作對推薦系統(tǒng)負(fù)采樣進(jìn)行一個(gè)概括性的介紹。為了降低本文的閱讀門檻,讓更多“科研小白”也可以理解文章內(nèi)容,筆者將盡可能使用通俗的語言來代替論文公式對算法進(jìn)行描述,希望可以讓讀者對推薦系統(tǒng)負(fù)采樣有一個(gè)基本的了解。
1. 研究背景
推薦系統(tǒng)的目的在于根據(jù)用戶的興趣愛好向用戶進(jìn)行個(gè)性化推薦,以提升用戶在網(wǎng)上購物,新聞閱讀,影音娛樂等場景下的體驗(yàn)。在推薦場景中,推薦模型主要依賴用戶的歷史反饋信息來建模用戶的興趣。一般來說,在模型訓(xùn)練過程中,我們需要同時(shí)提供正例(用戶喜歡的商品)和負(fù)例(用戶不喜歡的商品)給模型,然后基于損失函數(shù)來學(xué)習(xí)用戶和商品的表示,最終完成模型的訓(xùn)練。但在實(shí)際推薦場景中,考慮到數(shù)據(jù)收集的難度,我們很難獲取用戶的顯式反饋信息(例如用戶對商品的評分)來確切知道用戶喜歡哪些商品,不喜歡哪些商品,絕大部分的數(shù)據(jù)都是用戶的隱式反饋信息(例如用戶消費(fèi)過的商品記錄)。
對于隱式反饋來說,數(shù)據(jù)沒有明確的標(biāo)簽,為了進(jìn)行模型訓(xùn)練,我們一般假設(shè)用戶交互過的商品都是正例,并通過采樣的方式,從用戶未交互過的商品集中選擇一部分作為負(fù)例。從用戶未交互商品集中基于一定策略進(jìn)行負(fù)例選擇的這一過程,就被稱為負(fù)采樣(Negative Sampling)
總結(jié)
以上是生活随笔為你收集整理的人工智能AI实战100讲(十)-一文读懂推荐系统负采样的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 浅谈推荐系统中的图神经网络
- 下一篇: 基于 Apache Hudi 构建流批一