推荐系统顶会RecSys’20亮点赏析
文 | banana
源 | 知乎
RecSys 2020原計劃是在南美洲巴西舉辦,因為疫情的原因不得不改到線上。雖說線上舉辦會議,參會效果會打折扣,但也為遠在北京的我提供了參會便利。得益于各方的努力和軟件的應(yīng)用,整體來看此次參會的效果高于我對它的預(yù)期。這里分享一些從工程師角度發(fā)現(xiàn)的一些亮點,希望對大家有所幫助。
會議組織的一些亮點
先簡單介紹一下此次會議的組織方式,不得不說組織方確實用心了,有人員有的可能24個小時都沒休息。
為了使全球各時區(qū)的參會人員都能方便地聽到文章作者們的演講,大多數(shù)演講作者會在不同的時間段演講兩次
為了線上會議的流程可以順利進行,大會利用Whova軟件幫助整個流程,Whova當(dāng)中包括了會議時間表,直播平臺,收集提問,論壇交友,活動組織等功能
為了參會者可以方便集合自由討論,大會用Gather.town 組織Poster Session等活動,大家可以自行在一個虛擬的空間進行交流,下圖,我站在這個虛擬空間過道的RECSYS面板前,算是拍照留念了。
Gather.town虛擬空間
會議最新研究的一些亮點
這是我第三次參加RecSys。推薦系統(tǒng)的研究進展并不快,在會議上常??梢钥吹揭恍┢婀值难芯糠较?#xff0c;重復(fù)的研究結(jié)果,不過也能看到一些亮點。
工業(yè)方向亮點有:
PURS: Personalized Unexpected Recommender System for Improving User Satisfaction,
Behavior-based Popularity Ranking on Amazon Video
Query as Context for Item-to-Item Recommendation
這些方法要么經(jīng)過工業(yè)界AB測試的驗證,要么是工程實現(xiàn)簡單,并能解決一些問題。
學(xué)術(shù)方向亮點有:
Counterfactual Learning for Recommender System
Debiasing Item-to-Item Recommendations with Small Annotated Datasets
A Large-scale Open Dataset for Bandit Algorithms
這些方法要么新奇,未來前景廣泛,要么包含公開源代碼或者數(shù)據(jù)。
下面我對這些亮點一一做簡單的介紹
PURS: Personalized Unexpected Recommender System for Improving User Satisfaction
作者Pan Li是NYU Stern School of Business的一名博士生,這個工作是與阿里巴巴合作的成果,為了解決推薦系統(tǒng)當(dāng)中的Filter Bubble的問題,他們提出了PURS,這個工作的優(yōu)勢包括
在優(yōu)酷App進行了AB測試,并在一些關(guān)鍵指標(biāo)上面有很大的提升,其中人均觀看時長提升了4.6%
這個工作和Filter Bubble有關(guān),這個話題大家討論很多,但是這個方向的有效的研究并不多,這個工作少有奏效的方法
這個工作考慮到了Exploration個性化的問題,有些人愿意探索不同類型的視頻內(nèi)容,有些人就不愿意,作者有考慮到這一點,實現(xiàn)了個性化的Exploration
PURS的推薦思路在Embedding上面的實現(xiàn)
Behavior-based Popularity Ranking on Amazon Video
作者Lakshmi Ramachandran是Amazon Video的Applied Scientists,介紹了他們的Popularity Ranking的一個工作。
之前我以為Popularty Ranking用當(dāng)前統(tǒng)計的Populartity即可完成排序,沒想到Popularity Ranking也可以利用機器學(xué)習(xí)解決Popularity Ranking當(dāng)中的冷啟動的問題:一些新的內(nèi)容無法通過普通的Popularity Ranking排到一個好的位置,曝光給用戶。
作者利用內(nèi)容本身的一些文本信息、之前的流行度、和用戶的交互信息等數(shù)據(jù)預(yù)測當(dāng)前的Popularity,最終以預(yù)測的Popularity進行排序。一個有趣的現(xiàn)象是內(nèi)容在平臺上存在的時長這一特征,這個特征會給新內(nèi)容高的分數(shù)。下面的截圖提到了Age Feature(在平臺上存在的時長)的影響
Age Feature(在平臺上存在的時長)的影響,X軸為Age,Y軸為預(yù)測的Popularity
Query as Context for Item-to-Item Recommendation
作者Moumita Bhattacharya是 ESTY.COM 一家電商網(wǎng)站的Senior Applied Scientist,她介紹了ESTY打造相關(guān)商品推薦的技術(shù)選擇。他們有6500萬的商品這使得他們的技術(shù)選擇和Amazon Video就會很不一樣,Amazon Video的視頻數(shù)量可能也就是幾萬的量級。
用戶所看到的ESTY.COM的相關(guān)物品推薦
ESTY.COM 相關(guān)物品推薦的兩個階段
相關(guān)物品推薦分成兩個階段,在第一個階段的Candidate Set Generation部分,他們利用Word2Vector的技術(shù),把用戶搜索點擊的內(nèi)容作為訓(xùn)練數(shù)據(jù),給每個內(nèi)容生成Embedding,之后用 Faiss: A library for efficient similarity search,返回與當(dāng)前物品最相似物品列表作為Candidate Set。
第二階段用lightGBM對Candidate Set進行排序。
他們提到的工作當(dāng)中,有一個亮點是,他們利用了Context進行相關(guān)物品的個性化。下圖是提到的可以將當(dāng)前的節(jié)目作為Context,比如說在萬圣節(jié)時期,對于一個給一個紅色推薦相關(guān)的物品,是不是可以把一些適合萬圣節(jié)的物品,同時相關(guān)的物品推薦出來,而不是只單單推薦紅色的帽子。
在萬圣節(jié)期間,可以利用當(dāng)前的節(jié)日作為Context,推薦符合當(dāng)前節(jié)日的物品
Counterfactual Learning for Recommender System
作者Zhenhua Dong是華為諾亞方舟實驗室的Principal Researcher,這次演講匯總了華為在Counterfactual方向上的一系列成果。為了解決Counterfactual的問題,作者提出Uniform Unbiased Data,通過在從1%流量當(dāng)中,隨機選擇內(nèi)容地向用戶展現(xiàn),使得每一個內(nèi)容都有機會收集到用戶的反饋。利用Uniform Unbiased Data,作者展開了一系統(tǒng)的研究和實驗,取得了一系列的成果,其中之一是利用這1%的流量產(chǎn)生的Unbiased Data,創(chuàng)造了3%的指標(biāo)提升。
作者在介紹Counterfactual machine learning
Debiasing Item-to-Item Recommendations with Small Annotated Datasets
作者Tobias Schnabel是來自微軟研究院的研究員,提出利用小規(guī)模的標(biāo)注數(shù)據(jù)來提升Item-to-Item的推薦(和之前提到的一個物品的相關(guān)推薦一樣)。智能不夠,人工來湊。實驗表明這種方式的確有效,這說明我們的訓(xùn)練數(shù)據(jù)當(dāng)中有很多干擾,并不能完全表示用戶對所有物品的喜好。工業(yè)界或許可以利用之前提到的Unbiased Data達到Small Annotated Dataset的效果。
文章當(dāng)中的方法比其它的方法都要好
Large-scale Open Dataset for Bandit Algorithms
From Workshop: REVEAL 2020: Bandit and Reinforcement Learning from User Interactions
Yann Lecun說RL是整個機器學(xué)習(xí)蛋糕上面的櫻桃
作者Yuta Saito是一名本科生,在這次Workshop展示了他在RL&Bandits方向的工作。
強化學(xué)習(xí)的核心問題之一是如何在上線或者進行實驗之前,評估訓(xùn)練好的強化學(xué)習(xí)的模型,也就是Offline Policy Evaluation。學(xué)術(shù)界提出了很多的方法,很多都是用模擬器產(chǎn)生的數(shù)據(jù),但是少有一些實際數(shù)據(jù)的支持。
這個工作提供了兩組通過Uniform Rank和 Bernoliour Rank產(chǎn)生的服飾購物行為數(shù)據(jù),可以用來測評不同的Offline Policy Evaluation的效果,也可以用來開發(fā)新的Policy,用Offline Policy Evaluation來評測 。
https://github.com/st-tech/zr-obp Open Bandits Pipeline 開源代碼代碼質(zhì)量高,有很多代碼注釋。
在3個展示位置收集的用戶購物行為
作者提出的OPEN BANDIT PIPELINE
推薦系統(tǒng)不像圖像識別,理論上推薦系統(tǒng)是典型的強化學(xué)習(xí)的應(yīng)用場景,但限于各種工程約束,理論的不成熟,強化學(xué)習(xí)一直沒有很好地應(yīng)用于推薦系統(tǒng),最近幾年業(yè)界開始有成功的應(yīng)用。這個領(lǐng)域值得繼續(xù)關(guān)注。
總結(jié)
這次線上RecSys體驗別具一格,并沒有像我之前擔(dān)心的那樣,效果打很多折扣,很多參會者也是有很認真地了準備演講。希望下次RecSys能看到更多的有亮點的工作。
后臺回復(fù)關(guān)鍵詞【入群】
加入賣萌屋NLP/IR/Rec與求職討論群
有頂會審稿人、大廠研究員、知乎大V和妹紙
等你來撩哦~
總結(jié)
以上是生活随笔為你收集整理的推荐系统顶会RecSys’20亮点赏析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 谈谈怎样提高炼丹手速
- 下一篇: 简单复读机LR如何成为推荐系统精排之锋?