日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > windows >内容正文

windows

推荐系统顶会RecSys’20亮点赏析

發布時間:2024/7/5 windows 56 豆豆
生活随笔 收集整理的這篇文章主要介紹了 推荐系统顶会RecSys’20亮点赏析 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文 | banana

源 | 知乎


RecSys 2020原計劃是在南美洲巴西舉辦,因為疫情的原因不得不改到線上。雖說線上舉辦會議,參會效果會打折扣,但也為遠在北京的我提供了參會便利。得益于各方的努力和軟件的應用,整體來看此次參會的效果高于我對它的預期。這里分享一些從工程師角度發現的一些亮點,希望對大家有所幫助。

會議組織的一些亮點

先簡單介紹一下此次會議的組織方式,不得不說組織方確實用心了,有人員有的可能24個小時都沒休息。

  • 為了使全球各時區的參會人員都能方便地聽到文章作者們的演講,大多數演講作者會在不同的時間段演講兩次

  • 為了線上會議的流程可以順利進行,大會利用Whova軟件幫助整個流程,Whova當中包括了會議時間表,直播平臺,收集提問,論壇交友,活動組織等功能

  • 為了參會者可以方便集合自由討論,大會用Gather.town 組織Poster Session等活動,大家可以自行在一個虛擬的空間進行交流,下圖,我站在這個虛擬空間過道的RECSYS面板前,算是拍照留念了。

Gather.town虛擬空間

會議最新研究的一些亮點

這是我第三次參加RecSys。推薦系統的研究進展并不快,在會議上常常可以看到一些奇怪的研究方向,重復的研究結果,不過也能看到一些亮點。

工業方向亮點有:

  • PURS: Personalized Unexpected Recommender System for Improving User Satisfaction,

  • Behavior-based Popularity Ranking on Amazon Video

  • Query as Context for Item-to-Item Recommendation

這些方法要么經過工業界AB測試的驗證,要么是工程實現簡單,并能解決一些問題。

學術方向亮點有:

  • Counterfactual Learning for Recommender System

  • Debiasing Item-to-Item Recommendations with Small Annotated Datasets

  • A Large-scale Open Dataset for Bandit Algorithms

這些方法要么新奇,未來前景廣泛,要么包含公開源代碼或者數據。

下面我對這些亮點一一做簡單的介紹

PURS: Personalized Unexpected Recommender System for Improving User Satisfaction

作者Pan Li是NYU Stern School of Business的一名博士生,這個工作是與阿里巴巴合作的成果,為了解決推薦系統當中的Filter Bubble的問題,他們提出了PURS,這個工作的優勢包括

  • 在優酷App進行了AB測試,并在一些關鍵指標上面有很大的提升,其中人均觀看時長提升了4.6%

  • 這個工作和Filter Bubble有關,這個話題大家討論很多,但是這個方向的有效的研究并不多,這個工作少有奏效的方法

  • 這個工作考慮到了Exploration個性化的問題,有些人愿意探索不同類型的視頻內容,有些人就不愿意,作者有考慮到這一點,實現了個性化的Exploration

PURS的推薦思路在Embedding上面的實現

Behavior-based Popularity Ranking on Amazon Video

作者Lakshmi Ramachandran是Amazon Video的Applied Scientists,介紹了他們的Popularity Ranking的一個工作。

之前我以為Popularty Ranking用當前統計的Populartity即可完成排序,沒想到Popularity Ranking也可以利用機器學習解決Popularity Ranking當中的冷啟動的問題:一些新的內容無法通過普通的Popularity Ranking排到一個好的位置,曝光給用戶。

作者利用內容本身的一些文本信息、之前的流行度、和用戶的交互信息等數據預測當前的Popularity,最終以預測的Popularity進行排序。一個有趣的現象是內容在平臺上存在的時長這一特征,這個特征會給新內容高的分數。下面的截圖提到了Age Feature(在平臺上存在的時長)的影響

Age Feature(在平臺上存在的時長)的影響,X軸為Age,Y軸為預測的Popularity

Query as Context for Item-to-Item Recommendation

作者Moumita Bhattacharya是 ESTY.COM 一家電商網站的Senior Applied Scientist,她介紹了ESTY打造相關商品推薦的技術選擇。他們有6500萬的商品這使得他們的技術選擇和Amazon Video就會很不一樣,Amazon Video的視頻數量可能也就是幾萬的量級。

用戶所看到的ESTY.COM的相關物品推薦

ESTY.COM 相關物品推薦的兩個階段

相關物品推薦分成兩個階段,在第一個階段的Candidate Set Generation部分,他們利用Word2Vector的技術,把用戶搜索點擊的內容作為訓練數據,給每個內容生成Embedding,之后用 Faiss: A library for efficient similarity search,返回與當前物品最相似物品列表作為Candidate Set。

第二階段用lightGBM對Candidate Set進行排序。

他們提到的工作當中,有一個亮點是,他們利用了Context進行相關物品的個性化。下圖是提到的可以將當前的節目作為Context,比如說在萬圣節時期,對于一個給一個紅色推薦相關的物品,是不是可以把一些適合萬圣節的物品,同時相關的物品推薦出來,而不是只單單推薦紅色的帽子。

在萬圣節期間,可以利用當前的節日作為Context,推薦符合當前節日的物品

Counterfactual Learning for Recommender System

作者Zhenhua Dong是華為諾亞方舟實驗室的Principal Researcher,這次演講匯總了華為在Counterfactual方向上的一系列成果。為了解決Counterfactual的問題,作者提出Uniform Unbiased Data,通過在從1%流量當中,隨機選擇內容地向用戶展現,使得每一個內容都有機會收集到用戶的反饋。利用Uniform Unbiased Data,作者展開了一系統的研究和實驗,取得了一系列的成果,其中之一是利用這1%的流量產生的Unbiased Data,創造了3%的指標提升。

作者在介紹Counterfactual machine learning

Debiasing Item-to-Item Recommendations with Small Annotated Datasets

作者Tobias Schnabel是來自微軟研究院的研究員,提出利用小規模的標注數據來提升Item-to-Item的推薦(和之前提到的一個物品的相關推薦一樣)。智能不夠,人工來湊。實驗表明這種方式的確有效,這說明我們的訓練數據當中有很多干擾,并不能完全表示用戶對所有物品的喜好。工業界或許可以利用之前提到的Unbiased Data達到Small Annotated Dataset的效果。

文章當中的方法比其它的方法都要好

Large-scale Open Dataset for Bandit Algorithms

From Workshop: REVEAL 2020: Bandit and Reinforcement Learning from User Interactions

Yann Lecun說RL是整個機器學習蛋糕上面的櫻桃

作者Yuta Saito是一名本科生,在這次Workshop展示了他在RL&Bandits方向的工作。

強化學習的核心問題之一是如何在上線或者進行實驗之前,評估訓練好的強化學習的模型,也就是Offline Policy Evaluation。學術界提出了很多的方法,很多都是用模擬器產生的數據,但是少有一些實際數據的支持。

這個工作提供了兩組通過Uniform Rank和 Bernoliour Rank產生的服飾購物行為數據,可以用來測評不同的Offline Policy Evaluation的效果,也可以用來開發新的Policy,用Offline Policy Evaluation來評測 。
https://github.com/st-tech/zr-obp Open Bandits Pipeline 開源代碼代碼質量高,有很多代碼注釋。

在3個展示位置收集的用戶購物行為

作者提出的OPEN BANDIT PIPELINE

推薦系統不像圖像識別,理論上推薦系統是典型的強化學習的應用場景,但限于各種工程約束,理論的不成熟,強化學習一直沒有很好地應用于推薦系統,最近幾年業界開始有成功的應用。這個領域值得繼續關注。

總結

這次線上RecSys體驗別具一格,并沒有像我之前擔心的那樣,效果打很多折扣,很多參會者也是有很認真地了準備演講。希望下次RecSys能看到更多的有亮點的工作。

后臺回復關鍵詞【入群

加入賣萌屋NLP/IR/Rec與求職討論群

有頂會審稿人、大廠研究員、知乎大V和妹紙

等你來撩哦~

總結

以上是生活随笔為你收集整理的推荐系统顶会RecSys’20亮点赏析的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。