當(dāng)前位置：首頁 > 运维知识 > windows >内容正文

windows

會議組織的一些亮點

先簡單介紹一下此次會議的組織方式，不得不說組織方確實用心了，有人員有的可能24個小時都沒休息。

為了使全球各時區(qū)的參會人員都能方便地聽到文章作者們的演講，大多數(shù)演講作者會在不同的時間段演講兩次
為了線上會議的流程可以順利進行，大會利用Whova軟件幫助整個流程，Whova當(dāng)中包括了會議時間表，直播平臺，收集提問，論壇交友，活動組織等功能
為了參會者可以方便集合自由討論，大會用Gather.town 組織Poster Session等活動，大家可以自行在一個虛擬的空間進行交流，下圖，我站在這個虛擬空間過道的RECSYS面板前，算是拍照留念了。

Gather.town虛擬空間

會議最新研究的一些亮點

這是我第三次參加RecSys。推薦系統(tǒng)的研究進展并不快，在會議上常?？梢钥吹揭恍┢婀值难芯糠较?#xff0c;重復(fù)的研究結(jié)果，不過也能看到一些亮點。

工業(yè)方向亮點有：

PURS: Personalized Unexpected Recommender System for Improving User Satisfaction,
Behavior-based Popularity Ranking on Amazon Video
Query as Context for Item-to-Item Recommendation

這些方法要么經(jīng)過工業(yè)界AB測試的驗證，要么是工程實現(xiàn)簡單，并能解決一些問題。

學(xué)術(shù)方向亮點有：

Counterfactual Learning for Recommender System
Debiasing Item-to-Item Recommendations with Small Annotated Datasets
A Large-scale Open Dataset for Bandit Algorithms

這些方法要么新奇，未來前景廣泛，要么包含公開源代碼或者數(shù)據(jù)。

下面我對這些亮點一一做簡單的介紹

PURS: Personalized Unexpected Recommender System for Improving User Satisfaction

作者Pan Li是NYU Stern School of Business的一名博士生，這個工作是與阿里巴巴合作的成果，為了解決推薦系統(tǒng)當(dāng)中的Filter Bubble的問題，他們提出了PURS，這個工作的優(yōu)勢包括

在優(yōu)酷App進行了AB測試，并在一些關(guān)鍵指標(biāo)上面有很大的提升，其中人均觀看時長提升了4.6%
這個工作和Filter Bubble有關(guān)，這個話題大家討論很多，但是這個方向的有效的研究并不多，這個工作少有奏效的方法
這個工作考慮到了Exploration個性化的問題，有些人愿意探索不同類型的視頻內(nèi)容，有些人就不愿意，作者有考慮到這一點，實現(xiàn)了個性化的Exploration

PURS的推薦思路在Embedding上面的實現(xiàn)

Behavior-based Popularity Ranking on Amazon Video

作者Lakshmi Ramachandran是Amazon Video的Applied Scientists，介紹了他們的Popularity Ranking的一個工作。

之前我以為Popularty Ranking用當(dāng)前統(tǒng)計的Populartity即可完成排序，沒想到Popularity Ranking也可以利用機器學(xué)習(xí)解決Popularity Ranking當(dāng)中的冷啟動的問題：一些新的內(nèi)容無法通過普通的Popularity Ranking排到一個好的位置，曝光給用戶。

作者利用內(nèi)容本身的一些文本信息、之前的流行度、和用戶的交互信息等數(shù)據(jù)預(yù)測當(dāng)前的Popularity，最終以預(yù)測的Popularity進行排序。一個有趣的現(xiàn)象是內(nèi)容在平臺上存在的時長這一特征，這個特征會給新內(nèi)容高的分數(shù)。下面的截圖提到了Age Feature（在平臺上存在的時長）的影響

Age Feature（在平臺上存在的時長）的影響，X軸為Age，Y軸為預(yù)測的Popularity

Query as Context for Item-to-Item Recommendation

作者Moumita Bhattacharya是 ESTY.COM 一家電商網(wǎng)站的Senior Applied Scientist，她介紹了ESTY打造相關(guān)商品推薦的技術(shù)選擇。他們有6500萬的商品這使得他們的技術(shù)選擇和Amazon Video就會很不一樣，Amazon Video的視頻數(shù)量可能也就是幾萬的量級。

用戶所看到的ESTY.COM的相關(guān)物品推薦

ESTY.COM 相關(guān)物品推薦的兩個階段

相關(guān)物品推薦分成兩個階段，在第一個階段的Candidate Set Generation部分，他們利用Word2Vector的技術(shù)，把用戶搜索點擊的內(nèi)容作為訓(xùn)練數(shù)據(jù)，給每個內(nèi)容生成Embedding，之后用 Faiss: A library for efficient similarity search，返回與當(dāng)前物品最相似物品列表作為Candidate Set。

第二階段用lightGBM對Candidate Set進行排序。

他們提到的工作當(dāng)中，有一個亮點是，他們利用了Context進行相關(guān)物品的個性化。下圖是提到的可以將當(dāng)前的節(jié)目作為Context，比如說在萬圣節(jié)時期，對于一個給一個紅色推薦相關(guān)的物品，是不是可以把一些適合萬圣節(jié)的物品，同時相關(guān)的物品推薦出來，而不是只單單推薦紅色的帽子。

在萬圣節(jié)期間，可以利用當(dāng)前的節(jié)日作為Context，推薦符合當(dāng)前節(jié)日的物品

Counterfactual Learning for Recommender System

作者Zhenhua Dong是華為諾亞方舟實驗室的Principal Researcher，這次演講匯總了華為在Counterfactual方向上的一系列成果。為了解決Counterfactual的問題，作者提出Uniform Unbiased Data，通過在從1%流量當(dāng)中，隨機選擇內(nèi)容地向用戶展現(xiàn)，使得每一個內(nèi)容都有機會收集到用戶的反饋。利用Uniform Unbiased Data，作者展開了一系統(tǒng)的研究和實驗，取得了一系列的成果，其中之一是利用這1%的流量產(chǎn)生的Unbiased Data,創(chuàng)造了3%的指標(biāo)提升。

作者在介紹Counterfactual machine learning

Debiasing Item-to-Item Recommendations with Small Annotated Datasets

作者Tobias Schnabel是來自微軟研究院的研究員，提出利用小規(guī)模的標(biāo)注數(shù)據(jù)來提升Item-to-Item的推薦（和之前提到的一個物品的相關(guān)推薦一樣）。智能不夠，人工來湊。實驗表明這種方式的確有效，這說明我們的訓(xùn)練數(shù)據(jù)當(dāng)中有很多干擾，并不能完全表示用戶對所有物品的喜好。工業(yè)界或許可以利用之前提到的Unbiased Data達到Small Annotated Dataset的效果。

文章當(dāng)中的方法比其它的方法都要好

Large-scale Open Dataset for Bandit Algorithms

From Workshop: REVEAL 2020: Bandit and Reinforcement Learning from User Interactions

Yann Lecun說RL是整個機器學(xué)習(xí)蛋糕上面的櫻桃

作者Yuta Saito是一名本科生，在這次Workshop展示了他在RL&Bandits方向的工作。

強化學(xué)習(xí)的核心問題之一是如何在上線或者進行實驗之前，評估訓(xùn)練好的強化學(xué)習(xí)的模型，也就是Offline Policy Evaluation。學(xué)術(shù)界提出了很多的方法，很多都是用模擬器產(chǎn)生的數(shù)據(jù)，但是少有一些實際數(shù)據(jù)的支持。

這個工作提供了兩組通過Uniform Rank和 Bernoliour Rank產(chǎn)生的服飾購物行為數(shù)據(jù)，可以用來測評不同的Offline Policy Evaluation的效果，也可以用來開發(fā)新的Policy，用Offline Policy Evaluation來評測。
https://github.com/st-tech/zr-obp Open Bandits Pipeline 開源代碼代碼質(zhì)量高，有很多代碼注釋。

在3個展示位置收集的用戶購物行為

作者提出的OPEN BANDIT PIPELINE

推薦系統(tǒng)不像圖像識別，理論上推薦系統(tǒng)是典型的強化學(xué)習(xí)的應(yīng)用場景，但限于各種工程約束，理論的不成熟，強化學(xué)習(xí)一直沒有很好地應(yīng)用于推薦系統(tǒng)，最近幾年業(yè)界開始有成功的應(yīng)用。這個領(lǐng)域值得繼續(xù)關(guān)注。

總結(jié)

這次線上RecSys體驗別具一格，并沒有像我之前擔(dān)心的那樣，效果打很多折扣，很多參會者也是有很認真地了準備演講。希望下次RecSys能看到更多的有亮點的工作。

后臺回復(fù)關(guān)鍵詞【入群】

加入賣萌屋NLP/IR/Rec與求職討論群

有頂會審稿人、大廠研究員、知乎大V和妹紙

等你來撩哦~

總結(jié)

以上是生活随笔為你收集整理的推荐系统顶会RecSys’20亮点赏析的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：谈谈怎样提高炼丹手速
下一篇：简单复读机LR如何成为推荐系统精排之锋？

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

windows

推荐系统顶会RecSys’20亮点赏析

會議組織的一些亮點

會議最新研究的一些亮點

PURS: Personalized Unexpected Recommender System for Improving User Satisfaction

Behavior-based Popularity Ranking on Amazon Video

Query as Context for Item-to-Item Recommendation

Counterfactual Learning for Recommender System

Debiasing Item-to-Item Recommendations with Small Annotated Datasets

Large-scale Open Dataset for Bandit Algorithms

總結(jié)

總結(jié)