當前位置：首頁 > 运维知识 > windows >内容正文

windows

2020年推荐系统工程师炼丹手册

發布時間：2025/3/8 windows 20 豆豆

生活随笔收集整理的這篇文章主要介紹了 2020年推荐系统工程师炼丹手册小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

作者：一元? ? ? 來源：煉丹筆記

煉丹要練好，須有好丹方，何處尋好的丹方，答曰：頂會！

本文不扯蛋，就扯扯這2020年頂會必看的推薦系統的論文 & 其摘要。如有興趣煉丹提升自己開發推薦系統效果的，可以持續關注我們的公眾號！我們會每周更新一到多篇頂會Paper的閱讀 & 評論或者福利 Code復現，助我們的煉丹師練出頂級“丹藥”。

本人乃初級煉丹師，難免會有紕漏，還請各位大佬莫要見笑，如有什么錯誤，還請多多指點，奮斗鴨。

本文我們匯總了25篇AAAI2020與推薦系統相關的論文&其對應的摘要。

1: Where to Go Next: Modeling Long- and Short-Term User Preferences for Point-of-Interest Recommendation?

摘要：POI推薦（Point-of-Interest，POI）是一個熱門的研究課題，它從大量候選場館中為用戶生成更加方便的個性化的建議。因為用戶的簽到記錄可以看作是一個很長的序列，基于遞歸神經網絡（RNNs）的方法在這塊顯示出了很好的適用性。然而，現有的基于RNN的方法在對用戶短期偏好建模時，要么忽略了用戶的長期偏好，要么忽略了最近訪問的poi之間的地理關系，使得我們的推薦結果并不可靠。針對上述局限性，我們提出了一種新的長短期偏好建模方法（LSTPM）。特別地，該模型由一個用于長期偏好建模的非局部網絡和一個用于短期偏好學習的geo-dialted RNN組成。在兩個實際數據集上的大量實驗表明，我們的模型相比目前最好的方法得到了顯著的提升。

2.PEIA: Personality and Emotion Integrated Attentive Model for Music Recommendation on Social Media Platforms

摘要：隨著數字音樂格式的迅速擴展，推薦用戶喜愛的音樂是非常重要的。對于音樂推薦，用戶的個性和情感會分別以長期和短期的方式影響他們的音樂偏好，而豐富的社交媒體數據為這些信息提供了有效的反饋。本文針對社交媒體平臺上的音樂推薦問題，提出了一種個性與情感相結合的注意模型（PEIA），模型充分利用社交媒體數據，對用戶的長期喜好（個性）和短期偏好（情感）進行綜合建模。具體地，它充分利用了個性化的用戶特性、情感導向的用戶特性和音樂特性的多方面屬性。在整合用戶個性和情感的潛在表征時，采用層次注意來區分重要因素。在171254個用戶的大型真實數據集上進行的實驗證明了我們的PEIA模型的有效性，我們的模型可以獲得0.5369的NDCG，優于現有的方法。我們還進行了詳細的參數分析和特征貢獻分析，進一步驗證了我們的方案，并說明了用戶個性和情感協同建模在音樂推薦中的意義。

3.?A Knowledge-Aware Attentional Reasoning Network for Recommendation

摘要：近年來，基于知識圖的推薦系統越來越受到業界和學術界的關注。現有的許多基于知識的推薦方法都取得了更好的效果，通常是通過對知識圖中用戶和商品之間的路徑進行推理來進行推薦。然而，他們忽略了一點：用戶的個人點擊歷史序列，這些序列可以更好地反映用戶在推薦時間段內的偏好。本文中，我們提出了一種基于知識感知的注意力推理網絡KARN，KARN融合了用戶的點擊歷史序列和用戶與商品之間的路徑連通性。提出的KARN不僅開發了一個基于注意的RNN，從用戶點擊的歷史序列中捕捉用戶的歷史興趣，而且還開發了一個層次化的注意力神經網絡來推理用戶和物品之間的路徑，從而推斷出用戶對物品的潛在意圖。基于用戶的歷史興趣和潛在意圖，KARN可以預測用戶對候選項的點擊概率。我們在Amazon評論數據集上進行了實驗，實驗結果證明了我們提出的KARN模型的優越性和有效性。

4.?Enhancing Personalized Trip Recommendation with Attractive Routes

摘要：個性化出行推薦試圖為用戶推薦一系列興趣點（poi）。現有的研究大多只根據poi本身的流行程度來搜索poi。事實上，POI之間的線路對游客也非常具有吸引力，其中一些線路人氣很高。我們將這種路由稱為吸引路由（AR），它可以帶來額外的用戶體驗。本文我們研究有吸引力的路線來改善個性化的旅游推薦。針對ARs的發現和評估問題，我們提出了一種基于POIs和吸引路徑的個性化出行推薦器（TRAR）。該方法基于流行度和POI的基尼系數來發掘吸引路線，然后利用類別空間中的引力模型來估計吸引路線的評分得分和偏好。基于此，TRAR建議使用ARs進行一次旅行，以最大限度地提高用戶體驗，并在時間成本和用戶體驗之間進行權衡。實驗結果表明了TRAR方法與其他最新方法相比的優越性。

5.Efficient Heterogeneous Collaborative Filtering without Negative Sampling for Recommendation

摘要：最近關于推薦的研究主要集中在探索提高最新神經網絡的表達能力，而通常為了網絡的高效學習，我們常常采用負采樣（NS）策略。這樣的方法雖然有效，但有兩個重要的問題沒有得到很好的考慮：1）NS的波動性很大，使得基于抽樣的方法在實際應用中很難獲得最優的排序性能；2）雖然各種各樣的反饋（例如，查看、點擊、點擊等），和購買）廣泛存在于許多在線系統，大多數現有的方法只利用一種主要類型的用戶反饋，如購買。在這項工作中，我們提出了一個新的非抽樣遷移學習解決方案，我們將其命名為高效異構協同過濾（EHCF）的Top-N推薦。它不僅可以對細粒度的用戶商品關系進行建模，而且能夠以較低的時間復雜度從整個異構數據（包括所有未標記數據）中高效地學習模型參數。在三個實際數據集上的大量實驗表明，EHCF在傳統（單一行為）和異構場景中都顯著優于最新的推薦方法。此外，EHCF在訓練效率上有顯著提高，使其更適用于實際的大型系統。我們的實現已經發布1，以方便基于全量數據的神經方法的進一步發展。?

6.?An Attentional Recurrent Neural Network for Personalized Next Location Recommendation

摘要：現有的關于下一個位置推薦的研究大多提出對簽入序列的序列規則性進行建模，但由于大多數位置的后續位置少于5個，因此存在嚴重的數據稀疏問題。為此，我們提出了一種基于注意機制的遞歸神經網絡（ARNN）來聯合建模相似位置（鄰居）的序列規律性和轉移規律性。特別地，我們首先設計了一個基于元路徑的隨機游走在一個新的知識圖上，以此來發現基于異質因素的位置鄰居。然后采用一個遞歸神經網絡，通過捕捉控制用戶移動性的各種上下文，對序列規則性進行建模。同時，通過注意機制整合被發現鄰居的轉移規律，并將其與序列規則無縫協作，形成一個統一的遞歸框架。在多個真實數據集上的實驗結果表明，ARNN都優于最新的方法。

7.?Memory Augmented Graph Neural Networks for Sequential Recommendation

摘要：在許多推薦系統中，用戶商品交互的時間順序可以揭示用戶行為的時間演化和順序。用戶將與之交互的商品可能取決于過去訪問的商品。然而，用戶和商品的大量增加使得順序推薦系統仍然面臨著不小的挑戰：（1）短期用戶興趣建模困難；（2）長期用戶興趣難以捕捉；（3）商品共現模式的有效建模。為了解決這些問題，我們提出了一種記憶增強圖神經網絡（MA-GNN）來同時捕捉用戶的長期和短期興趣。具體地說，我們使用一個圖神經網絡在短期內對商品上下文信息進行建模，并利用共享內存網絡來捕捉商品之間的長期依賴關系。除了用戶興趣的建模外，我們使用雙線性函數來捕捉相關商品的共現模式。我們在五個真實世界的數據集上對我們的模型進行了廣泛的評估，與幾種最先進的方法進行了比較，并使用了各種性能指標。實驗結果驗證了該模型對Top-K序列推薦任務的有效性。

8.?Leveraging Title-Abstract Attentive Semantics for Paper Recommendation

摘要：論文推薦是為用戶提供個性化的感興趣的論文的一個研究課題。然而，現有的大多數方法都是將標題和摘要作為學習論文表現形式的輸入，忽略了它們之間的語義關系。本文將摘要視為一個句子序列，并提出一個兩級注意神經網絡來捕捉：（1）句子中每個詞在語義上是否接近標題中的詞的能力。（2）摘要中每個句子相對于標題的程度，這通常是對摘要文檔的一個很好的概括。具體地，我們提出了一個有注意的長短期記憶（LSTM）網絡來學習句子的表示，并將一個門控遞歸單元（GRU）網絡與一個記憶網絡相結合來學習交互論文的長時順序句型，以供用戶和項目（論文）建模之用。我們在兩個真實的數據集上進行了大量的實驗，結果表明我們的方法在準確性方面優于其他最先進的方法。

9.?Diversified Interactive Recommendation with Implicit Feedback

摘要：交互式推薦系統能夠實現用戶與推薦系統之間的交互，已經引起了越來越多的研究興趣。以往的方法主要集中在優化推薦精度上。然而，它們往往忽略了推薦結果的多樣性，從而導致用戶體驗不盡如人意。本文針對用戶隱含反饋的交互式推薦問題，提出了一種新的多樣化推薦模型，即多樣化上下文組合Bandit（DC2B）。具體而言，DC2B在推薦過程中采用了決定點過程，以提高推薦結果的多樣性。為了學習模型參數，提出了一種基于變分貝葉斯推理的Thompson抽樣算法。此外，本文還提供了理論遺憾分析來保證DC2B的性能。在實際數據集上進行了大量的實驗，證明了該方法在平衡推薦精度和多樣性方面的有效性。

10.?Question-driven Purchasing Propensity Analysis for Recommendation

摘要：電子商務網站的商家期望推薦系統能夠吸引更多的消費，而這與消費者的購買傾向高度相關。然而，大多數現有的推薦系統關注的是顧客的總體偏好，而不是通常由顧客提出的問題所決定的即時需求。一個典型的推薦場景是：Bob想買一部可以玩PUBG游戲的手機。他對華為P20很感興趣，在它下面問“PUBG能在這部手機上順利運行嗎？“。然后我們的系統向他推薦最符合條件的手機。直覺上，不同的用戶問題可能會在其他有類似顧慮的用戶撰寫的評論中得到解決。為了解決這一問題，我們提出了一種新的問題驅動的注意神經網絡（QDANN），根據用戶生成的評論來評估提問者的即時需求和產品的合格性，并據此進行推薦。沒有監督，QDANN可以很好地利用評論來實現這一目標。注意機制可以用來為建議提供解釋。我們在淘寶網的三個領域對QDANN進行了評估。結果表明該方法的有效性，效果都優于基線法。

11.Sequential Recommendation with Relation-Aware Kernelized Self-Attention

摘要：最近的研究表明，注意機制可以改善順序推薦。根據這一發展，我們提出了關系感知核化自我注意（RKSA），它采用了ransformer的自我注意機制，并增加了一個概率模型。變壓器的原始自我關注是一種沒有關系意識的確定性措施。因此，我們引入了一個潛在空間來描述自注意，并且潛在空間將推薦上下文從關系中建模為多維偏正態分布，并根據共現、商品特征和用戶信息建立了核化協方差矩陣。本文通過增加推薦任務細節的概率模型，將Transformer的自我注意和順序推薦相結合。我們在基準數據集上對RKSA進行了實驗，與最近的基線模型相比，RKSA顯示出了顯著的提升。同時，RKSA還能夠產生一個潛在空間模型來回答推薦的原因。

12.?Incremental Fairness in Two-Sided Market Platforms: On Smoothly Updating Recommendations

摘要：今天的主要的在線平臺可以被認為是一個有商品和服務的生產者和顧客的雙邊市場。有人擔心，平臺過分強調客戶滿意度可能會影響生產商的福祉。為了解決這些問題，最近的工作中很少有人試圖為生產商(賣家)納入公平原則。然而，這些研究忽略了此類平臺中的一個重要問題——為了提高客戶效用，底層算法經常更新，從而導致生產商的曝光率突然發生變化。在本文中，我們關注于這種頻繁更新所引起的公平性問題，并主張對平臺算法進行增量更新，以便生產商有足夠的時間（在邏輯上和精神上）適應變化。然而，簡單的增量更新可能對客戶不公平。因此，針對部署在雙邊平臺上的建議，我們制定了一個基于ILP的在線優化，以n個步驟增量部署更改，在這種情況下，我們可以確保項目的平滑過渡，同時保證每個客戶的效用最小。對多個真實世界數據集的評估表明，我們提出的平臺更新機制對雙邊平臺中的生產商和客戶都是有效和公平的。

13.??Attention-guide Walk Model in Heterogeneous Information Network for Multi-style Recommendation Explanation

摘要：可解釋推薦的目的不僅在于向用戶提供推薦的商品，而且要讓用戶知道為什么要推薦這些商品。在一個異構的信息網絡中，用戶和商品之間有太多的交互因素可以用來解釋推薦。然而，這些相互作用的因素通常是巨大的、含蓄的和嘈雜的。現有的推薦解釋方法只考慮單一的解釋風格，如方面層或評論層。為了解決這些問題，我們針對異構信息網絡中的隸屬關系和交互關系，提出了一種基于注意-引導-行走模型的多風格推薦解釋生成框架（MSRE）。在注意機制的啟發下，我們確定了推薦解釋的重要上下文，并學習了多風格用戶商品交互的聯合表示，以提高推薦性能。通過對三個真實數據集的大量實驗，驗證了該框架在推薦性能和推薦解釋方面的有效性。?

14.?Asymmetrical Hierarchical Networks with Attentive Interactions for Interpretable Review-Based Recommendation

摘要：最近，推薦系統已經能夠通過利用用戶提供的評論來進行大大改進。現有方法通常將給定用戶或商品的所有評論合并到一個長文檔中，然后以相同的方式處理用戶和商品文檔。然而，在實踐中，這兩組評論明顯不同：用戶的評論反映了他們購買的各種商品，因此他們的主題非常不同，而一個商品的評論只與單個商品有關，因此在主題上是同質的。在這項工作中，我們開發了一個新的神經網絡模型，它通過非對稱注意模塊恰當地解釋了這一重要差異。用戶模塊學習只關注與目標商品相關的那些信號，而商品模塊學習提取關于商品屬性的最顯著的內容。我們的多層次范式解釋了這樣一個事實：不是所有的評論都同樣有用，也不是每個評論中的所有句子都同樣相關。在各種實際數據集上的大量實驗結果證明了該方法的有效性。

15.?Table2Analysis: Modeling and Recommendation of Common Analysis Patterns for Multi-Dimensional Data

摘要：給定一個多維數據表，人類會創建什么樣的方法來從中提取信息？從科學探索到商業智能，這是知識發現和決策自動化需要解決的關鍵問題。在本文中，我們提出了Table2Analysis，從大量(Table,analysis)對中學習常用的分析模式，并推薦對任何一個以前從未見過的表進行分析。多維數據作為輸入對現有的模型體系結構和訓練技術提出了挑戰。Table2Analysis基于啟發式搜索的深度Q學習，進行表到序列的生成，每個序列編碼一個分析。在我們對數據透視表推薦任務的大規模電子表格語料庫的評估中，Table2Analysis的前5名召回率為0.78，前1名的召回率為0.65

16.Symmetric Metric Learning with Adaptive Margin for Recommendation

摘要：基于度量學習的方法在推薦系統中引起了廣泛的興趣。目前的方法在度量空間中采取以用戶為中心的方式，保證用戶與負商品之間的距離比當前用戶與正商品之間的距離大一定的距離。而忽視了正向商品與負向商品之間的關系。因此，這兩個商品可能定位得很近，從而導致不正確的結果。同時，不同的用戶通常有不同的偏好，這些方法所采用的固定margin不能適應各種用戶的偏差，從而降低了性能。針對這兩個問題，我們提出了一種新的基于自適應margin的對稱度量學習算法。除了當前的以用戶為中心的度量之外，它對稱地引入了一個積極的以商品為中心的度量，該度量保持了從正向商品到用戶的距離，同時將負向商品從正商向品推離。此外，動態自適應margin經過良好訓練，以減輕偏差的影響。在三個公開推薦數據集上的實驗結果表明，與幾種最先進的方法相比，SML具有競爭性的性能。

17.?Multi-Feature Discrete Collaborative Filtering for Fast Cold-start Recommendation

摘要:Hashing是解決大規模推薦問題的一種有效技術，它在計算用戶對商品的偏好時具有較高的計算和存儲效率。然而，現有的基于Hashing的推薦方法還存在兩個重要問題：1）其推薦過程主要依賴于用戶商品的交互作用和單一的特定內容特征。當交互歷史或內容特性不可用時（冷啟動問題），它們的性能將嚴重惡化。2）現有的方法采用松弛優化學習散列碼，或采用離散坐標下降法直接求解二進制散列碼，這會造成很大的量化損失或消耗大量的計算時間。針對這些問題，本文提出了一種快速冷啟動推薦方法，即多特征離散協同過濾（MFDCF）。具體地，我們設計了一個低秩自加權多特征融合模塊，充分利用二者的互補性，自適應地將多個內容特征投影到二值信息哈希碼中。此外，我們開發了一個快速的離散優化算法來直接計算二進制哈希碼，操作簡單。在兩個公開推薦數據集上的實驗表明，MFDCF在各個方面都優于現有的技術。

18.Towards Comprehensive Recommender Systems: Time-Aware Unified Recommendations Based on Listwise Ranking of Implicit Cross-Network Data

摘要：web應用程序中豐富的信息使得推薦對于用戶和應用程序都至關重要。盡管現有的推薦系統是有效的，但是我們發現兩個主要的限制降低了它們的整體性能：（1）不能通過考慮用戶偏好的動態特性來為新用戶和現有用戶提供及時的推薦，以及（2）在使用隱式反饋時沒有對排名任務進行充分優化。因此，我們提出了一種新的基于深度學習的統一跨網絡解決方案，以緩解冷啟動和數據稀疏問題，并為新用戶和現有用戶提供及時的建議。此外，我們將隱式反饋下的排序問題視為一個分類任務，并針對隱式數據提出了一個通用的個性化列表優化準則，以有效地對商品列表進行排序。我們使用Twitter輔助信息來說明我們的跨網絡模型，以便在YouTube目標網絡上進行推薦。與多個時間感知基線和跨網絡基線的大量比較表明，我們所提出的方案在準確性、新穎性和多樣性方面具有優越性。此外，在流行的MovieLens數據集上進行的實驗表明，所提出的列表排序方法優于現有的排序技術。

19.?Fast Adaptively Weighted Matrix Factorization for Recommendation with Implicit Feedback

摘要：由于缺乏可靠的可觀察到的負面數據，來自內隱反饋的推薦是一項極具挑戰性的任務。一種流行而有效的隱式推薦方法是將未觀察到的數據視為負面，但這會降低他們的置信度。隱式推薦模型的兩個關鍵問題是如何分配置信權重和處理大量未觀測到的數據。然而，現有的方法要么追求快速學習，手工分配簡單的置信權值，缺乏靈活性，在評價用戶偏好時可能產生經驗偏差；要么自適應地推斷個性化的置信權值，但效率較低。為了實現自適應權值分配和有效的模型學習，我們提出了一種基于變分自動編碼器的快速自適應加權矩陣分解（FAWMF）。利用參數化神經網絡（函數）自適應地分配個性化數據的置信權，并根據數據推斷出網絡。此外，為了支持FAWMF快速穩定的學習，我們開發了一種新的基于批處理的學習算法fBGD，該算法對所有反饋數據進行訓練，但其復雜度與觀測數據的數量成線性關系。在實際數據集上的大量實驗表明了所提出的FAWMF及其學習算法fBGD的優越性。

20.Towards Hands-free Visual Dialog Interactive Recommendation

摘要：隨著多模式交互推薦技術的發展，用戶可以通過對商品圖像的自然語言反饋來表達自己的偏好，從而找到所需的商品。然而，現有的系統要么只檢索一個條目，要么要求用戶在每次用戶交互中從推薦列表中指定（例如，通過點擊或觸摸）評論的條目。因此，用戶不能免提，建議可能不切實際。我們提出一個免提的視覺對話推薦系統，以互動方式推薦商品清單。每次，系統都會顯示具有視覺外觀的商品列表。用戶可以用自然語言對列表進行注釋，以描述他們進一步想要的功能。使用這些多模式數據，系統將選擇另一個要推薦的商列表。為了從這些多模數據中了解用戶的偏好，我們開發了神經網絡模型來識別列表中的描述項并進一步預測期望的屬性。為了實現高效的交互式推薦，我們利用推斷出的用戶偏好，進一步開發了一種新的bandit算法。具體地說，為了避免系統過度探索，利用期望屬性來減少探索空間。更重要的是，為了在這種免提環境下實現樣本有效學習，我們從用戶用自然語言表達的相對偏好中獲取額外樣本，并設計了bandit學習中的成對logistic損失。我們的bandit模型由自然語言反饋和傳統logistic損失共同修正。實驗結果表明，經過幾次用戶交互后，本系統找到所需商品的概率是傳統交互式推薦者的3倍左右。

21.Contextual-Bandit Based Personalized Recommendation with Time-Varying User Interests

摘要：研究了一個高度非平穩環境下的上下文bandit問題，該問題由于用戶興趣的時變性而普遍存在于各種推薦系統中。考慮了兩個具有不相交和混合收益的模型來描述用戶對不同商的偏好隨時間的變化而不同的現象。在不相交的支付模型中，玩單只手臂的獎勵由一個特定于手臂的偏好向量決定，該偏好向量是分段平穩的，在不同的手臂上有異步和不同的變化。提出了一種有效的適應報酬突變的學習算法，并進行了理論后悔分析，證明了在時間長度$T$范圍內實現了后悔的次線性標度。該算法進一步擴展到一個具有混合收益的更一般的環境中，玩一只手臂的獎勵由手臂特定的偏好向量和所有手臂共享的聯合系數向量決定。在實際數據集上進行了實證實驗，以驗證所提出的學習算法相對于基線學習算法在兩種情況下的優越性。

22.Stochastically Robust Personalized Ranking for LSH Recommendation Retrieval

摘要：局部敏感散列（LSH）已成為最常用的近似近鄰搜索技術之一，以避免掃描所有數據點的高昂成本。對于推薦系統，LSH通過將用戶和商品向量編碼成二進制散列碼來實現高效的推薦檢索，降低了對所有商品向量進行窮盡性檢查以確定top-k項的開銷。然而，傳統的矩陣分解模型會因隨機抽取LSH散列函數而導致性能退化，直接影響推薦的最終質量。本文提出了一個名為?urmodel的框架，該框架在學習實值用戶和商品潛在向量時，考慮LSH散列函數的隨機性，最終提高LSH索引后的推薦精度。在公開數據集上的實驗表明，該框架不僅有效地學習了用戶的預測偏好，而且與LSH隨機性具有很高的兼容性，與最先進的基線相比，產生了更好的LSH后索引性能。

23.Deep Time-Stream Framework for Click-Through Rate Prediction by Tracking Interest Evolution.

摘要：在視頻推薦等工業應用中，點擊率預測是一項重要的任務。最近，有人提出了深度學習模型來學習用戶整體興趣的表示，而忽略了興趣可能隨時間動態變化的事實。我們認為有必要考慮CTR模型中的連續時間信息，以便從豐富的歷史行為中跟蹤用戶的興趣趨勢。本文提出了一種新的深度時間流框架（DTS），它通過常微分方程（ODE）引入時間信息。DTS使用神經網絡不斷地模擬興趣的演變，從而能夠解決根據用戶的歷史行為動態表示用戶興趣的挑戰。此外，我們的框架可以無縫地應用到任何現有的深度CTR模型，通過利用額外的時間流模塊，而不會對原始的CTR模型進行任何更改。在公共數據集上進行了數十億個實際數據集的實驗，驗證了所提出方法的有效性。

24.Improved Algorithms for Conservative Exploration in Bandits.

摘要：在許多領域，如數字營銷、醫療保健、金融和機器人技術，通常在生產中運行經過良好測試和可靠的基線策略（例如，推薦系統）。然而，基準政策往往是次優的。在這種情況下，需要部署與系統交互的在線學習算法（例如，多臂bandit算法），以便在學習過程中的性能幾乎不會比基線本身的性能差的約束下學習更好/最優的策略。本文研究了上下文線性bandit環境下的保守學習問題，提出了一種新的算法：保守約束LinUCB（CLUCB2）。我們得到了CLUCB2的遺憾界，它與已有的結果相匹配，并通過經驗證明它在許多綜合問題和實際問題中優于最先進的保守bandit算法。最后，我們考慮了一個更現實的約束，即性能只在預先定義的檢查點（而不是在每個步驟）進行驗證，并說明這種放松的約束是如何對CLUCB2的遺憾和經驗性能產生有利影響的。

25.Deep Match to Rank Model for Personalized Click-Through Rate Prediction.

摘要：點擊率預測是推薦系統和許多其他應用領域的核心任務。對于CTR預測模型來說，個性化是提高性能、增強用戶體驗的關鍵。近年來，人們提出了幾種模型來從隱含反映用戶個性化偏好的用戶行為數據中提取用戶興趣。然而，現有的CTR預測領域的研究主要集中在用戶表示上，而很少關注用戶與商品之間的相關性，這直接衡量了用戶對目標商品的偏好程度。基于此，我們提出了一種新的深度匹配排名模型DMR，它結合了匹配方法中協同過濾的思想，用于CTR預測中的排名任務。在DMR中，我們設計了用戶商品目網絡和商品-商品網絡，以兩種形式表示相關性。在用戶-商品網絡中，我們通過嵌入空間中相應表示的內積來表示用戶與商品之間的相關性。同時，提出了一個輔助匹配網絡來監督訓練，并推送更大的內積來表示更高的相關性。在商品對商品網絡中，我們首先通過注意機制計算用戶交互商品與目標商品之間的商品間相似度，然后對相似度進行總結，得到另一種形式的用戶-商品關聯。我們在公共數據集和工業數據集上進行了大量的實驗，以驗證我們的模型的有效性，該模型的性能明顯優于最先進的模型。

總結

以上是生活随笔為你收集整理的2020年推荐系统工程师炼丹手册的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：推荐算法炼丹笔记：电商搜索推荐业务词汇表
下一篇：推荐算法炼丹笔记：如何让你的推荐系统具有

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

windows

2020年推荐系统工程师炼丹手册

總結