當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

WSDM 2022 | 基于元学习的多场景多任务商家建模

發(fā)布時間：2023/12/15 编程问答 83 豆豆

生活随笔收集整理的這篇文章主要介紹了 WSDM 2022 | 基于元学习的多场景多任务商家建模小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

丨目錄：

· 前言

· 背景

· 問題定義

· 算法建模

· 實(shí)驗(yàn)

· 總結(jié)展望

·?參考文獻(xiàn)

· 關(guān)于我們

??前言

面向淘系商家或廣告主的商家理解與建模，是阿里媽媽客戶生態(tài)建設(shè)的關(guān)鍵一環(huán)。有別于C端的用戶增長與建模，在數(shù)據(jù)層面，商家端的客戶意圖與訴求、操作行為更加多樣、復(fù)雜，而且數(shù)據(jù)稀疏；在目標(biāo)層面上，商家建模的目標(biāo)更加多樣化，包括目標(biāo)客戶多樣化以及預(yù)測指標(biāo)的多樣化；在應(yīng)用場景層面上，隨著淘系廣告業(yè)態(tài)越來越豐富（比如搜索廣告、信息流廣告、品牌搜索廣告、直播廣告、互動廣告等），商家建模也需要適應(yīng)多場景的建模需求，可以快速響應(yīng)不同場景的業(yè)務(wù)需求。

在本文中，我們提出了一種基于元網(wǎng)絡(luò)的多場景多任務(wù)模型（M2M），服務(wù)于阿里媽媽橫向增長的多種業(yè)務(wù)，模型具備多目標(biāo)多場景的預(yù)測能力，可以快速賦能不同場景下新的業(yè)務(wù)需求。該項(xiàng)工作論文發(fā)表在 WSDM 2022，歡迎交流討論。

論文下載：

http://arxiv.org/abs/2201.06814

? 背景

圖一平臺與廣告主交互示意圖

廣告主在阿里媽媽平臺體系中發(fā)揮著重要的作用，滿足廣告主的營銷需求并促進(jìn)廣告主店鋪的發(fā)展對于電商平臺的長期繁榮至關(guān)重要。然而，無論是工業(yè)界還是學(xué)術(shù)界，目前的研究更加側(cè)重于用戶側(cè)建模（如CTR預(yù)估），對于廣告主建模的關(guān)注較少。和用戶側(cè)建模方式不同，廣告主建模涉及了多種任務(wù)，比如廣告主店鋪的點(diǎn)擊、消耗、平臺活躍天數(shù)等。除了多任務(wù)的需求，廣告主建模還需要考慮多場景問題。廣告主進(jìn)入阿里媽媽平臺后，可以選擇在不同的場景（產(chǎn)品線）進(jìn)行投放。廣告主建模是阿里媽媽平臺與廣告主交互的基礎(chǔ)，交互形式如圖一所示：首先廣告主在單個/多個場景投放廣告；然后模型給出多個場景多個任務(wù)下的預(yù)測結(jié)果；最后模型將預(yù)測結(jié)果和平臺多樣的產(chǎn)品/運(yùn)營工具結(jié)合，對廣告主產(chǎn)出定制化的任務(wù)/消息等，幫助廣告主在平臺留存以及成長。

圖二解決思路示意圖

在廣告主建模過程中，我們需要建模多場景下的多種任務(wù)。在具體建模多任務(wù)多場景問題時，我們遇到了很多挑戰(zhàn)。第一，模型可擴(kuò)展性問題，常規(guī)解法可以對每個場景/任務(wù)分別建模，但是這種常規(guī)解法隨著場景的增多需要建設(shè)&維護(hù)的模型也會隨之增多，在工業(yè)界并不具備可擴(kuò)展性；第二，樣本稀疏問題，由于不同的場景建立時間、承接廣告主數(shù)量等有所差異，導(dǎo)致在小場景或者新場景下模型會面臨樣本稀疏問題，模型的訓(xùn)練效果會受到影響；第三，場景關(guān)系復(fù)雜的問題，不同場景之間有著復(fù)雜的關(guān)聯(lián)關(guān)系，場景的關(guān)聯(lián)關(guān)系甚至?xí)S著任務(wù)的不同而發(fā)生變化，模型需要在捕捉多個任務(wù)之間固有關(guān)聯(lián)的基礎(chǔ)上，捕捉不同場景下多個任務(wù)的動態(tài)關(guān)聯(lián)。常規(guī)的MTL解法如圖二(a)所示，底層結(jié)構(gòu)為共享信息結(jié)構(gòu)，通過gate（MMOE[1]/PLE[2]等）或者attention（MRAN[3]等）方式，得到特定任務(wù)下的信息表征，再通過特定任務(wù)的塔結(jié)構(gòu)，最終得到特征任務(wù)的預(yù)測結(jié)果。但是在整個模型架構(gòu)中沒有顯式的表征場景信息，無法學(xué)習(xí)復(fù)雜的場景關(guān)聯(lián)。

模型的主要創(chuàng)新點(diǎn)有：

通過元網(wǎng)絡(luò)Meta Unit顯式的表征場景信息，Meta unit和底層MTL同步進(jìn)行參數(shù)更新，使得模型具備可擴(kuò)展性；
在元網(wǎng)絡(luò)Meta Unit的輸入信息中，我們引入了豐富的特定場景相關(guān)的先驗(yàn)信息，緩解了小場景或者新場景下樣本稀疏的問題；
模型將元學(xué)習(xí)思想和多任務(wù)模型結(jié)合，元網(wǎng)絡(luò)作為頂層網(wǎng)絡(luò)，MMoE、PLE等多任務(wù)模型作為底層網(wǎng)絡(luò)，使得模型在捕捉多個任務(wù)之間固有關(guān)聯(lián)的基礎(chǔ)上，還可以捕捉不同場景下多個任務(wù)的動態(tài)關(guān)聯(lián)。

??問題定義

廣告主在與阿里媽媽平臺交互的過程中會包含很多信息，歸納為4大類信息：場景屬性信息，定義為，包含廣告主的場景類型，以及相關(guān)的一些統(tǒng)計特征；廣告主畫像信息，定義為，包含店鋪類型等基礎(chǔ)屬性信息；多類別行為序列信息，定義為，表示在時間窗口 T 內(nèi)的多種類別的行為特征。具體的，通過表征廣告主在時間點(diǎn) 時發(fā)生的登錄、操作等行為特征；多類別效果序列信息，定義為，表示在時間窗口內(nèi)的效果特征。具體的，通過表征廣告主在時間點(diǎn) 時在平臺產(chǎn)生的消耗、點(diǎn)擊等效果特征。

給定場景屬性信息，廣告主畫像信息 , 多類別行為序列信息 , 多類別效果序列信息 , 我們需要訓(xùn)練一個end-to-end模型，預(yù)測在未來天內(nèi)的多種場景（直通車、超級推薦、極速推等）下的多類任務(wù)（店鋪消耗、店鋪點(diǎn)擊、店鋪在平臺的活躍天數(shù)等），公式化如下：

其中，是我們需要學(xué)習(xí)的函數(shù)，預(yù)測的時間周期可以擴(kuò)展為不同時間周期。

? 算法建模

圖三模型框架圖

模型整體的框架圖如圖三所示，主要包含兩個網(wǎng)絡(luò)：第一部分是主干網(wǎng)絡(luò)，用來得到特征和任務(wù)的嵌入式表征；第二部分是元學(xué)習(xí)網(wǎng)絡(luò)，主要包含三種結(jié)構(gòu)：1）元學(xué)習(xí)單元：顯式建模場景信息 2）Attention元網(wǎng)絡(luò)：捕捉不同場景下多個任務(wù)的動態(tài)關(guān)聯(lián)：3）tower元網(wǎng)絡(luò)：增強(qiáng)特定場景的表征能力。其中Attention元網(wǎng)絡(luò)和Tower元網(wǎng)絡(luò)采取級聯(lián)方式連接，Attention元網(wǎng)絡(luò)的輸出是Tower元網(wǎng)絡(luò)的輸入。以下對各子網(wǎng)絡(luò)進(jìn)行詳細(xì)的介紹。

主干網(wǎng)絡(luò)

主干網(wǎng)絡(luò)的作用是對特征信息進(jìn)行處理，得到特征信息的嵌入式表征，作為后面網(wǎng)絡(luò)的輸入。此部分最終得到的嵌入式表征有三種：Expert信息表征、任務(wù)信息表征和場景信息表征。

Expert信息表征

表示第個Expert信息表征，和表征序列信息，Dense表征連續(xù)型特征信息。在這里我們采用Transformer，函數(shù)對于序列信息進(jìn)行提取。

任務(wù)信息表征

表示特定任務(wù) 的任務(wù)信息表征，受到MRAN模型的啟發(fā)，我們將不同類別的任務(wù)進(jìn)行信息表征，和特征信息保持在同一維度。由于在測試集合中無法得到任務(wù)的表征信息，所以這里的任務(wù)信息表征是全局的而不是局部的。

場景信息表征

表示場景信息表征，在這里我們將場景信息和id類型信息拼接后，通過全連接層得到最終的場景信息表征。

元學(xué)習(xí)網(wǎng)絡(luò)

圖四元學(xué)習(xí)網(wǎng)絡(luò)

元學(xué)習(xí)單元

元學(xué)習(xí)單元用來顯式建模場景信息，和傳統(tǒng)的建模方式（比如將場景相關(guān)信息作為輸入特征加入到模型中）不同，為了更好的捕捉動態(tài)的場景關(guān)聯(lián)關(guān)系，我們通過上節(jié)講到的場景信息表征作為元學(xué)習(xí)單元的輸入，元學(xué)習(xí)單元通過全連接層的方式將進(jìn)行轉(zhuǎn)化，為每個場景產(chǎn)出動態(tài)的網(wǎng)絡(luò)weight和bias：

其中為場景信息表征，在經(jīng)過全連接層后，再通過一個函數(shù)，最終得到weight matrix and bias vector 。通過這種方式最終得到特定場景的元表征后，每個場景動態(tài)的weight matrix and bias vector 會作為底層網(wǎng)絡(luò)（Attention網(wǎng)絡(luò)&Tower網(wǎng)絡(luò)）的動態(tài)參數(shù)，參與到網(wǎng)絡(luò)的學(xué)習(xí)以及替代底層網(wǎng)絡(luò)進(jìn)行梯度更新：

其中，是維度為的輸入向量，是非線性的激活函數(shù)，可以是tanh、ReLU等等，是元學(xué)習(xí)單元的最終輸出。我們把元學(xué)習(xí)單元的整個處理過程定義為函數(shù)。

Attention元網(wǎng)絡(luò)

傳統(tǒng)的alignment attention結(jié)構(gòu)可以建模任務(wù)和特征之間的關(guān)聯(lián)關(guān)系，但是忽略了動態(tài)的場景因素的影響。因此，我們設(shè)計了Attention元網(wǎng)絡(luò)，可以在計算attention權(quán)重系數(shù)的時候引入場景信息，從而可以在不同場景下產(chǎn)出動態(tài)的attention權(quán)重系數(shù)：

其中，是維度為的Expert表征，是維度為的Task表征。是一個轉(zhuǎn)換向量，得到權(quán)重系數(shù)。最終，通過對所有的加權(quán)求和，我們得到了對于特定任務(wù)的表征。

Tower元網(wǎng)絡(luò)

在得到特定任務(wù)的表征之后，每個任務(wù)會通過Tower Layer，輸出每個任務(wù)的預(yù)測結(jié)果。為了進(jìn)一步增強(qiáng)特定場景的表征能力，和Attention元網(wǎng)絡(luò)類似，我們在Tower Layer中引入了元學(xué)習(xí)單元：

模型訓(xùn)練

考慮到我們的多類別任務(wù)都屬于回歸任務(wù)，且反應(yīng)變量Y近似符合泊松分布，我們采用Possion Loss作為損失函數(shù)，最終的優(yōu)化目標(biāo)為：

其中，等式右邊的第一項(xiàng)表示對特定任務(wù)下loss的加權(quán)求和，第二項(xiàng)表示對頂層元網(wǎng)絡(luò)和底層多任務(wù)結(jié)構(gòu)的參數(shù)L2正則化處理，表征懲罰系數(shù)。對于每一個特定任務(wù)loss，計算公式為：

? 實(shí)驗(yàn)

離線實(shí)驗(yàn)

對于回歸問題來說，通常使用MAPE（Mean Absolute Percentage Error）評測指標(biāo)衡量模型的微平均效果，使用NMAE（Normalized Mean Absolute Error）評測指標(biāo)衡量模型的宏平均效果。在我們的場景中，一些任務(wù)的Y值可能為0，在MAPE中無法計算，故用SMAPE（Symmetric Mean Absolute Percentage Error）替代MAPE。SMAPE和NMAE的計算公式為：

其中，N代表帶評測的測試集中廣告主的數(shù)量，和代表第i個廣告主的預(yù)測結(jié)果和真實(shí)結(jié)果。

圖五整體評估結(jié)果圖六整體評估結(jié)果可視化

我們評估了不同模型的實(shí)驗(yàn)結(jié)果如圖五所示，我們可以看到我們提出的M2M模型相較于其他baseline在不同任務(wù)和不同場景下取得了更好的效果。具體來說，對于場景A、B、C的點(diǎn)擊任務(wù)，我們相較于最佳基線效果在NMAE和SMAPE上提升比例分別為 (+ 4.7%, + 24.1%, + 26.7%)和 (+ 6.9%, + 5.4%, + 8.9%) 。同樣的，在活躍天數(shù)任務(wù)上的提升分別為 (+ 13.3%, + 9.8%, + 12.8%) 和(+ 15.9%, + 24.1%, + 18.9%)。此外，我們發(fā)現(xiàn)MMOE，CGC（Customized Gate Control），Cross-Stitich方法優(yōu)于單一任務(wù)學(xué)習(xí)方法，這表明多任務(wù)模型可以很好的捕捉任務(wù)之間的相關(guān)性。有趣的是，我們注意到對于M2M模型來說，相同的任務(wù)在不同場景下提升的比例有所差異，這可能與場景的數(shù)據(jù)稀疏程度不同有關(guān)，模型對于小場景（比如場景B和場景C）的提升作用更加顯著，說明我們的模型通過元學(xué)習(xí)單元的方式，很好的捕捉了場景之間的關(guān)聯(lián)信息，緩解了小場景或者新場景下樣本稀疏的問題。最后，我們在圖六呈現(xiàn)了模型性能的詳細(xì)可視化，為了方便比較，我們將最好的基線模型CGC也在圖中進(jìn)行了展示。

在線實(shí)驗(yàn)

圖七加速任務(wù)流程圖

在離線驗(yàn)證的基礎(chǔ)上，我們進(jìn)一步在加速寶產(chǎn)品上驗(yàn)證算法升級的業(yè)務(wù)效果。加速寶產(chǎn)品的流程如圖七所示，通過模型我們預(yù)測出廣告主在未來一段時間的支出，點(diǎn)擊和活躍天數(shù)等等，接下來我們選擇平臺活躍水平較低的客戶，根據(jù)廣告主在未來一段時間的支出，點(diǎn)擊產(chǎn)出定制化的任務(wù)，廣告主通過完成這些任務(wù)，得到一些權(quán)益獎勵，促進(jìn)在平臺的活躍。我們比較了新舊兩版模型的業(yè)務(wù)效果，新版本的模型取得了 + 2.59% 的活躍率提升和+ 2.09% 的每用戶平均收入（ARPU）提升。

? 總結(jié)展望

本項(xiàng)工作中，我們針對多場景多任務(wù)的問題提出了一個高效且具有較強(qiáng)泛化能力的模型框架M2M，通過構(gòu)建元學(xué)習(xí)單元顯式建模場景信息。進(jìn)一步的，為了更好地表征場景特定信息，我們提出了元學(xué)習(xí)網(wǎng)絡(luò)，該網(wǎng)絡(luò)由兩個組件組成：Attention元網(wǎng)絡(luò)模塊和Tower元網(wǎng)絡(luò)模塊，這兩個模塊是分層組織的：Attention元網(wǎng)絡(luò)模塊位于較低位置以捕獲不同場景間相關(guān)性，Tower元網(wǎng)絡(luò)模塊位于較高位置以增強(qiáng)特定場景特征的表征能力。我們通過離線和在線實(shí)驗(yàn)驗(yàn)證了模型的有效性，特別指出的是模型在小場景&新場景等數(shù)據(jù)稀疏的問題中效果提升更加明顯。在未來工作中，我們將進(jìn)一步的提高模型的通用能力，同時建模分類任務(wù)和回歸任務(wù)；此外，將M2M模型和Optimization-based的元學(xué)習(xí)方法結(jié)合也是一個有意思的問題。

? 關(guān)于我們

我們是阿里媽媽客戶增長算法團(tuán)隊(duì)，致力于構(gòu)建良好的廣告平臺客戶生態(tài)。我們的工作涉及廣告主全生命周期理解與建模、營銷異質(zhì)內(nèi)容理解&推薦、冷啟動優(yōu)化、客戶機(jī)制策略等眾多方向，相比C端用戶增長具有更多的挑戰(zhàn)。團(tuán)隊(duì)近一年在WSDM、CIKM等頂級會議發(fā)表多篇論文，技術(shù)氛圍濃厚，業(yè)務(wù)前景發(fā)展廣闊，歡迎感興趣的同學(xué)加入我們！

投遞簡歷郵箱：

alimama_tech@service.alibaba.com

? 參考文獻(xiàn)

[1]Ma J, Zhao Z, Yi X, et al. Modeling task relationships in multi-task learning with multi-gate mixture-of-experts[C]//Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2018: 1930-1939.

[2]Tang H, Liu J, Zhao M, et al. Progressive layered extraction (ple): A novel multi-task learning (mtl) model for personalized recommendations[C]//Fourteenth ACM Conference on Recommender Systems. 2020: 269-278.

[3]Zhao J, Du B, Sun L, et al. Multiple relational attention network for multi-task learning[C]//Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2019: 1123-1131.

END

也許你還想看

丨阿里媽媽技術(shù)團(tuán)隊(duì)4篇論文入選WSDM 2022

丨WSDM 2022 | 合約廣告自適應(yīng)統(tǒng)一分配框架

歡迎關(guān)注「阿里媽媽技術(shù)」，了解更多~

瘋狂暗示↓↓↓↓↓↓↓

總結(jié)

以上是生活随笔為你收集整理的WSDM 2022 | 基于元学习的多场景多任务商家建模的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：【阿里妈妈营销科学系列】第八篇：增强分析
下一篇： WSDM 2022 | 点击率模型特征交