WSDM 2022 | 基于元学习的多场景多任务商家建模
丨目錄:
· 前言
· 背景
· 問題定義
· 算法建模
· 實(shí)驗(yàn)
· 總結(jié)展望
·?參考文獻(xiàn)
· 關(guān)于我們
??前言
面向淘系商家或廣告主的商家理解與建模,是阿里媽媽客戶生態(tài)建設(shè)的關(guān)鍵一環(huán)。有別于C端的用戶增長與建模,在數(shù)據(jù)層面,商家端的客戶意圖與訴求、操作行為更加多樣、復(fù)雜,而且數(shù)據(jù)稀疏;在目標(biāo)層面上,商家建模的目標(biāo)更加多樣化,包括目標(biāo)客戶多樣化以及預(yù)測指標(biāo)的多樣化;在應(yīng)用場景層面上,隨著淘系廣告業(yè)態(tài)越來越豐富(比如搜索廣告、信息流廣告、品牌搜索廣告、直播廣告、互動廣告等),商家建模也需要適應(yīng)多場景的建模需求,可以快速響應(yīng)不同場景的業(yè)務(wù)需求。
在本文中,我們提出了一種基于元網(wǎng)絡(luò)的多場景多任務(wù)模型(M2M),服務(wù)于阿里媽媽橫向增長的多種業(yè)務(wù),模型具備多目標(biāo)多場景的預(yù)測能力,可以快速賦能不同場景下新的業(yè)務(wù)需求。該項(xiàng)工作論文發(fā)表在 WSDM 2022,歡迎交流討論。
論文下載:
http://arxiv.org/abs/2201.06814
? 背景
圖一 平臺與廣告主交互示意圖廣告主在阿里媽媽平臺體系中發(fā)揮著重要的作用,滿足廣告主的營銷需求并促進(jìn)廣告主店鋪的發(fā)展對于電商平臺的長期繁榮至關(guān)重要。然而,無論是工業(yè)界還是學(xué)術(shù)界,目前的研究更加側(cè)重于用戶側(cè)建模(如CTR預(yù)估),對于廣告主建模的關(guān)注較少。和用戶側(cè)建模方式不同,廣告主建模涉及了多種任務(wù),比如廣告主店鋪的點(diǎn)擊、消耗、平臺活躍天數(shù)等。除了多任務(wù)的需求,廣告主建模還需要考慮多場景問題。廣告主進(jìn)入阿里媽媽平臺后,可以選擇在不同的場景(產(chǎn)品線)進(jìn)行投放。廣告主建模是阿里媽媽平臺與廣告主交互的基礎(chǔ),交互形式如圖一所示:首先廣告主在單個/多個場景投放廣告;然后模型給出多個場景多個任務(wù)下的預(yù)測結(jié)果;最后模型將預(yù)測結(jié)果和平臺多樣的產(chǎn)品/運(yùn)營工具結(jié)合,對廣告主產(chǎn)出定制化的任務(wù)/消息等,幫助廣告主在平臺留存以及成長。
圖二 解決思路示意圖在廣告主建模過程中,我們需要建模多場景下的多種任務(wù)。在具體建模多任務(wù)多場景問題時,我們遇到了很多挑戰(zhàn)。第一,模型可擴(kuò)展性問題,常規(guī)解法可以對每個場景/任務(wù)分別建模,但是這種常規(guī)解法隨著場景的增多需要建設(shè)&維護(hù)的模型也會隨之增多,在工業(yè)界并不具備可擴(kuò)展性;第二,樣本稀疏問題,由于不同的場景建立時間、承接廣告主數(shù)量等有所差異,導(dǎo)致在小場景或者新場景下模型會面臨樣本稀疏問題,模型的訓(xùn)練效果會受到影響;第三,場景關(guān)系復(fù)雜的問題,不同場景之間有著復(fù)雜的關(guān)聯(lián)關(guān)系,場景的關(guān)聯(lián)關(guān)系甚至?xí)S著任務(wù)的不同而發(fā)生變化,模型需要在捕捉多個任務(wù)之間固有關(guān)聯(lián)的基礎(chǔ)上,捕捉不同場景下多個任務(wù)的動態(tài)關(guān)聯(lián)。常規(guī)的MTL解法如圖二(a)所示,底層結(jié)構(gòu)為共享信息結(jié)構(gòu),通過gate(MMOE[1]/PLE[2]等)或者attention(MRAN[3]等)方式,得到特定任務(wù)下的信息表征,再通過特定任務(wù)的塔結(jié)構(gòu),最終得到特征任務(wù)的預(yù)測結(jié)果。但是在整個模型架構(gòu)中沒有顯式的表征場景信息,無法學(xué)習(xí)復(fù)雜的場景關(guān)聯(lián)。
模型的主要創(chuàng)新點(diǎn)有:
通過元網(wǎng)絡(luò)Meta Unit顯式的表征場景信息,Meta unit和底層MTL同步進(jìn)行參數(shù)更新,使得模型具備可擴(kuò)展性;
在元網(wǎng)絡(luò)Meta Unit的輸入信息中,我們引入了豐富的特定場景相關(guān)的先驗(yàn)信息,緩解了小場景或者新場景下樣本稀疏的問題;
模型將元學(xué)習(xí)思想和多任務(wù)模型結(jié)合,元網(wǎng)絡(luò)作為頂層網(wǎng)絡(luò),MMoE、PLE等多任務(wù)模型作為底層網(wǎng)絡(luò),使得模型在捕捉多個任務(wù)之間固有關(guān)聯(lián)的基礎(chǔ)上,還可以捕捉不同場景下多個任務(wù)的動態(tài)關(guān)聯(lián)。
??問題定義
廣告主在與阿里媽媽平臺交互的過程中會包含很多信息,歸納為4大類信息:場景屬性信息,定義為,包含廣告主的場景類型,以及相關(guān)的一些統(tǒng)計特征;廣告主畫像信息,定義為,包含店鋪類型等基礎(chǔ)屬性信息;多類別行為序列信息,定義為,表示在時間窗口 T 內(nèi)的多種類別的行為特征。具體的,通過表征廣告主在時間點(diǎn) 時發(fā)生的登錄、操作等行為特征;多類別效果序列信息,定義為,表示在時間窗口 內(nèi)的效果特征。具體的,通過表征廣告主在時間點(diǎn) 時在平臺產(chǎn)生的消耗、點(diǎn)擊等效果特征。
給定場景屬性信息 ,廣告主畫像信息 , 多類別行為序列信息 , 多類別效果序列信息 , 我們需要訓(xùn)練一個end-to-end模型,預(yù)測在未來 天內(nèi)的多種場景(直通車、超級推薦、極速推等)下的多類任務(wù)(店鋪消耗、店鋪點(diǎn)擊、店鋪在平臺的活躍天數(shù)等),公式化如下:
其中, 是我們需要學(xué)習(xí)的函數(shù),預(yù)測的時間周期可以擴(kuò)展為不同時間周期。
? 算法建模
圖三 模型框架圖模型整體的框架圖如圖三所示,主要包含兩個網(wǎng)絡(luò):第一部分是主干網(wǎng)絡(luò),用來得到特征和任務(wù)的嵌入式表征;第二部分是元學(xué)習(xí)網(wǎng)絡(luò),主要包含三種結(jié)構(gòu):1)元學(xué)習(xí)單元:顯式建模場景信息 2)Attention元網(wǎng)絡(luò):捕捉不同場景下多個任務(wù)的動態(tài)關(guān)聯(lián):3)tower元網(wǎng)絡(luò):增強(qiáng)特定場景的表征能力。其中Attention元網(wǎng)絡(luò)和Tower元網(wǎng)絡(luò)采取級聯(lián)方式連接,Attention元網(wǎng)絡(luò)的輸出是Tower元網(wǎng)絡(luò)的輸入。以下對各子網(wǎng)絡(luò)進(jìn)行詳細(xì)的介紹。
主干網(wǎng)絡(luò)
主干網(wǎng)絡(luò)的作用是對特征信息進(jìn)行處理,得到特征信息的嵌入式表征,作為后面網(wǎng)絡(luò)的輸入。此部分最終得到的嵌入式表征有三種:Expert信息表征、任務(wù)信息表征和場景信息表征。
Expert信息表征
表示第 個Expert信息表征,和表征序列信息,Dense表征連續(xù)型特征信息。在這里我們采用Transformer,函數(shù)對于序列信息進(jìn)行提取。
任務(wù)信息表征
表示特定任務(wù) 的任務(wù)信息表征,受到MRAN模型的啟發(fā),我們將不同類別的任務(wù)進(jìn)行信息表征,和特征信息保持在同一維度。由于在測試集合中無法得到任務(wù)的表征信息,所以這里的任務(wù)信息表征是全局的而不是局部的。
場景信息表征
表示場景信息表征,在這里我們將場景信息和id類型信息拼接后,通過全連接層得到最終的場景信息表征。
元學(xué)習(xí)網(wǎng)絡(luò)
圖四 元學(xué)習(xí)網(wǎng)絡(luò)元學(xué)習(xí)單元
元學(xué)習(xí)單元用來顯式建模場景信息,和傳統(tǒng)的建模方式(比如將場景相關(guān)信息作為輸入特征加入到模型中)不同,為了更好的捕捉動態(tài)的場景關(guān)聯(lián)關(guān)系,我們通過上節(jié)講到的場景信息表征作為元學(xué)習(xí)單元的輸入,元學(xué)習(xí)單元通過全連接層的方式將進(jìn)行轉(zhuǎn)化,為每個場景產(chǎn)出動態(tài)的網(wǎng)絡(luò)weight和bias:
其中為場景信息表征,在經(jīng)過全連接層后,再通過一個函數(shù),最終得到weight matrix and bias vector 。通過這種方式最終得到特定場景的元表征后,每個場景動態(tài)的weight matrix and bias vector 會作為底層網(wǎng)絡(luò)(Attention網(wǎng)絡(luò)&Tower網(wǎng)絡(luò))的動態(tài)參數(shù),參與到網(wǎng)絡(luò)的學(xué)習(xí)以及替代底層網(wǎng)絡(luò)進(jìn)行梯度更新:
其中,是維度為 的輸入向量,是非線性的激活函數(shù),可以是tanh、ReLU等等,是元學(xué)習(xí)單元的最終輸出。我們把元學(xué)習(xí)單元的整個處理過程定義為函數(shù)。
Attention元網(wǎng)絡(luò)
傳統(tǒng)的alignment attention結(jié)構(gòu)可以建模任務(wù)和特征之間的關(guān)聯(lián)關(guān)系,但是忽略了動態(tài)的場景因素的影響。因此,我們設(shè)計了Attention元網(wǎng)絡(luò),可以在計算attention權(quán)重系數(shù)的時候引入場景信息,從而可以在不同場景下產(chǎn)出動態(tài)的attention權(quán)重系數(shù):
其中,是維度為的Expert表征,是維度為的Task表征。是一個轉(zhuǎn)換向量,得到權(quán)重系數(shù)。最終,通過對所有的加權(quán)求和,我們得到了對于特定任務(wù)的表征。
Tower元網(wǎng)絡(luò)
在得到特定任務(wù)的表征之后,每個任務(wù)會通過Tower Layer,輸出每個任務(wù)的預(yù)測結(jié)果。為了進(jìn)一步增強(qiáng)特定場景的表征能力,和Attention元網(wǎng)絡(luò)類似,我們在Tower Layer中引入了元學(xué)習(xí)單元:
模型訓(xùn)練
考慮到我們的多類別任務(wù)都屬于回歸任務(wù),且反應(yīng)變量Y近似符合泊松分布,我們采用Possion Loss作為損失函數(shù),最終的優(yōu)化目標(biāo)為:
其中,等式右邊的第一項(xiàng)表示對特定任務(wù)下loss的加權(quán)求和,第二項(xiàng)表示對頂層元網(wǎng)絡(luò)和底層多任務(wù)結(jié)構(gòu)的參數(shù)L2正則化處理, 表征懲罰系數(shù)。對于每一個特定任務(wù)loss,計算公式為:
? 實(shí)驗(yàn)
離線實(shí)驗(yàn)
對于回歸問題來說,通常使用MAPE(Mean Absolute Percentage Error)評測指標(biāo)衡量模型的微平均效果,使用NMAE(Normalized Mean Absolute Error)評測指標(biāo)衡量模型的宏平均效果。在我們的場景中,一些任務(wù)的Y值可能為0,在MAPE中無法計算,故用SMAPE(Symmetric Mean Absolute Percentage Error)替代MAPE。SMAPE和NMAE的計算公式為:
其中,N代表帶評測的測試集中廣告主的數(shù)量, 和 代表第i個廣告主的預(yù)測結(jié)果和真實(shí)結(jié)果。
圖五 整體評估結(jié)果圖六 整體評估結(jié)果可視化我們評估了不同模型的實(shí)驗(yàn)結(jié)果如圖五所示,我們可以看到我們提出的M2M模型相較于其他baseline在不同任務(wù)和不同場景下取得了更好的效果。具體來說,對于場景A、B、C的點(diǎn)擊任務(wù),我們相較于最佳基線效果在NMAE和SMAPE上提升比例分別為 (+ 4.7%, + 24.1%, + 26.7%)和 (+ 6.9%, + 5.4%, + 8.9%) 。同樣的,在活躍天數(shù)任務(wù)上的提升分別為 (+ 13.3%, + 9.8%, + 12.8%) 和(+ 15.9%, + 24.1%, + 18.9%)。此外,我們發(fā)現(xiàn)MMOE,CGC(Customized Gate Control),Cross-Stitich方法優(yōu)于單一任務(wù)學(xué)習(xí)方法,這表明多任務(wù)模型可以很好的捕捉任務(wù)之間的相關(guān)性。有趣的是,我們注意到對于M2M模型來說,相同的任務(wù)在不同場景下提升的比例有所差異,這可能與場景的數(shù)據(jù)稀疏程度不同有關(guān),模型對于小場景(比如場景B和場景C)的提升作用更加顯著,說明我們的模型通過元學(xué)習(xí)單元的方式,很好的捕捉了場景之間的關(guān)聯(lián)信息,緩解了小場景或者新場景下樣本稀疏的問題。最后,我們在圖六呈現(xiàn)了模型性能的詳細(xì)可視化,為了方便比較,我們將最好的基線模型CGC也在圖中進(jìn)行了展示。
在線實(shí)驗(yàn)
圖七 加速任務(wù)流程圖在離線驗(yàn)證的基礎(chǔ)上,我們進(jìn)一步在加速寶產(chǎn)品上驗(yàn)證算法升級的業(yè)務(wù)效果。加速寶產(chǎn)品的流程如圖七所示,通過模型我們預(yù)測出廣告主在未來一段時間的支出,點(diǎn)擊和活躍天數(shù)等等,接下來我們選擇平臺活躍水平較低的客戶,根據(jù)廣告主在未來一段時間的支出,點(diǎn)擊產(chǎn)出定制化的任務(wù),廣告主通過完成這些任務(wù),得到一些權(quán)益獎勵,促進(jìn)在平臺的活躍。我們比較了新舊兩版模型的業(yè)務(wù)效果,新版本的模型取得了 + 2.59% 的活躍率提升和+ 2.09% 的每用戶平均收入(ARPU)提升。
? 總結(jié)展望
本項(xiàng)工作中,我們針對多場景多任務(wù)的問題提出了一個高效且具有較強(qiáng)泛化能力的模型框架M2M,通過構(gòu)建元學(xué)習(xí)單元顯式建模場景信息。進(jìn)一步的,為了更好地表征場景特定信息,我們提出了元學(xué)習(xí)網(wǎng)絡(luò),該網(wǎng)絡(luò)由兩個組件組成:Attention元網(wǎng)絡(luò)模塊和Tower元網(wǎng)絡(luò)模塊,這兩個模塊是分層組織的:Attention元網(wǎng)絡(luò)模塊位于較低位置以捕獲不同場景間相關(guān)性,Tower元網(wǎng)絡(luò)模塊位于較高位置以增強(qiáng)特定場景特征的表征能力。我們通過離線和在線實(shí)驗(yàn)驗(yàn)證了模型的有效性,特別指出的是模型在小場景&新場景等數(shù)據(jù)稀疏的問題中效果提升更加明顯。在未來工作中,我們將進(jìn)一步的提高模型的通用能力,同時建模分類任務(wù)和回歸任務(wù);此外,將M2M模型和Optimization-based的元學(xué)習(xí)方法結(jié)合也是一個有意思的問題。
? 關(guān)于我們
我們是阿里媽媽客戶增長算法團(tuán)隊(duì),致力于構(gòu)建良好的廣告平臺客戶生態(tài)。我們的工作涉及廣告主全生命周期理解與建模、營銷異質(zhì)內(nèi)容理解&推薦、冷啟動優(yōu)化、客戶機(jī)制策略等眾多方向,相比C端用戶增長具有更多的挑戰(zhàn)。團(tuán)隊(duì)近一年在WSDM、CIKM等頂級會議發(fā)表多篇論文,技術(shù)氛圍濃厚,業(yè)務(wù)前景發(fā)展廣闊,歡迎感興趣的同學(xué)加入我們!
投遞簡歷郵箱:
alimama_tech@service.alibaba.com
? 參考文獻(xiàn)
[1]Ma J, Zhao Z, Yi X, et al. Modeling task relationships in multi-task learning with multi-gate mixture-of-experts[C]//Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2018: 1930-1939.
[2]Tang H, Liu J, Zhao M, et al. Progressive layered extraction (ple): A novel multi-task learning (mtl) model for personalized recommendations[C]//Fourteenth ACM Conference on Recommender Systems. 2020: 269-278.
[3]Zhao J, Du B, Sun L, et al. Multiple relational attention network for multi-task learning[C]//Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2019: 1123-1131.
END
也許你還想看
丨阿里媽媽技術(shù)團(tuán)隊(duì)4篇論文入選WSDM 2022
丨WSDM 2022 | 合約廣告自適應(yīng)統(tǒng)一分配框架
歡迎關(guān)注「阿里媽媽技術(shù)」,了解更多~
瘋狂暗示↓↓↓↓↓↓↓
總結(jié)
以上是生活随笔為你收集整理的WSDM 2022 | 基于元学习的多场景多任务商家建模的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【阿里妈妈营销科学系列】第八篇:增强分析
- 下一篇: WSDM 2022 | 点击率模型特征交