日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > windows >内容正文

windows

推荐系统炼丹笔记:聊一聊特征交叉新方式CAN

發(fā)布時間:2025/3/8 windows 21 豆豆
生活随笔 收集整理的這篇文章主要介紹了 推荐系统炼丹笔记:聊一聊特征交叉新方式CAN 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
者:一元 公眾號:煉丹筆記

昨天看非常多的群友在討論該篇文章,很是好奇,今天就讀了一下,個人感覺本文的co-action操作還是第一次碰到,但該方案在amazu等數(shù)據(jù)集上對比的方案還是較為弱的,所以是否效果比xDeepFM和NFFM等要好,還是一個問好,但是新的表示co-action的方案還是很值得思考的。有任何問題歡迎最后入群交流。好了下面進入正文,Let's Go!

目前基于特征交互的模型可以大致分為三類:

  • Aggregation based方法:聚合用戶的歷史行為序列來獲得CTR預估的判別表示;
  • Graph based方法: 將特征作為節(jié)點, 通過有向和無向圖的方式連接, 在這種情況下,特征協(xié)同作用作為信息沿邊緣傳播的邊緣權重;
  • Combinatorial embedding方法:直接明顯的組合特征的embedding;
  • 基于Aggregation的方法和基于Graph的方法只通過邊的權值對特征的協(xié)同作用進行建模,但是邊緣只用于信息聚合,而不用于信息擴充。組合嵌入方法,另一方面,結合兩個特征的嵌入來建立特征的共同作用,但組合嵌入法的問題在于, 嵌入負責表示學習和協(xié)同作用建模,而表示學習和協(xié)同建模可能會互相沖突最終使我們的效果受限。

    本文提出了feature Co-Action Network(CAN)捕獲在輸入階段的特征的co-action并且利用交互和共同信息來對最終模型的效果進行提升。

    回顧CTR預測問題的特征Co-action

    Co-Action網(wǎng)絡

    CAN的整體框架如上,用戶和商品的特征可以被分為兩種形式:

    Co-Action網(wǎng)絡的最終結構為:

    最終,我們通過最小化cross-entropy:

    Co-Action 單元

    其中H表示特征的co-action.對于用戶序列特征例如用戶的點擊序列等,co-action單元會被應用到每個商品上,之后再使用一個sum-pool。

    多階(Multi-order) Enhancement

    此處我們使用下面的方式進行高階的特征組合:

    其中C是階的個數(shù), 此處我們使用SeLU作為激活函數(shù)(當C=1的時候),同時我們使用tanh來避免數(shù)值問題。

    多層(Multi-level)獨立性

    • 第一層:參數(shù)獨立性, 我們的方法將表示學習和co-action建模區(qū)分,參數(shù)的獨立性是CAN的基礎;
    • 第二層:組合獨立性,特征的co-action隨著特征組合的增加而線性增長,假設有M個weight-side和N個input-side的嵌入,

    • 第三層:oders的獨立性,為了進一步提升在multi-order的輸入co-action建模的便利,我們的方法對不同的oder的商品

    在不同的輸入順序下,進一步提高了不同輸入順序下的嵌入靈活性。weight-side嵌入的大小相應地增加了orders倍。注意,由于MLP在不同的順序項中沒有參數(shù),因此之前的近似值不可行。

    實驗

    效果比較

    • CAN在這兩個數(shù)據(jù)集上都優(yōu)于其他最先進的方法。與基礎模型DIEN相比,其AUC分別提高了1.7%和2.1%。
    • 該方法在很大程度上優(yōu)于其他協(xié)同作用方法,證明了本文方法在協(xié)同作用建模中的有效性。
    • 值得注意的是,作為純表示學習方法,笛卡爾積方法與PNN、NCF、DeepFM等其他組合嵌入方法相比,可以取得更好的性能,這說明雖然這些組合嵌入方法可以提取一些協(xié)同作用特征信息,他們真的可以通過出色的表現(xiàn)和合作學習嵌入。相比之下,CAN比笛卡爾積和結合嵌入的方法取得了更好的效果,這意味著基于網(wǎng)絡的CAN機制可以同時學習表示能力和協(xié)作能力

    解耦研究

    • Multi orders:多階數(shù)對性能增益的影響很小,因此在實際應用中,2或3個power項是合適的。
    • MLP depth:8層的MLP可以拿到最好的結果;
    • 激活函數(shù):Tanh的激活函數(shù)可以獲得最好的效果;

    模型的普遍性和泛化(Universality and Generalization)

    Universality: CAN比大多數(shù)方法的效果要好,和cartesian乘積效果差不大;

    在真實的商業(yè)場景中,每天都會出現(xiàn)無數(shù)的功能組合,這就要求CTR模型能夠快速響應。推廣對于實際應用具有重要意義。為此,我們從測試集中移除包含現(xiàn)有特征組合的樣本。通過這種方法,我們得到了一個新的測試集,其特征組合對于一個經(jīng)過良好訓練的模型來說是全新的。請注意,我們只要求特征組合為zero-shot快照,而不是所有特性。

    • Generalization: CAN還是工作的非常好, 具有非常好的泛化性。

    工業(yè)數(shù)據(jù)集上的表現(xiàn)

    CAN在工業(yè)數(shù)據(jù)集上A/B Test上得到了非常大的提升。

    小結

    在笛卡爾產(chǎn)品模型的啟發(fā)下,我們提出了一種新的特征交叉范式:Co-Action network,CAN。通過一個靈活的模塊,co-action單元,可以將表示學習和co-action行為建模分離開來。在co-action單元中引入了多階增強和多層次獨立性,進一步提高了特征協(xié)同建模的能力。實驗表明,該算法的性能優(yōu)于之前的研究成果,對新的特征組合具有更好的泛化能力。


    weixin.qq.com/r/XSjP1zr (二維碼自動識別)

    與50位技術專家面對面20年技術見證,附贈技術全景圖

    總結

    以上是生活随笔為你收集整理的推荐系统炼丹笔记:聊一聊特征交叉新方式CAN的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。