日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

用Dropout思想做特征选择,保证效果还兼顾了线上性能?

發布時間:2025/3/8 编程问答 10 豆豆
生活随笔 收集整理的這篇文章主要介紹了 用Dropout思想做特征选择,保证效果还兼顾了线上性能? 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

這篇論文《Towards a Better Tradeoff between Effectiveness and Efficiency in Pre-Ranking: A Learnable Feature Selection based Approach》教會了我們如何做粗排模型兼顧模型的效率和效果.提出了可學習的特征選擇方法FSCD,并在真實電商系統中應用.

簡介

如上圖(a)所示,受系統時延約束,推薦系統往往是多階段的.再看圖(b),論文提到簡單的representation-focused(RF)模型會嚴重制約我們模型的表達能力(如傳統雙塔,最后一層向量Dot,就是簡單RF模型),主要是缺少特征交叉.所以我們能否在特征上做優化,只保留效果好的特征又能保證模型推斷效率更高,用上和精排一樣interaction-focused(IF)的模型呢?當然是可以的!

FSCD

粗排用上精排的模型并且要保持高效率,也就意味著在某些方面要做犧牲,那果斷就是在特征上入手了,因此IF的粗排模型用上的特征是精排的子集.如上圖所示,FSCD方法中效果是通過梯度優化,效率是通過特征維度的正則化來保證.在訓練過程中就可以挖掘到一批有用的特征.

對于每個特征而言,都有個可學習的dropout參數Z ∈ {0, 1} ,并且是符合伯努利分布:

該分布的超參是由特征復雜度cj決定的,cj是由特征的計算復雜度oj,向量維度ej,還有key的多少nj一起決定的.

最終損失函數如下所示:

我們可以看到每個zj還會乘上正則化系數:

又因為zj的伯努利分布不可導,可以近似為:

實驗

參考文獻

1、Towards a Better Tradeoff between Effectiveness and Efficiency in Pre-Ranking: A Learnable Feature Selection based Approach arxiv.org/pdf/2105.0770

2、zhuanlan.zhihu.com/p/37

總結

以上是生活随笔為你收集整理的用Dropout思想做特征选择,保证效果还兼顾了线上性能?的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。