日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

DeepFM调参总结

發布時間:2025/3/15 编程问答 36 豆豆
生活随笔 收集整理的這篇文章主要介紹了 DeepFM调参总结 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一、結論

  • 使用id類特征效果很好,很重要
  • dropout對模型性能影響較大
  • dnn層數對模型性能影響大
  • 同樣數據特征的情況下,deepfm比lr在AUC(ROC)的效果好0.02~0.03
  • 只使用id類特征(用戶id,物品id)比使用全部特征(包含用戶id,物品id)的AUC值差0.005左右,但是訓練速度和預測速度大幅度提升。
  • 二、應用場景

    2.1 指標選擇

    應用deepfm和lr模型的目的是給召回階段的候選集合排序,故選擇AUC為模型離線評測的指標。同時關注loss的變化情況。

    2.2 數據情況

  • 此實驗對數據集是推薦領域對用戶曝光和點擊的數據。
  • 模型的訓練集是前2天到n天的數據(n可以調整)
  • 模型的驗證集是前1天的數據
  • 三、實驗數據

    默認參數:epoch=1;optimizer=adam;loss=cross entropy;batch=256;

    實驗id特征embedding(隱向量)dnn結構dropoutAUCloss
    1uid,itemid10dnn=(128,128)0AUC=0.731loss=1.18
    2uid,itemid2dnn=(128,128)0AUC=0.733loss=1.12
    3uid,itemid4dnn=(128,128)0AUC=0.731loss=1.08
    4uid,itemid3dnn=(128,128)0.85AUC=0.746loss=1.17
    5uid,itemid3dnn=(128,128)0.65AUC=0.736loss=1.11
    6uid,itemid3dnn=(256,256)0.85AUC=0.744loss=1.07
    7uid,itemid3dnn=(64,64)0.85AUC=0.745loss=1.24
    8uid,itemid3dnn=(64,64,64)0.85AUC=0.770loss=0.667
    9uid,itemid3dnn=(128,128,128)0.85AUC=0.772loss=0.800

    結合訓練時間,性能等實際情況,最優等參數如下:

    特征: uid,itemid
    embedding:3
    dnn結構:(128,128,128)
    dropout:0.85

    四、實驗思考

  • 不同等應用場景,模型的性能指標應該有所差異
  • 數據分布不一致對模型有怎樣對影響
  • 在推薦場景中,訓練和驗證數據是否應該排除top數據
  • 還有哪些特征對排序模型有較大的用處(統計類特征)
  • 為什么僅僅使用id類特征能夠有較好的效果?
  • 怎樣在深度學習網絡中快速調參(正好看到一篇論文)
    https://arxiv.org/pdf/2006.06863.pdf
  • 總結

    以上是生活随笔為你收集整理的DeepFM调参总结的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。