日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

使用GBDT+LR作点击率预测

發布時間:2024/1/23 编程问答 37 豆豆
生活随笔 收集整理的這篇文章主要介紹了 使用GBDT+LR作点击率预测 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
主要內容來源于facebook的論文:Practical Lessons from Predicting Clicks on Ads at Facebook》 1、基本思路 使用GBDT根據用戶特征轉換生成新的特征,每棵樹的每個葉子均作為一個特征,然后將這些特征代入LR。 舉個例子: (1)訓練GBDT樹:我們現在m個樣本,總共有6000個標簽,將這些樣本用于訓練GBDT,生成10棵樹,每棵樹100個葉子(當然各棵樹的葉子數可能不同),總共1000個葉子。上述的1000個葉子會作為特征。 (2)使用GBDT樹轉換特征:還是上面的m個樣本,我們將這m個樣本代入上面生成的10棵樹,這些樣本在每棵樹上都會被分類到其中一個葉子,將這個葉子對應的位置設置為1,其余為0。這樣就得到我們轉換后的特征了。 (3)使用轉換特征訓練LR:使用上面轉換后的特征作為樣本特征,用于訓練LR,得到最終的模型。 (4)當有新樣本需要預測時,使用步驟2生成轉換特征后代入第3步生成的模型,得出最終的預測結果。 附一張facebook的圖:



2、問題 (1)使用GBDT抽取特征以后,這些特征就應該固定了,也就是說第一天GBDT就固定了,以后不再訓練,只是用這棵樹來根據樣本生成特征。 但是我們的特征是會變化的,如果增加了一個特征,由于GBDT樹不再發生變化,因此這個特征不會再被加入模型。唯一的處理方法是,重新訓練GBDT樹,但這樣的話由于轉換生成的特征發生了變化,因此LR要從最初的數據開始全部訓練。 解決辦法:原有特征繼續進入GBDT,新來的特征作為一新特征開始訓練。然后每隔一段時間重新訓練GBDT,并且全部重新進入LR。

總結

以上是生活随笔為你收集整理的使用GBDT+LR作点击率预测的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。