日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

客户流失预警模型-GBDT模型

發(fā)布時間:2025/3/21 编程问答 37 豆豆
生活随笔 收集整理的這篇文章主要介紹了 客户流失预警模型-GBDT模型 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

GBDT模型參數(shù)問題,這里我們以sklearn里面的GBDT為例來說,打開網(wǎng)址sklearn.ensemble.GradientBoostingClassifier。這里我們不關(guān)注GBDT里面的所有參數(shù)意義,只解釋下在對金融數(shù)據(jù)建模調(diào)參時最常用的一些參數(shù)意義:

GBDT框架的參數(shù)

n_estimators: 分類樹的個數(shù),即K

learning_rate: 即每個弱學(xué)習(xí)器的權(quán)重縮減系數(shù)ν,也稱作步長。較小的ν意味著需要更多

的弱學(xué)習(xí)器的迭代次數(shù)。參數(shù)n_estimators和learning_rate要一起調(diào)參。可以從一個小一點 的ν開始調(diào)參,默認(rèn)是1

Subsample: (不放回)抽樣率,推薦在[0.5, 0.8]之間,默認(rèn)是1.0,即不使用子采樣

init: 即初始化的時候的弱學(xué)習(xí)器,一般用在對數(shù)據(jù)有先驗知識,或者之前做過一些擬合的時候

loss: 即GBDT算法中的損失函數(shù)

弱分類樹的參數(shù)

max_features: 劃分時考慮的最大特征數(shù)

max_depth: 決策樹最大深度

min_samples_split:內(nèi)部節(jié)點再劃分所需最小樣本數(shù)。默認(rèn)是2.如果樣本量不大,不需要管

這個值。如果樣本量數(shù)量級非常大,則推薦增大這個值

min_samples_leaf: 葉子節(jié)點最少樣本數(shù)

min_weight_fraction_leaf:葉子節(jié)點最小的樣本權(quán)重。默認(rèn)是0,就是不考慮權(quán)重問題。

一般來說,如果我們有較多樣本有缺失值,或者分類樹樣本的分布類別偏差很大,就會引 入樣本權(quán)重,這時我們就要注意這個值了

max_leaf_nodes: 最大葉子節(jié)點數(shù),通過限制最大葉子節(jié)點數(shù),可以防止過擬合

min_impurity_split: 節(jié)點劃分最小不純度

表示分類正確:

  • True Positive:本來是正樣例,分類成正樣例。
  • True Negative:本來是負(fù)樣例,分類成負(fù)樣例。

表示分類錯誤:

  • False Positive :本來是負(fù)樣例,分類成正樣例,通常叫誤報。
  • False Negative:本來是正樣例,分類成負(fù)樣例,通常叫漏報。

準(zhǔn)確度

真正類率(True Postive Rate)TPR: TP/(TP+FN),代表分類器預(yù)測的正類中實際正實例占 所有正實例的比例。Sensitivity

負(fù)正類率(False Postive Rate)FPR: FP/(FP+TN),代表分類器預(yù)測的正類中實際負(fù)實例 占所有負(fù)實例的比例。1-Specificity

真負(fù)類率(True Negative Rate)TNR: TN/(FP+TN),代表分類器預(yù)測的負(fù)類中實際負(fù)實例 占所有負(fù)實例的比例,TNR=1-FPR。Specificity

真正類率(True Postive Rate)TPR就是查全率

分類器給出針對每個實例為正類的概率,那么通過設(shè)定一個閾值如0.6,概率大于等于0.6的為正類,小于0.6的為負(fù)類。對應(yīng)的就可以算出一組(FPR,TPR),在平面中得到對應(yīng)坐標(biāo)點。隨著閾值的逐漸減小,越來越多的實例被劃分為正類,但是這些正類中同樣也摻雜著真正的負(fù)實例,即TPR和FPR會同時增大。閾值最大時,對應(yīng)坐標(biāo)點為(0,0),閾值最小時,對應(yīng)坐標(biāo)點(1,1)。

AUC是圖中曲線下方的面積,值越大,分類效果越佳

通常情況下AUC越大學(xué)習(xí)器的效果越好。,即若一個學(xué)習(xí)器的ROC曲線被另外一個學(xué)習(xí)器曲線完全包住,那么可以斷言,后一個學(xué)習(xí)器的性能優(yōu)于前者。如果發(fā)生交叉則難以比較,如果非要比較,比較合理的判斷是比較ROC下的面積即AUC大小。

GBDT在流失預(yù)警模型中的應(yīng)用

使用默認(rèn)參數(shù),在訓(xùn)練集上

都還不錯。但是能不能更好點?

首先我們從步長(learning rate)和迭代次數(shù)(n_estimators)入手。一般來說,開始選擇一個較小的步長來網(wǎng)格搜索最好的迭代次數(shù)。這里,我們將步長初始值設(shè)置為0.1,迭代次數(shù)的搜索范圍是20~80

最好的迭代次數(shù)是70,對應(yīng)的score是85.10%。

好像比默認(rèn)參數(shù)的效果差。。。。

找到了一個合適的迭代次數(shù),現(xiàn)在我們開始對決策樹進(jìn)行調(diào)參。首先我們對決策樹最大深度max_depth和內(nèi)部節(jié)點再劃分所需最小樣本樣min_samples_split進(jìn)行網(wǎng)格搜索。搜索的范圍分別是3~13和 100~800

最佳的最大深度和最小樣本數(shù)分別是9和500,對應(yīng)的score是85.36%

由于決策樹深度9是一個比較合理的值,我們把它定下來,對于內(nèi)部節(jié)點再劃分所需最小樣本數(shù)min_samples_split,我們暫時不能一起定下來,因為這個還和決策樹其他的參數(shù)存在關(guān)聯(lián)。下面我們再對內(nèi)部節(jié)點再劃分所需最小樣本數(shù)min_samples_split和葉子節(jié)點最少樣本數(shù)min_samples_leaf一起調(diào)參。調(diào)整范圍分別是400~1000,以及60~100。

最佳的最小樣本數(shù)和葉節(jié)點最小樣本數(shù)分別是500和70,對應(yīng)的score是85.54%

現(xiàn)在我們再對最大特征數(shù)max_features進(jìn)行網(wǎng)格搜索, 范圍從5 到25,最佳值是25.

BUT !

對于邊界值,通常還要再放大范圍。我們將范圍擴(kuò)大到30,最佳值是28.

再對子采樣的比例進(jìn)行網(wǎng)格搜索,范圍從0.6到0.9, 最佳值是0.8.

現(xiàn)在我們基本已經(jīng)得到我們所有調(diào)優(yōu)的參數(shù)結(jié)果了。這時我們可以減半步長,最大迭代次數(shù)加倍來增加我們模型的泛化能力。再次擬合我們的模型,得到的最優(yōu)步長是0.05,最大迭代次數(shù)是1000,在訓(xùn)練集和測試集上的表現(xiàn)是:

來源于66號學(xué)苑

版權(quán)聲明:本公眾號如有引用和轉(zhuǎn)載他人文章,則必定會在文章中標(biāo)明原文的作者和來源出處。如有侵權(quán),請聯(lián)系微信wmyd80或后臺留言,我們將在第一時間予以處理。

總結(jié)

以上是生活随笔為你收集整理的客户流失预警模型-GBDT模型的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 日本加勒比在线 | 天堂网一区二区三区 | 美女喷液视频 | 黄色片国产 | 综合热久久 | 一级理论片 | 男人插入女人阴道视频 | 红桃视频网站 | 色就是色综合 | 国产91免费看 | 黄色香港三级三级三级 | 日本免费观看视频 | 精品人妻无码一区二区三区蜜桃一 | 精品久久福利 | 九七精品| 国产视频一区二区三区四区五区 | 青草青视频 | 免费黄色在线网站 | 日韩网站免费观看 | 老熟女重囗味hdxx69 | 思思99re| 成人影片网址 | 天天干天天操天天插 | 99久久婷婷国产一区二区三区 | 久久精品一区二区三 | 日韩精品一区二区三区中文字幕 | 一区二区免费在线 | 五月精品 | 国产日韩激情 | 亚洲中文字幕一区二区在线观看 | 国产春色| 夜夜嗨av一区二区三区网页 | 国产麻豆精品在线 | 免费在线观看的av | 黄色中文字幕在线观看 | 中日韩av电影 | 久久爱99 | 黄色片在线播放 | 美女精品一区二区 | 亚洲国产精品久久久久久 | 亚洲高潮av | 美女撒尿无遮挡网站 | 亚洲香蕉中文网 | 少妇太紧太爽又黄又硬又爽 | 日韩亚洲欧美精品 | 无码国产精品一区二区色情男同 | 西比尔在线观看完整视频高清 | 国产精品9999 | 欧美有码在线观看 | 亚洲最大成人在线 | 国产调教视频 | 精品一区二区久久久久久按摩 | 天天干天天爱天天射 | 国产黄大片 | 精品一区二区三区人妻 | 亚洲欧美自偷自拍 | 国产区一区二区三 | 97久久人澡人人添人人爽 | 日韩精品免费一区二区在线观看 | 永久免费在线看片 | 欧美视频一区在线观看 | 黑帮大佬和我的365日第二部 | 亚洲精品久久久久久久久久久 | 国产春色| 亚洲图片一区二区三区 | 午夜aa | 人妻视频一区二区三区 | 日本一区二区三区在线视频 | 免费黄色大片网站 | 一二三不卡 | 国产高h视频 | 欧美 日韩 国产 在线观看 | 欧美aaaaaa| 色狠狠一区二区三区香蕉 | 都市激情亚洲一区 | 一区二区三区91 | 国产精品亚洲一区二区三区在线观看 | av2014天堂 | 欧美日韩精选 | 91成人免费观看 | 黄色工厂这里只有精品 | 97精品免费视频 | 久久大伊人 | 狠狠干免费视频 | 国产精品久久久久久久久晋中 | 亚洲夜夜夜 | 日韩中文字幕网站 | 狠狠干在线观看 | 娇妻之欲海泛舟无弹窗笔趣阁 | 人妻无码久久一区二区三区免费 | 国产精品视频一区二区在线观看 | 国产精品一区二区免费 | 1024手机在线看片 | 乱一色一乱一性一视频 | 深田咏美av在线 | 日韩毛片在线看 | 日本黄色免费大片 | www.在线观看av | 国产一级一级 |