日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

xgboost分类_XGBoost(Extreme Gradient Boosting)

發布時間:2024/7/5 编程问答 36 豆豆
生活随笔 收集整理的這篇文章主要介紹了 xgboost分类_XGBoost(Extreme Gradient Boosting) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一、XGBoost在Ensemble Learning中的位置

機器學習中,有一類算法叫集成學習(Ensemble Learning),所謂集成學習,指將多個分類器的預測結果集成起來,作為最終預測結果,它要求每個分類器具備一定的“準確性”和“差異性”。通俗理解,集成學習的思想就是“三個臭皮匠,頂個諸葛亮”,多個弱分類器聯合起來變成強分類器。集成學習根據分類器之間的依賴關系,劃分為Boosting和Bagging兩大門派,XGBoost(由華盛頓大學的陳天奇等人提出,因XGBoost出眾的訓練速度和準確率,受到廣泛關注和應用)屬于Boosting算法,它是在GBDT基礎上的優化算法,如下圖:

二、XGBoost的基本思想和舉例

XGBoost算法的基本思想跟GBDT類似,不斷地通過特征分裂生長一棵樹,每一輪學習一棵樹,其實就是去擬合上一輪模型的預測值與實際值之間的殘差。當訓練完成,得到k棵樹,如果要預測一個樣本的分數,其實就是根據這個樣本的特征,在每棵樹中落到對應的一個葉子節點,每個葉子節點對應一個分數,最后只需將每棵樹對應的分數加起來就是該樣本的預測值。

未完待續……

三、XGBoost在GBDT基礎上做了哪些優化?

1、導數信息:GBDT只用到一階導數信息,而XGBoost對損失函數做二階泰勒展開,引入一階導數和二階導數。 2、基分類器:GBDT以傳統CART作為基分類器,而XGBoost不僅支持CART決策樹,還支持線性分類器,相當于引入L1和L2正則化項的邏輯回歸(分類問題)和線性回歸(回歸問題)。 3、特征采樣:XGBoost借鑒RF的做法,即類似RandomForestClassifier的max_features,支持列抽樣,不僅能防止過擬合,還能降低計算量。 4、正則項:XGBoost的目標函數加了正則化項控制模型的復雜度,防止模型過擬合。 5、并行化:XGBoost支持并行,不是tree維度上的并行,而是特征維度上的并行,決策樹最耗時的步驟是對特征的值排序,XGBoost在迭代之前,先進行預排序,將每個特征按特征值排好序,存為塊結構,分裂結點時可以采用多線程并行查找每個特征的最佳分割點(計算增益最大的特征進行下一步分裂),極大提升訓練速度。 6、缺失值:當樣本的特征值存在缺失值時,XGBoost能自動學習出它的默認分裂方向。

四、兩種方法控制 XGBoost的過擬合(訓練精度高而測試精度低)

方法1:直接控制模型的復雜度(max_depth,min_child_weight,gamma)max_depth:每棵樹的最大深度限制。min_child_weight:子節點的最小權重,如果某個子節點權重小于這個閾值,則不會在分裂。gamma:分裂所帶來的損失最小閾值,大于此值,才會繼續分裂。 方法2:增加隨機性,使訓練對噪聲強健(subsample,colsample_bytree,減小步長eta且增加迭代次數num_round )subsample:用于訓練模型的子樣本占整個樣本集合的比例,能防止過擬合,取值范圍為(0,1].colsample_bytree:訓練每棵樹時用來訓練的特征的比例,類似 RandomForestClassifier 的 max_features,在建立樹時對特征采樣的比例,缺省值為1,取值范圍(0,1].eta:每次迭代完成后更新權重時的步長,越小訓練越慢,缺省值為0.3,取值范圍為[0,1].num_round :總共迭代的次數。

五、XGBoost中偏差(Bias)與方差(Variance)的權衡

Bias-Variance是機器學習/統計學中一個重要的概念。當模型變得復雜時(例如樹的深度更深),模型具有更強的擬合訓練數據的能力,產生一個低偏差的模型,但是,復雜的模型容易過擬合,需要更多的數據來擬合。XGBoost中的大部分參數都是關于偏差和方差的權衡,最好的模型應該仔細地將模型復雜性(擬合能力)與其預測能力進行權衡。

六、使用XGBoost的示例代碼

# step1:導入模塊 import xgboost as xgb # step2:讀取數據 dtrain = xgb.DMatrix('demo/data/train.csv') dtest = xgb.DMatrix('demo/data/test.csv') # step3:指定參數 param = {'max_depth':2, 'eta':1, 'silent':1, 'objective':'binary:logistic' } # 二分類的邏輯回歸問題,輸出為概率值。 num_round = 2 # step4:訓練 bst = xgb.train(param, dtrain, num_round) # step5:預測 preds = bst.predict(dtest)

參考資料:

XGBoost官網:https://xgboost.apachecn.org/#/

XGBoost20題:https://blog.csdn.net/weixin_38753230/article/details/100571499

XGBoost算法:https://www.cnblogs.com/mantch/p/11164221.html

總結

以上是生活随笔為你收集整理的xgboost分类_XGBoost(Extreme Gradient Boosting)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 欧美黑人多人双交 | 国产女人和拘做受视频免费 | av制服丝袜在线 | 国产二区精品 | 亚洲色图在线播放 | 啄木乌欧美一区二区三区 | 色噜噜狠狠一区二区三区牛牛影视 | 一区二区三区四区精品 | 欧美人狂配大交3d | 欧美激情爱爱 | 干老太太视频 | 一级片视频免费看 | 91免费片| 高清乱码毛片入口 | 天堂av在线网 | 国产国拍精品亚洲 | 免费看一级片 | 91婷婷色| www在线观看国产 | 一本大道熟女人妻中文字幕在线 | av福利站 | 国产三级播放 | 污污网站在线观看视频 | 久热只有精品 | 女人的黄色片 | 亚洲av成人精品一区二区三区在线播放 | 懂色av蜜臀av粉嫩av分享吧 | 揉我啊嗯~喷水了h视频 | 欧美国产精品 | 男女无遮挡xx00动态图120秒 | 国产精品成人久久久 | 伊人网大香 | 日本一区二区在线看 | 免费无码肉片在线观看 | 18禁免费无码无遮挡不卡网站 | 国产精品5区| 朝桐光一区二区 | 老熟妇一区二区三区啪啪 | 免费久久网站 | 国产一区二区成人 | 91极品在线| 艳妇臀荡乳欲伦交换在线播放 | 九色porny自拍视频 | 青草精品 | 色偷偷欧美 | 国产精品一区免费 | 日日骚av一区二区 | 激情小说亚洲色图 | 国产精品综合在线 | 51精品国产人成在线观看 | 国产精品久久久久久久久久辛辛 | 激情av在线 | 少妇15p| 国产剧情在线一区 | 日韩国产欧美视频 | www亚洲天堂 | 国产做爰全免费的视频软件 | 国内精品国产三级国产aⅴ久 | 亚洲国产日韩a在线播放性色 | 特级西西444www高清大胆 | 丁香八月婷婷 | 日日狠狠久久偷偷四色综合免费 | 亚洲精品视频91 | 国产九九热 | 国产日韩视频在线 | 好男人资源 | 久久男女 | 亚洲精品福利 | 国产裸体网站 | 美女黄页网站 | 99热这里只有精品99 | 亚卅色图| 姝姝窝人体www聚色窝 | 中文字幕亚洲乱码熟女一区二区 | 激情久久久久久久 | 国产精品久久一区二区三区 | 日韩夜夜高潮夜夜爽无码 | 久久性生活片 | 亚洲中字 | 裸体一区二区三区 | 欧美成人精品欧美一 | 中文字幕免费一区二区 | 波多野结衣a v在线 欧洲免费av | 免费黄色激情视频 | 国产九色av | 亚洲精品一区在线观看 | 第一色网站 | 男女爽爽爽 | 丰满av| 国产日韩精品视频 | 亚洲一区二区三区精品视频 | 亚洲成熟丰满熟妇高潮xxxxx | 欧美一区二区三区影视 | 69xx欧美| 福利资源在线 | 精品无码一区二区三区爱欲 | 色大师在线观看 | 精品人妻一区二区三区视频 | 日韩在线一级片 |