日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

通俗理解LightGBM并图解举例

發布時間:2023/12/20 编程问答 38 豆豆
生活随笔 收集整理的這篇文章主要介紹了 通俗理解LightGBM并图解举例 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

算法原文是:
LightGBM:A Highly Efficient Gradient Boosting Decision Tree
一句話:
LightGBM是GBDT的運行速度上的升級版
文章結構如下:

LightGBM={Goss(Gradient?basedOne?SideSampling)EFB(ExclusiveFeatureBundling)LightGBM=\left\{ \begin{aligned} Goss(Gradient-based\ One-Side Sampling)\\ EFB(Exclusive\ Feature\ Bundling) \\ \end{aligned} \right.LightGBM={Goss(Gradient?based?One?SideSampling)EFB(Exclusive?Feature?Bundling)?

Goss
先根據梯度對樣本進行排序,選取 a * 100% 的top樣本,再從剩余數據中隨機選取 b * 100% 的樣本,并乘以 ?的系數放大。

同學們 ,到底什么是"根據梯度"對樣本進行排序?

假設我們現在的數據集只有一個特征,那么我們怎么篩選數據集呢?
根據上面的圖我們可以知道,圖中處于黑色區段的特征取值的那一部分數據集就是我們需要的數據集.

也就是說,論文的意思是:
GOSS則通過保存大梯度樣本,隨機選取小梯度樣本,并為其彌補上一個常數權重。這樣,GOSS更關注訓練不足的樣本,同時也不會改變原始數據太多。
##################################################
然后我們來看看EFB是啥意思?
根據論文原文中的一段話:
Specially,in a sparse feature space,many features are mutually exclusive,i.e.they never take nonzero values simultaneously.
什么意思呢?

特征A特征B類別
1-get cancer
-bighealthy
3-get cancer
_largehealthy

把特征A和特征B融合為一個特征.
所以這里相當于是在lightGBM的分類器內部進行了"數據預處理"

總結

以上是生活随笔為你收集整理的通俗理解LightGBM并图解举例的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。