日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

xgboost和随机森林特征重要性计算方法

發布時間:2023/12/8 编程问答 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 xgboost和随机森林特征重要性计算方法 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

隨機森林中特征重要性和xgboost不同:

隨機森林中的特征重要性主要是基于不純度(也可以叫做Gini importance):

計算某一個節點不純度為

其中,ωk\omega_kωk?,ωleft\omega_{left}ωleft?,ωright\omega_{right}ωright?分別為節點 k以及其左右子節點中訓練樣本個數與總訓練樣本數目的比例,GkG_kGk?,GleftG_{left}Gleft?,GrightG_{right}Gright?分為為節點 k 以及其左右子節點的不純度。
節點不純度計算完成后,計算某個Feature的不純度為

另外,為了使所有feature的重要性加起來等于1,需要每一feature的重要性進行normalization:

對于分類問題的話,就是gini不純度
對于回歸問題的話,MSE(Mean Square error)或者MAE(Mean absolute error)

sklearn中的解釋
sklearn源碼

參考文章:
https://blog.csdn.net/gracejpw/article/details/102611273
https://zhuanlan.zhihu.com/p/52052903
https://mljar.com/blog/feature-importance-in-random-forest/

總結

以上是生活随笔為你收集整理的xgboost和随机森林特征重要性计算方法的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。