gbdt子采样参数的理解
生活随笔
收集整理的這篇文章主要介紹了
gbdt子采样参数的理解
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
隨機(jī)森林的子采樣是有放回的抽樣
gbdt的子采樣是無放回的抽樣
本人的錯(cuò)誤理解:
比如說原來的數(shù)據(jù)集是100個(gè)樣本;gbdt的第一棵樹是80個(gè)樣本,第二棵樹是剩下的20%,16個(gè)樣本;依此類推;
錯(cuò)誤理解的根本是將抽取0.8樣本集的作為一個(gè)整體,是否放回;所以才會(huì)覺得gbdt難以理解,每棵樹都只剩下20%
而正確的理解:是否放回主要針對(duì)的是每次抽取的一個(gè)樣本;所以每棵樹抽樣的整體都是100個(gè)樣本;隨機(jī)森林抽樣是放回的,最極端的可能全部都是重復(fù),即一個(gè)樣本;無放回抽樣主要是樣本不會(huì)重復(fù);gbdt的每棵樹都會(huì)用80個(gè)樣本來訓(xùn)練;
總結(jié)
以上是生活随笔為你收集整理的gbdt子采样参数的理解的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: PCA与SVD的关系
- 下一篇: svm中支持向量的理解