日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Bagging和Boosting的区别(面试准备)

發布時間:2025/3/20 编程问答 25 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Bagging和Boosting的区别(面试准备) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Baggging 和Boosting都是模型融合的方法,可以將弱分類器融合之后形成一個強分類器,而且融合之后的效果會比最好的弱分類器更好。

?

Bagging:

先介紹Bagging方法:

Bagging即套袋法,其算法過程如下:

  • 從原始樣本集中抽取訓練集。每輪從原始樣本集中使用Bootstraping的方法抽取n個訓練樣本(在訓練集中,有些樣本可能被多次抽取到,而有些樣本可能一次都沒有被抽中)。共進行k輪抽取,得到k個訓練集。(k個訓練集之間是相互獨立的)

  • 每次使用一個訓練集得到一個模型,k個訓練集共得到k個模型。(注:這里并沒有具體的分類算法或回歸方法,我們可以根據具體問題采用不同的分類或回歸方法,如決策樹、感知器等)

  • 對分類問題:將上步得到的k個模型采用投票的方式得到分類結果;對回歸問題,計算上述模型的均值作為最后的結果。(所有模型的重要性相同)

  • ?

    Boosting:

    ? ? ? AdaBoosting方式每次使用的是全部的樣本,每輪訓練改變樣本的權重。下一輪訓練的目標是找到一個函數f 來擬合上一輪的殘差。當殘差足夠小或者達到設置的最大迭代次數則停止。Boosting會減小在上一輪訓練正確的樣本的權重,增大錯誤樣本的權重。(對的殘差小,錯的殘差大)

    ? ? ? 梯度提升的Boosting方式是使用代價函數對上一輪訓練出的模型函數f的偏導來擬合殘差。

    Bagging,Boosting二者之間的區別

    Bagging和Boosting的區別:

    1)樣本選擇上:

    Bagging:訓練集是在原始集中有放回選取的,從原始集中選出的各輪訓練集之間是獨立的。

    Boosting:每一輪的訓練集不變,只是訓練集中每個樣例在分類器中的權重發生變化。而權值是根據上一輪的分類結果進行調整。

    2)樣例權重:

    Bagging:使用均勻取樣,每個樣例的權重相等

    Boosting:根據錯誤率不斷調整樣例的權值,錯誤率越大則權重越大。

    3)預測函數:

    Bagging:所有預測函數的權重相等。

    Boosting:每個弱分類器都有相應的權重,對于分類誤差小的分類器會有更大的權重。

    4)并行計算:

    Bagging:各個預測函數可以并行生成

    Boosting:各個預測函數只能順序生成,因為后一個模型參數需要前一輪模型的結果。

    5)這個很重要面試被問到了

    為什么說bagging是減少variance,而boosting是減少bias?


    Bagging對樣本重采樣,對每一重采樣得到的子樣本集訓練一個模型,最后取平均。由于子樣本集的相似性以及使用的是同種模型,因此各模型有近似相等的bias和variance(事實上,各模型的分布也近似相同,但不獨立)。由于,所以bagging后的bias和單個子模型的接近,一般來說不能顯著降低bias。另一方面,若各子模型獨立,則有,此時可以顯著降低variance。若各子模型完全相同,則

    ,此時不會降低variance。bagging方法得到的各子模型是有一定相關性的,屬于上面兩個極端狀況的中間態,因此可以一定程度降低variance。為了進一步降低variance,Random forest通過隨機選取變量子集做擬合的方式de-correlated了各子模型(樹),使得variance進一步降低。

    (用公式可以一目了然:設有i.d.的n個隨機變量,方差記為,兩兩變量之間的相關性為,則的方差為

    ,bagging降低的是第二項,random forest是同時降低兩項。詳見ESL p588公式15.1)

    boosting從優化角度來看,是用forward-stagewise這種貪心法去最小化損失函數。例如,常見的AdaBoost即等價于用這種方法最小化exponential loss:。所謂forward-stagewise,就是在迭代的第n步,求解新的子模型f(x)及步長a(或者叫組合系數),來最小化,這里

    是前n-1步得到的子模型的和。因此boosting是在sequential地最小化損失函數,其bias自然逐步下降。但由于是采取這種sequential、adaptive的策略,各子模型之間是強相關的,于是子模型之和并不能顯著降低variance。所以說boosting主要還是靠降低bias來提升預測精度。

    ?

    參考資料:
    鏈接:https://www.zhihu.com/question/26760839/answer/40337791

    https://blog.csdn.net/u013709270/article/details/72553282

    ?

    轉載于:https://www.cnblogs.com/earendil/p/8872001.html

    總結

    以上是生活随笔為你收集整理的Bagging和Boosting的区别(面试准备)的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: av尤物在线 | 请用你的手指扰乱我吧 | 综合天天 | 欧美aⅴ| 免费黄色网址在线观看 | 精品黄色在线观看 | 黄色片网战 | 黄色片网站免费观看 | www.天天操 | 国产污视频在线播放 | 日本r级电影在线观看 | www.偷拍.com| 色七七在线 | 调教小屁屁白丝丨vk | 久久中文精品 | 最新国产中文字幕 | 久久精品视频在线 | 亚洲国产免费av | 精品国产无码在线 | 黄色三级大片 | 国产真实生活伦对白 | 日韩欧美国产片 | 波多野结衣小视频 | 999久久精品 | 蜜臀久久精品 | 久久国| 亚洲一级片网站 | 日日操日日操 | 免费观看全黄做爰的视频 | 中文在线视频观看 | 色香视频首页 | 69免费| 国产无遮挡又黄又爽免费视频 | 99产精品成人啪免费网站 | 性欧美欧美巨大69 | 婷婷五月综合缴情在线视频 | 亚洲黄色免费网站 | 欧美日韩一区免费 | 夜夜骑夜夜骑 | 欧美色图五月天 | 曰本三级日本三级日本三级 | 成人不卡av | 91蜜桃视频在线观看 | 一本到视频| 亚洲va国产天堂va久久 en | 成人精品久久久午夜福利 | 久久久999精品视频 国产在线xx | 成年人黄色大片 | 蜜桃9999 | 国产一级视频在线 | 人妻无码一区二区三区四区 | 日美一级片 | 欧美日韩一二三四 | 日韩三区四区 | 日本黄色免费看 | 久久精品香蕉 | 亚洲精选av | 少妇一级淫片免费看 | 亚日韩在线| 欧美特黄一区二区三区 | 国产高清视频网站 | 免费男女乱淫真视频免费播放 | 色七七桃花综合影院 | 亚洲综合图片一区 | 青青草国产在线视频 | 少妇高潮一69aⅹ | 肉肉av福利一精品导航 | 69国产精品视频免费观看 | 国产操| 影音先锋黄色资源 | 欧美裸体网站 | 亚洲国产大片 | 亚洲中文字幕无码一区 | 欧美精品123 | 人妻 日韩精品 中文字幕 | 18av视频| 碰超在线| 中文字幕在线观看视频网站 | 成人免费毛片网站 | 国产尤物视频在线 | 亚洲欧美日韩综合 | 免费在线播放黄色片 | 法国空姐在线观看完整版 | 欧美在线观看一区 | 欧美日本高清视频 | 成人av免费网址 | 欧美国产一区二区在线观看 | 亚州男人天堂 | 日韩激情视频网站 | 老司机福利精品 | 大肉大捧一进一出好爽视频 | 成人公开视频 | 国产99热 | 98成人网| 欧美一级免费在线观看 | 狠狠艹 | www.成人精品| 亚洲欧美自拍一区 | 国语播放老妇呻吟对白 |