随机森林_R代码及用法
隨機(jī)森林(Random Forests)簡介
Nilsson在1965年提出:由多位專家組合而成,按一些特定的方式(如投票法,權(quán)重法)整合各位專家的意見進(jìn)行決策,其得到的結(jié)果會比只有單個專家的效果更好。由于每位專家的擅長之處不同,因此通過組合的機(jī)制可以讓專家之間彼此互補(bǔ),得到更好的結(jié)果。
隨機(jī)森林(Random Forests)屬于套袋法的一種,是基于決策樹所建立的,結(jié)合多個決策樹的預(yù)測結(jié)果,而每棵樹都是根據(jù)隨機(jī)森林的隨機(jī)向量的值所建立的。
隨機(jī)森林在影響因素探討上,現(xiàn)有研究表明,隨機(jī)森林不需要估計一般回歸分析面臨的多元共線性的問題,不需要做變量選擇,便于計算變量的非線性作用,而且可以評估自變量的重要性。
張雷, 王琳琳, 張旭東, 等. 隨機(jī)森林算法基本思想及其在生態(tài)學(xué)中的應(yīng)用: 以云南松分布模擬為例. 生態(tài)學(xué)報, 2014, 34(3): 650-659.
隨機(jī)森林的估計過程
1)指定m值,即隨機(jī)產(chǎn)生m個變量用于節(jié)點上的二叉樹,二叉樹變量的選擇仍然滿足節(jié)點不純度最小原則;
2)應(yīng)用Bootstrap自助法在原數(shù)據(jù)集中有放回地隨機(jī)抽取k個樣本集,組成k棵決策樹,而對于未被抽取的樣本用于單棵決策樹的預(yù)測;
3)根據(jù)k個決策樹組成的隨機(jī)森林對待分類樣本進(jìn)行分類或預(yù)測,分類的原則是投票法,預(yù)測的原則是簡單平均。
隨機(jī)森林的兩個重要參數(shù):
1.樹節(jié)點預(yù)選的變量個數(shù):單棵決策樹決策樹的情況。<
總結(jié)
以上是生活随笔為你收集整理的随机森林_R代码及用法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 害!天天在公司写业务代码,面几家挂几家,
- 下一篇: 考粒子静态能源公式、太阳系天体运动原理.