當前位置:
首頁 >
使用R完成决策树分类
發布時間:2025/3/15
32
豆豆
生活随笔
收集整理的這篇文章主要介紹了
使用R完成决策树分类
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
關于決策樹理論方面的介紹,李航的《統計機器學習》第五章有很好的講解。
傳統的ID3和C4.5一般用于分類問題,其中ID3使用信息增益進行特征選擇,即遞歸的選擇分類能力最強的特征對數據進行分割,C4.5唯一不同的是使用信息增益比進行特征選擇。
特征A對訓練數據D的信息增益g(D, A) = 集合D的經驗熵H(D) – 特征A給定情況下D的經驗條件熵H(D|A)
特征A對訓練數據D的信息增益比r(D, A) = g(D, A) / H(D)
而CART(分類與回歸)模型既可以用于分類、也可以用于回歸,對于回歸樹(最小二乘回歸樹生成算法),需要尋找最優切分變量和最優切分點,對于分類樹(CART生成算法),使用基尼指數選擇最優特征。
參考自博客,一個使用rpart完成決策樹分類的例子如下:
[plain]?view plaincopy
效果圖如下:
這是一篇相關的論文。
總結
以上是生活随笔為你收集整理的使用R完成决策树分类的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: pg_upgrade升级数据库9.1.1
- 下一篇: DEV全选多选小技巧