决策树可视化,被惊艳到了!
目前無論是機器學習競賽還是工業界,最流行、應用最廣泛的xgboost其實是優化后的GBDT(LightGBM里面的boosting比較經典穩定的也是GBDT哦!),而GBDT的基分類器最常用的就是CART決策樹!掌握決策樹,對理解之后的GBDT、LightGBM都有大有裨益。
可視化的方式理解決策樹,對深刻理解這個模型很有幫助。大家最熟知的決策樹可視化實現方式是下面這種:
dot_data?=?export_graphviz(clf,out_file=None,feature_names=df.columns[:-1],class_names=["good",?"bad"],filled=True,rounded=True,special_characters=True, ) graph2?=?pydotplus.graph_from_dot_data(dot_data) graph2.write_png("./pics/tree.png")這種方法很好地展示了樹的結構,但并不完美:
1、基尼系數會占用圖中的空間,并且不利于解釋
2、每個節點中各目標類別的樣本數不夠直觀
今天向大家介紹一個更為驚艷的決策樹可視化庫——dtreeviz ?,我們直接看幾張效果圖
dtreeviz有以下特色:
利用有顏色的目標類別圖例
葉子大小與該葉子中的樣本數成正比
將≥和<用作邊緣標簽,看起來更清晰
決策節點利用堆疊直方圖展示特征分布,每個目標類別都會用不同的顏色顯示
在每個節點中各目標類別的樣本數都用直方圖的形式,這樣可以提供更多信息
dtreeviz同樣依賴GraphViz,其安裝配置方法可以參考我之前的文章(點擊直達:決策樹的可視化)
GraphViz 搞定后,安裝dtreeviz即可
pip?install?dtreeviz?????????????#?install?dtreeviz?for?sklearn pip?install?dtreeviz[xgboost]????#?install?XGBoost?related?dependency pip?install?dtreeviz[pyspark]????#?install?pyspark?related?dependency pip?install?dtreeviz[lightgbm]???#?install?LightGBM?related?dependency使用也很簡單
各位伙伴們好,詹帥本帥搭建了一個個人博客和小程序,匯集各種干貨和資源,也方便大家閱讀,感興趣的小伙伴請移步小程序體驗一下哦!(歡迎提建議)
推薦閱讀
牛逼!Python常用數據類型的基本操作(長文系列第①篇)
牛逼!Python的判斷、循環和各種表達式(長文系列第②篇)
牛逼!Python函數和文件操作(長文系列第③篇)
牛逼!Python錯誤、異常和模塊(長文系列第④篇)
總結
以上是生活随笔為你收集整理的决策树可视化,被惊艳到了!的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python赋值、打包和解包,90%人不
- 下一篇: 又一个神器!只需一行代码,纯文本秒变Ma