机器学习里面的树形模型
生活随笔
收集整理的這篇文章主要介紹了
机器学习里面的树形模型
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1. 決策樹不用考慮scaler。
2, xgboost 缺失值都可以不用考慮。
3.libSVM的數據格式及使用方法總結
首先介紹一下?libSVM的數據格式
Label 1:value 2:value ….
Label:是類別的標識,比如上節train.model中提到的1 -1,你可以自己隨意定,比如-10,0,15。當然,如果是回歸,這是目標值,就要實事求是了。
Value:就是要訓練的數據,從分類的角度來說就是特征值,數據之間用空格隔開
比如: -15 1:0.708 2:1056 3:-0.3333
需要注意的是,如果特征值為0,特征冒號前面的(姑且稱做序號)可以不連續。如:
???????-15 1:0.708 3:-0.3333
表明第2個特征值為0,從編程的角度來說,這樣做可以減少內存的使用,并提高做矩陣內積時的運算速度。我們平時在matlab中產生的數據都是沒有序號的常規矩陣,所以為了方便最好編一個程序進行轉化。
總結
以上是生活随笔為你收集整理的机器学习里面的树形模型的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: elasticsearch-jdbc同步
- 下一篇: 朴素贝叶斯(Naive Bayes),“