ML之xgboost:利用xgboost算法(自带,特征重要性可视化+且作为阈值训练模型)训练mushroom蘑菇数据集(22+1,6513+1611)来预测蘑菇是否毒性(二分类预测)
生活随笔
收集整理的這篇文章主要介紹了
ML之xgboost:利用xgboost算法(自带,特征重要性可视化+且作为阈值训练模型)训练mushroom蘑菇数据集(22+1,6513+1611)来预测蘑菇是否毒性(二分类预测)
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
ML之xgboost:利用xgboost算法(自帶,特征重要性可視化+且作為閾值訓(xùn)練模型)訓(xùn)練mushroom蘑菇數(shù)據(jù)集(22+1,6513+1611)來(lái)預(yù)測(cè)蘑菇是否毒性(二分類預(yù)測(cè))
?
?
目錄
輸出結(jié)果
設(shè)計(jì)思路
核心代碼
?
?
?
輸出結(jié)果
后期更新……
可知,8個(gè)或者5個(gè)特征就足夠好了 ,odor、spore-print-color、population、gill-spacing、gill-size?
?
?
設(shè)計(jì)思路
后期更新……
?
?
核心代碼
后期更新……
print('XGB_model.feature_importances_:','\n', XGB_model.feature_importances_)from matplotlib import pyplot pyplot.bar(range(len(XGB_model.feature_importances_)), XGB_model.feature_importances_)from xgboost import plot_importance plot_importance(XGB_model)thresholds = sort(XGB_model.feature_importances_)for thresh in thresholds:selection = SelectFromModel(XGB_model, threshold=thresh, prefit=True)select_X_train = selection.transform(X_train)selection_model = XGBClassifier()selection_model.fit(select_X_train, y_train)select_X_test = selection.transform(X_test)y_pred = selection_model.predict(select_X_test)predictions = [round(value) for value in y_pred]accuracy = accuracy_score(y_test, predictions)print("Thresh=%.3f, n=%d, Accuracy: %.2f%%" % (thresh, select_X_train.shape[1], accuracy*100.0))?
?
?
總結(jié)
以上是生活随笔為你收集整理的ML之xgboost:利用xgboost算法(自带,特征重要性可视化+且作为阈值训练模型)训练mushroom蘑菇数据集(22+1,6513+1611)来预测蘑菇是否毒性(二分类预测)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: ML之LoRDTRF:基于LoRDT(C
- 下一篇: 成功解决model_selection\