日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

集成学习之sklearn中的xgboost基本用法 (转载)

發(fā)布時間:2024/9/5 编程问答 44 豆豆
生活随笔 收集整理的這篇文章主要介紹了 集成学习之sklearn中的xgboost基本用法 (转载) 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

轉(zhuǎn)載自:https://blog.csdn.net/qq_30868235/article/details/80370060

1.數(shù)據(jù)集

????? 數(shù)據(jù)集使用sklearn自帶的手寫數(shù)字識別數(shù)據(jù)集mnist,通過函數(shù)datasets導(dǎo)入。mnist共1797個樣本,8*8個特征,標簽為0~9十個數(shù)字。

### 載入數(shù)據(jù)
from sklearn import datasets # 載入數(shù)據(jù)集
digits = datasets.load_digits() # 載入mnist數(shù)據(jù)集
print(digits.data.shape) # 打印輸入空間維度
print(digits.target.shape) # 打印輸出空間維度

?

"""
(1797, 64)
(1797,)
"""

2.數(shù)據(jù)集分割

????? sklearn.model_selection中train_test_split函數(shù)劃分數(shù)據(jù)集,其中參數(shù)test_size為測試集所占的比例,random_state為隨機種子(為了能夠復(fù)現(xiàn)實驗結(jié)果而設(shè)定)。

### 數(shù)據(jù)分割
from sklearn.model_selection import train_test_split # 載入數(shù)據(jù)分割函數(shù)train_test_split
x_train,x_test,y_train,y_test = train_test_split(digits.data, # 特征空間
digits.target, # 輸出空間
test_size = 0.3, # 測試集占30%
random_state = 33) # 為了復(fù)現(xiàn)實驗,設(shè)置一個隨機數(shù)

?

3.模型相關(guān)(載入模型--訓(xùn)練模型--模型預(yù)測)

????? XGBClassifier.fit()函數(shù)用于訓(xùn)練模型,XGBClassifier.predict()函數(shù)為使用模型做預(yù)測。

### 模型相關(guān)
from xgboost import XGBClassifier
model = XGBClassifier() # 載入模型(模型命名為model)
model.fit(x_train,y_train) # 訓(xùn)練模型(訓(xùn)練集)
y_pred = model.predict(x_test) # 模型預(yù)測(測試集),y_pred為預(yù)測結(jié)果

4.性能評估

????? sklearn.metrics中accuracy_score函數(shù)用來判斷模型預(yù)測的準確度。

### 性能度量

from sklearn.metrics import accuracy_score # 準確率
accuracy = accuracy_score(y_test,y_pred)
print("accuarcy: %.2f%%" % (accuracy*100.0))

5.特征重要性

??????xgboost分析了特征的重要程度,通過函數(shù)plot_importance繪制圖片。

### 特征重要性
import matplotlib.pyplot as plt
from xgboost import plot_importance
fig,ax = plt.subplots(figsize=(10,15))
plot_importance(model,height=0.5,max_num_features=64,ax=ax)
plt.show()

6.完整代碼

### load module
from sklearn import datasets
from sklearn.model_selection import train_test_split
from xgboost import XGBClassifier
from sklearn.metrics import accuracy_score

### load datasets
digits = datasets.load_digits()

### data analysis
print(digits.data.shape) # 輸入空間維度
print(digits.target.shape) # 輸出空間維度

### data split
x_train,x_test,y_train,y_test = train_test_split(digits.data,
digits.target,
test_size = 0.3,
random_state = 33)

### fit model for train data
model = XGBClassifier()
model.fit(x_train,y_train)

### make prediction for test data
y_pred = model.predict(x_test)

### model evaluate
accuracy = accuracy_score(y_test,y_pred)
print("accuarcy: %.2f%%" % (accuracy*100.0))
"""
95.0%
"""

轉(zhuǎn)載于:https://www.cnblogs.com/xitingxie/p/11323114.html

總結(jié)

以上是生活随笔為你收集整理的集成学习之sklearn中的xgboost基本用法 (转载)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。