日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python随机森林特征重要性原理_使用Python的随机森林特征重要性图表

發(fā)布時間:2023/12/8 python 37 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python随机森林特征重要性原理_使用Python的随机森林特征重要性图表 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

我正在使用Python中的RandomForestRegressor,我想創(chuàng)建一個圖表來說明功能重要性的排名。這是我使用的代碼:

from sklearn.ensemble import RandomForestRegressor

MT= pd.read_csv("MT_reduced.csv")

df = MT.reset_index(drop = False)

columns2 = df.columns.tolist()

# Filter the columns to remove ones we don't want.

columns2 = [c for c in columns2 if c not in["Violent_crime_rate","Change_Property_crime_rate","State","Year"]]

# Store the variable we'll be predicting on.

target = "Property_crime_rate"

# Let’s randomly split our data with 80% as the train set and 20% as the test set:

# Generate the training set. Set random_state to be able to replicate results.

train2 = df.sample(frac=0.8, random_state=1)

#exclude all obs with matching index

test2 = df.loc[~df.index.isin(train2.index)]

print(train2.shape) #need to have same number of features only difference should be obs

print(test2.shape)

# Initialize the model with some parameters.

model = RandomForestRegressor(n_estimators=100, min_samples_leaf=8, random_state=1)

#n_estimators= number of trees in forrest

#min_samples_leaf= min number of samples at each leaf

# Fit the model to the data.

model.fit(train2[columns2], train2[target])

# Make predictions.

predictions_rf = model.predict(test2[columns2])

# Compute the error.

mean_squared_error(predictions_rf, test2[target])#650.4928

功能重要性 h1>

features=df.columns[[3,4,6,8,9,10]]

importances = model.feature_importances_

indices = np.argsort(importances)

plt.figure(1)

plt.title('Feature Importances')

plt.barh(range(len(indices)), importances[indices], color='b', align='center')

plt.yticks(range(len(indices)), features[indices])

plt.xlabel('Relative Importance')http://www.agcross.com/2015/02/random-forests-in-python-with-scikit-learn/上找到的示例更改了此功能重要性代碼

我嘗試使用我的數(shù)據(jù)復制代碼時收到以下錯誤:

IndexError: index 6 is out of bounds for axis 1 with size 6此外,只有一個功能出現(xiàn)在我的統(tǒng)計圖中,100%重要,沒有標簽。

任何幫助解決這個問題,所以我可以創(chuàng)建這個圖表將不勝感激。

總結

以上是生活随笔為你收集整理的python随机森林特征重要性原理_使用Python的随机森林特征重要性图表的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。