ML之FE:利用FE特征工程(分析两两数值型特征之间的相关性)对AllstateClaimsSeverity(Kaggle2016竞赛)数据集实现索赔成本值的回归预测
生活随笔
收集整理的這篇文章主要介紹了
ML之FE:利用FE特征工程(分析两两数值型特征之间的相关性)对AllstateClaimsSeverity(Kaggle2016竞赛)数据集实现索赔成本值的回归预测
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
ML之FE:利用FE特征工程(分析兩兩數(shù)值型特征之間的相關(guān)性)對AllstateClaimsSeverity(Kaggle2016競賽)數(shù)據(jù)集實現(xiàn)索賠成本值的回歸預(yù)測
?
?
目錄
輸出結(jié)果
設(shè)計思路
核心代碼
?
?
?
?
輸出結(jié)果
1、數(shù)據(jù)集簡介
Dataset之AllstateClaimsSeverity:AllstateClaimsSeverity數(shù)據(jù)集(Kaggle2016競賽)的簡介、下載、案例應(yīng)用之詳細攻略
?
?
2、數(shù)據(jù)可視化
T1、繪制heatmap圖
T2、繪制散點圖
?
?
設(shè)計思路
?
核心代碼
threshold = 0.5 corr_list = [] for i in range(0,size): for j in range(i+1,size): if (data_corr.iloc[i,j] >= threshold and data_corr.iloc[i,j] < 1) or (data_corr.iloc[i,j] < 0 and data_corr.iloc[i,j] <= -threshold): corr_list.append([data_corr.iloc[i,j],i,j]) s_corr_list = sorted(corr_list,key=lambda x: -abs(x[0])) for v,i,j in s_corr_list: print ("%s and %s = %.2f" % (cols[i],cols[j],v))for v,i,j in s_corr_list:sns.pairplot(train, size=6, x_vars=cols[i],y_vars=cols[j] )plt.title('AllstateClaimsSeverity: Scatter plot of only the highly correlated pairs')plt.show()?
?
?
總結(jié)
以上是生活随笔為你收集整理的ML之FE:利用FE特征工程(分析两两数值型特征之间的相关性)对AllstateClaimsSeverity(Kaggle2016竞赛)数据集实现索赔成本值的回归预测的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Dataset之AllstateClai
- 下一篇: 成功解决TypeError: Singl