日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

数据挖掘竞赛-员工离职预测训练赛

發(fā)布時(shí)間:2024/4/11 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 数据挖掘竞赛-员工离职预测训练赛 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

員工離職預(yù)測(cè)

簡(jiǎn)介

DC的一道回歸預(yù)測(cè)題。是比較基礎(chǔ)的分類(lèi)問(wèn)題,主要對(duì)邏輯回歸算法的使用。核心思路為屬性構(gòu)造+邏輯回歸

過(guò)程

數(shù)據(jù)獲取

報(bào)名參與比賽即可獲得數(shù)據(jù)集的百度網(wǎng)盤(pán)地址,這個(gè)比賽時(shí)間很久,隨時(shí)可以報(bào)名。

數(shù)據(jù)探索

  • 無(wú)關(guān)項(xiàng)
    • EmployeeNumber為編號(hào),對(duì)建模是干擾項(xiàng),刪除即可。
    • StandardHours和Over18全數(shù)據(jù)集固定值,沒(méi)有意義,刪除。
    • 相關(guān)性高
  • 相關(guān)圖

    可以發(fā)現(xiàn),有兩項(xiàng)相關(guān)性極高,刪除其中一個(gè)MonthlyIncome。

數(shù)據(jù)預(yù)處理

  • one-hot編碼
    • 對(duì)幾個(gè)固定幾個(gè)取字符串值的特征進(jìn)行one-hot編碼
  • 屬性構(gòu)造
    • 特征數(shù)目較少,暴力拼接不同屬性,構(gòu)造新屬性

數(shù)據(jù)挖掘建模

既是回歸賽又是分類(lèi)題,很明顯就是使用邏輯回歸(LR)模型。但是還是使用未調(diào)參的幾個(gè)基礎(chǔ)模型進(jìn)行交叉驗(yàn)證,發(fā)現(xiàn)LR較高,加上其他模型調(diào)參麻煩,就沒(méi)有多加研究。

# 多模型交叉驗(yàn)證 from sklearn.linear_model import LogisticRegression from sklearn.svm import SVC from sklearn.tree import DecisionTreeClassifier from sklearn.ensemble import RandomForestClassifier, AdaBoostClassifier, GradientBoostingClassifier import sklearn.neural_network as sk_nn from sklearn.model_selection import cross_val_score models = {'LR': LogisticRegression(solver='liblinear', penalty='l2', C=1),'SVM': SVC(C=1, gamma='auto'),'DT': DecisionTreeClassifier(),'RF' : RandomForestClassifier(n_estimators=100),'AdaBoost': AdaBoostClassifier(n_estimators=100),'GBDT': GradientBoostingClassifier(n_estimators=100),'NN': sk_nn.MLPClassifier(activation='relu',solver='adam',alpha=0.0001,learning_rate='adaptive',learning_rate_init=0.001, max_iter=1000) }for k, clf in models.items():print("the model is {}".format(k))scores = cross_val_score(clf, x_train, y_train, cv=10)print(scores)print("Mean accuracy is {}".format(np.mean(scores)))print("*" * 100)

對(duì)LR模型進(jìn)行網(wǎng)格搜索調(diào)參,發(fā)現(xiàn)默認(rèn)參數(shù)即可有不錯(cuò)的平臺(tái)驗(yàn)證率。

# 網(wǎng)格搜索調(diào)參 from sklearn.model_selection import GridSearchCV from sklearn.linear_model import LogisticRegression penaltys = ['l1', 'l2'] Cs = np.arange(1, 10, 0.1) parameters = dict(penalty=penaltys, C=Cs ) lr_penalty= LogisticRegression(solver='liblinear') grid= GridSearchCV(lr_penalty, parameters,cv=10) grid.fit(x_train,y_train) grid.cv_results_ print(grid.best_score_) print(grid.best_params_)

補(bǔ)充說(shuō)明

其實(shí)XgBoost和RF可能效果更好一些,但是由于一些原因,沒(méi)有深究,有興趣的可以進(jìn)一步研究,最高的貌似研究有0.92以上通過(guò)率了。具體數(shù)據(jù)集和代碼可以在我的Github找到,result.csv即為提交文件。附上提交時(shí)的平臺(tái)分?jǐn)?shù)和排名(22/1808)。

總結(jié)

以上是生活随笔為你收集整理的数据挖掘竞赛-员工离职预测训练赛的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 丰满多毛的大隂户视频 | 男人和女人日批 | 国产欧美第一页 | 欧美视频一二三 | 1024视频在线 | 波多野结衣在线观看一区 | 久久影业 | 日日干天天操 | 久久大 | 亚洲精品国产精品国自产观看浪潮 | 野外做受又硬又粗又大视频√ | 国产爽视频 | 91精品啪在线观看国产 | 国产精品人人人人 | 日韩一区二区免费播放 | 日本一区免费视频 | 国产91熟女高潮一区二区 | 亚洲 欧美 日韩 在线 | 俺也去婷婷 | 久久久久久久久免费 | 成人性生交大免费看 | 亚洲国产精品久久久久久 | 色又色| 麻豆婷婷 | 中文乱码人妻一区二区三区视频 | 福利网站在线观看 | 茄子视频懂你更多在线观看 | a级片免费视频 | 国产又黄又粗又猛又爽的视频 | 欧美亚洲 | 99久久久无码国产精品免费 | 可以免费看av的网址 | 首尔之春在线看 | 国产中年熟女高潮大集合 | 中国人妖和人妖做爰 | 亚洲h视频 | 久久中文字幕网 | 日韩 欧美 精品 | 久久麻豆av | 51调教丨国产调教视频 | www.激情五月.com | 精品视频一区二区在线 | 精品区一区二区 | 日本午夜激情视频 | 亚洲精品91天天久久人人 | 给我看高清的视频在线观看 | 91视频www | x88av在线 | 久久精品99国产精 | 色呦呦在线视频 | 小色哥网站 | 快色污| 日本在线小视频 | 日本黄色小片 | 天天干视频在线观看 | 福利电影一区二区三区 | 亚洲国产精品视频一区二区 | 五月天欧美 | 自拍偷拍国产视频 | 国产黄色片av | 不卡av中文字幕 | 午夜精 | 欧美91看片特黄aaaa | 黄色一级毛片 | www.爱爱.com| 日韩欧美极品 | 日韩视频一区在线 | 激情久久久| 日本在线不卡一区 | 久久精品视频一区二区三区 | 国产美女视频网站 | 国产人妖在线 | 国产在线视频不卡 | 最近中文字幕无免费 | 日本黄色网页 | 捆绑最紧bdsm视频 | 大黑人交交护士xxxxhd | 日本人妻熟妇久久久久久 | 九九热最新视频 | 中文在线免费看视频 | 国产一二区视频 | 人人妻人人澡人人爽久久av | 精品第一页| 国产精品午夜未成人免费观看 | 精品人妻久久久久一区二区三区 | 15p亚洲| 亚洲天堂2021av | 欧美乱大交| 欧美少妇15p| www.亚洲国产 | 国产亚洲精品av | 亚洲精品综合久久 | 国产精品VideoSex性欧美 | 韩国伦理片在线观看 | 国产精品一区二区三区在线免费观看 | 天天摸夜夜添狠狠添婷婷 | 麻豆性生活 | 亚洲综合色在线 | 日本黄色a视频 |