数据挖掘实战项目-客户流失及客户行为偏好分析
app客戶流失及客戶行為偏好分析(僅供參考)
20**年*月 - 20**年*月
分類信息app,通過數(shù)據(jù)挖掘分析影響用戶流失的關(guān)鍵因素、深入了解用戶行為偏好以此做出調(diào)整,提升客戶留存率,增強客戶黏性,并通過隨機森林算法預(yù)測客戶流失,通過特征創(chuàng)造使模型分數(shù)提高2個百分點。
項目內(nèi)容:
探索數(shù)據(jù)分布,缺失情況,針對性的進行缺失值填補,對于缺失較少的重要特征選擇隨機森林缺失填補法,使用3sigma、箱型圖分析等對異常值進行處理,對分類型變量進行編碼。
使用方差過濾、F檢驗過濾掉一部分特征,進行WOE分箱,對每個特征分箱結(jié)果進行可視化,分析每個特征分箱情況并以此分析 用戶行為偏好,使用各個特征的IV值進一步篩選特征。
訓練隨機森林模型,模型調(diào)參、評估,輸出模型,以此模型對用戶流失進行預(yù)測,以便針對性地挽留用戶。訓練邏輯回歸模型,通過其算法可解釋性強的特點(特征系數(shù))來對用戶流失關(guān)鍵因素進行闡述。
使用工具:
python、pandas、numpy、matplotlib、seaborn、sklearn庫
在做一個數(shù)據(jù)挖掘項目前,需要預(yù)先擬好主要思路,比如目標是什么,先做什么,再做什么,有哪些注意事項等等。
本次案例內(nèi)容,包括
總結(jié)
以上是生活随笔為你收集整理的数据挖掘实战项目-客户流失及客户行为偏好分析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: whatlies包 | 简单玩转词向量可
- 下一篇: 数据挖掘应用实战-一文教你如何全面分析股