客户挽留:信用卡客户流失管理
一、客戶流失管理過程
業(yè)務(wù)目標(biāo):預(yù)測客戶流失的概率和挽留的價(jià)值-->
數(shù)據(jù)準(zhǔn)備:數(shù)據(jù)決定結(jié)果-->
流失預(yù)警:哪些客戶即將流失-->
客戶價(jià)值:哪些客戶更值得挽留-->
分客群挽留策略:收益和成本的平衡-->業(yè)務(wù)目標(biāo)
?
二、目標(biāo)理解
需要對客戶的銷卡行為和價(jià)值進(jìn)行預(yù)測,制定差異化的挽留策略,實(shí)現(xiàn)收益和成本的最佳平衡。
典型聚類問題,將客戶按銷卡概率和客戶價(jià)值分為四類:
1. 價(jià)值高、銷卡概率低
2. 價(jià)值低、銷卡概率低
3. 價(jià)值高、銷卡概率高
4. 價(jià)值低、銷卡概率高
?
三、數(shù)據(jù)準(zhǔn)備
1. 設(shè)定目標(biāo)變量Y:客戶銷卡概率、客戶價(jià)值
2. 設(shè)定時(shí)間窗口,因?yàn)橐A(yù)測,自變量X應(yīng)該在應(yīng)變量之前預(yù)測才有意義,變量Y取半年內(nèi)客戶提出銷卡請求,自變量在應(yīng)變量之前一年,如圖
?
3. 設(shè)計(jì)預(yù)測變量(自變量X)
- 身份特征:性別、年齡、職業(yè)、學(xué)歷...
- 行為習(xí)慣:消費(fèi)頻次、購物類型、活躍度
- 信用歷史:信貸產(chǎn)品逾期、拖欠、還款情況
- 產(chǎn)品偏好:產(chǎn)品數(shù)量、產(chǎn)品類型、渠道喜好
- 客戶關(guān)系:持卡時(shí)長、投訴次數(shù)、營銷響應(yīng)、社交特征
- 生活形態(tài):居住環(huán)境、網(wǎng)絡(luò)行為標(biāo)簽、公共數(shù)據(jù)標(biāo)簽
4.準(zhǔn)備數(shù)據(jù)寬表
按客戶ID準(zhǔn)備好包含目標(biāo)變量(Y)和預(yù)測變量(X)的寬表
四、流失傾向預(yù)測
典型分類問題,使用Logistic回歸算法
1. 數(shù)據(jù)預(yù)處理非常重要,需要進(jìn)行粗分類,比如某個(gè)變量的取值有100個(gè),則將100個(gè)取值進(jìn)行分組合并,減少變量取值的個(gè)數(shù)。原則是:組內(nèi)應(yīng)變量差別小,組間應(yīng)變量差別大。
2. 計(jì)算分組變量的WOE和IV值(帥選變量依據(jù))
粗分類后,全部變量為類別變量,需計(jì)算WOE和IV值了解分組結(jié)果對應(yīng)變量的顯著性
WOE(Weigh Of Evidence)
IV(Information Value): 體現(xiàn)自變量對目標(biāo)變量的顯著性影響,一般來說IV在0.1到0.5直接表明變量X與目標(biāo)變量有一定的相關(guān)性
3. 共線性檢查
檢查WOE分組變量之間的相關(guān)性,對具有相關(guān)性的一批變量,可選其中的一個(gè)變量作為代表,這樣可以減少變量的個(gè)數(shù)。
指標(biāo):方差膨脹因子VIF(Varience Inflation Factor),VIF=1/(1-Rsquare)
- 0<VIF<5:存在較弱共線性
- 5<=VIF<10:存在較強(qiáng)共線性
- VIF>=10:存在強(qiáng)共線性
4. 模型訓(xùn)練:顯著性檢驗(yàn)
使用SAS Proc Logistic處理,一是得出與目標(biāo)變量顯著相關(guān)的自變量,一是模型對訓(xùn)練數(shù)據(jù)預(yù)測一致性百分比
5. 模型評估
運(yùn)用驗(yàn)證集數(shù)據(jù),根據(jù)模型訓(xùn)練計(jì)算出來的模型,進(jìn)行打分。
首先,按預(yù)測概率P從大到小進(jìn)行排序,將全部客戶分為若干組,然后計(jì)算每組客戶的實(shí)際銷卡率、平均預(yù)測概率(實(shí)際上是準(zhǔn)確率)、累計(jì)銷卡率(ROC曲線)、KS、提升度
1)實(shí)際銷卡率vs平均預(yù)測概率曲線(準(zhǔn)確率曲線)
二曲線重合度越高,則模型的準(zhǔn)確度越高,曲線陡峭下降,說明模型的區(qū)分能力強(qiáng),能夠?qū)撛诘匿N卡客戶鎖定在較小的范圍內(nèi),曲線平滑,說明模型穩(wěn)定,無過擬合問題。
2)累計(jì)銷卡率(ROC曲線)
體現(xiàn)模型覆蓋銷卡客戶的能力,建設(shè)將客戶隨機(jī)等分20組,則每組應(yīng)該還該5%的銷卡客戶,如果打分最高的5組客戶(占客戶總量的25%),覆蓋了75%的銷卡客戶,說明只要針對這25%的客戶進(jìn)行挽留,就能獲得全部客戶挽留75%的效果
?
3)KS:累計(jì)銷卡率-累計(jì)未銷卡率
用于評價(jià)模型的區(qū)分度,KS在30%-60%之間,則說明模型具有較強(qiáng)的區(qū)分度,如果KS過高,需要檢查變量的設(shè)計(jì)是否存在問題,或者運(yùn)用跟多的驗(yàn)證集檢查過擬合情況。
4)LIFT:提升度
相對不使用模型,運(yùn)用模型能夠縮小目標(biāo)客戶分布范圍的能力,即使用模型累計(jì)銷卡率/隨機(jī)情況累計(jì)銷卡率,如將客戶隨機(jī)等分20組,最高預(yù)測概率組有累計(jì)23%的銷卡率,提升率為23%÷5%=4.6
?
五、潛在客戶價(jià)值預(yù)測
預(yù)測數(shù)值,是典型的慧谷問題,線下回歸是最常用的算法。這里用了Logistic回歸和線性回歸相結(jié)合方法,先用Logistic回歸預(yù)測客戶為高價(jià)值的概率Ph,再將Ph作為預(yù)測變量與其他變量X一起建立線性回歸模型。
1. 高價(jià)值概率Ph預(yù)測:認(rèn)為根據(jù)客戶價(jià)值劃分為兩組,高價(jià)值客戶和低價(jià)值客戶,方法有二八法則,價(jià)值最高的20%的客戶定義為高價(jià)值客戶,也可以繪制Value分布圖,將拐點(diǎn)作為劃分依據(jù)。
然后按照流失傾向預(yù)測的方法進(jìn)行建模。
2. 客戶價(jià)值數(shù)值預(yù)測
線性回歸模型,變量X一般為數(shù)值型變量,對于離散型變量,通常選擇其他方法選擇最有影響力的變量劃分客戶群,為每個(gè)客戶群分別建立線性回歸模型。或者在高價(jià)值概率Ph預(yù)測時(shí)轉(zhuǎn)化為WOE變量。
3. 模型評估
兩項(xiàng)指標(biāo):
1)R方:體現(xiàn)預(yù)測變量X對目標(biāo)變量Y的解釋能力,介于0~1之間,越接近1,模型的擬合度越好。模型擬合度好并不代表在實(shí)際應(yīng)用時(shí)能夠準(zhǔn)確預(yù)測,也可能存在過擬合,所以R方是聘雇模型的必要條件,但不是充分條件。
2)擬合曲線:
根據(jù)驗(yàn)證集的預(yù)測結(jié)果,對比客群預(yù)測值和實(shí)際值,這樣的對比很有說服力。通常根據(jù)預(yù)測值從高到低等分20組,繪制魅族平均預(yù)測值和實(shí)際值,繪制擬合曲線。曲線解讀方法包括曲線擬合程度,陡峭程度、光滑性等。
?
六、客戶細(xì)分:差異化營銷服務(wù)的基礎(chǔ)
兩個(gè)模型建立之后,已經(jīng)可以預(yù)測未來哪些客戶更可能流失以及其潛在客戶價(jià)值高低,需要做的是識(shí)別最值得挽留的客戶,有效的分配營銷資源
?
以上內(nèi)容來自《SAS金融數(shù)據(jù)挖掘與建模:系統(tǒng)方法和案例解析》第六章
?
總結(jié)
以上是生活随笔為你收集整理的客户挽留:信用卡客户流失管理的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 沿黄生态旅游公路品牌宣传口号文案30句
- 下一篇: 离散概率分布与期望