风控评分模型全流程的开发及应用
風(fēng)控評分模型全流程的開發(fā)及應(yīng)用
? 信用評分卡的應(yīng)用場景有申請評分卡(A卡)、行為評分卡(B卡)、催收評分卡(C卡)和反欺詐評分卡(F卡)。
? 用戶申請信用貸款的流程依次是基本信息核查、強(qiáng)規(guī)則校驗(yàn)、反欺詐審核、評分模型和評分授信。最后通過評分決定對高風(fēng)險客戶拒絕,低風(fēng)險客戶自動審批,中風(fēng)險的客戶進(jìn)入人工審批。
評分卡開發(fā)流程
特殊進(jìn)件排除
確定觀察期和表現(xiàn)期
? 觀察期是計算變量的時期,表現(xiàn)期是預(yù)測的時間長度。比如預(yù)測客戶未來12個月內(nèi)出現(xiàn)違約的概率,則表現(xiàn)期為12個月。
好壞客戶定義
? 可以通過遷徙率和Vintage兩張圖來看。
? 從遷徙率來看,M2-M3的遷徙率達(dá)到85%,所以定義壞客戶為M2+以上;
? 從Vintage圖看,7期之后開始變得平穩(wěn),說明逾期客戶基本全部表現(xiàn),所以定義表現(xiàn)期為7期;于是,壞客戶的定義就是未來7個月內(nèi)出現(xiàn)M2以上的逾期。
樣本區(qū)分
? 為了達(dá)到最好的預(yù)測效果,通常會依據(jù)客群或者產(chǎn)品做樣本區(qū)分,針對不同的客群開發(fā)子評分卡,可以提高模型的預(yù)測效果。
數(shù)據(jù)源準(zhǔn)備
運(yùn)營商通話詳單、注冊時間、繳費(fèi)信息、流量使用信息、短信信息等
通過手機(jī)SDK獲取的設(shè)備及通訊相關(guān)信息,包括設(shè)備信息、通訊錄、通話記錄、短信、APP信息等
第三方短信供應(yīng)商積累的用戶數(shù)據(jù)。
第三方支付供應(yīng)商積累的用戶數(shù)據(jù)。包括身份證號碼、貸款金額、分期還款金額等。
是否多頭借貸、是否命中黑名單
運(yùn)營商數(shù)據(jù)、淘寶數(shù)據(jù)、社保公積金數(shù)據(jù)、網(wǎng)銀銀行卡流水?dāng)?shù)據(jù)。
個人征信數(shù)據(jù),包括信用卡、住房貸款、逾期貸款筆數(shù)等
通過身份證獲取的性別、年齡、籍貫地,通過手機(jī)號獲取的運(yùn)營商、手機(jī)號碼所在地區(qū)等。
建模流程
? 主要包括描述性統(tǒng)計分析、采樣、數(shù)據(jù)清洗、特征工程、變量分箱、WOE編碼、特征選擇、計算IV值、建模、卡方檢驗(yàn)、方差膨脹系數(shù)檢驗(yàn)、分?jǐn)?shù)轉(zhuǎn)換,本文不再展開。
注意幾個點(diǎn):
離散性變量做轉(zhuǎn)換的兩種方法。
? 第一,作獨(dú)熱編碼,即啞變量轉(zhuǎn)換。第二,根據(jù)離散變量分組后的目標(biāo)變量的均值排序,轉(zhuǎn)化為有序數(shù)值變量。第二點(diǎn)是我沒怎么注意過的方法。
變量分箱。
- 不同分箱好壞比率要有差異。
- 每個分箱中的好壞數(shù)量至少大于30。
- 每個分箱中的賬戶百分比至少大于2%。
- 每個分箱的好壞比率排序需要和業(yè)務(wù)常識一致。
- 分箱的取值符合業(yè)務(wù)常識。例如賬齡的分析一般為3的整數(shù)倍。
3.拒絕推斷
? 由于建立的模型的樣本均來自于已經(jīng)核準(zhǔn)的案件,這些案件質(zhì)量相對較好,這樣會造成模型偏誤。
? 事實(shí)上案件被拒絕后無法觀察其實(shí)際的績效表現(xiàn),所以采用拒絕推斷的方法來預(yù)測被拒絕案件好壞從而修正模型。常用的兩種方法:
- 簡單擴(kuò)充法
以初始模型計算出拒絕客戶的違約概率,設(shè)定閾值,決定客戶的好壞。 - 分群法
以初始模型計算違約概率,將審核通過的客戶劃分為n個群,拒絕客戶依然預(yù)測的概率歸類到某個分群。然后以該群體的正常違約比隨機(jī)分配拒絕客戶的好壞。
模型評估
? 不展開介紹模型評估的指標(biāo)了,之前的文章有寫過。詳見
風(fēng)控指標(biāo)詳解
注意幾點(diǎn):
- AUC值一般大于0.7以上可應(yīng)用
- KS值大于0.2可認(rèn)為有較好的預(yù)測效果
- PSI小于10%可認(rèn)為是高穩(wěn)定模型
模型監(jiān)控
? 模型實(shí)施后,要建立多個報表對模型的有效性、穩(wěn)定性進(jìn)行監(jiān)控。
- 穩(wěn)定性監(jiān)控報表
? 比較評分卡上線后與建模訓(xùn)練樣本客戶的分值分布,監(jiān)控模型的有效性
- 特征分析報表
? 比較評分卡上線后和建模訓(xùn)練間每個特征的分布,監(jiān)控特征的變化趨勢,評估模型的有效性。
? 可以從缺失值比率、特征分組后的占比、特征分組后的穩(wěn)定性、特征分組后的IV值、平均數(shù)、中位數(shù)、眾數(shù)等監(jiān)控。 - 不良貸款分析報表
? 評估不同分?jǐn)?shù)段的不良貸款,并與訓(xùn)練樣本進(jìn)行比較,監(jiān)控客戶信貸質(zhì)量。
? 比如,訓(xùn)練樣本分?jǐn)?shù)段100-300,M1的占比為10%,M2的占比為30%;上線后的樣本,分?jǐn)?shù)段100—300,M1的占比為9%,M2的占比為34%。當(dāng)發(fā)生顯著變化的時候,需要考慮分?jǐn)?shù)是否適用。 - 拒絕原因分析報表
分析被評分卡拒絕的原因分布。
? 基于單個變量,按照取值平均分為3-5組,計算每個組別的平均得分。對于用戶的各個變量,劃入對應(yīng)的組別。再將所有組別的最大值減去該組的平均得分,取差值,將各個變量對應(yīng)的差值從高到低進(jìn)行排序,輸出頭三個不同的拒絕原因。
評分截取點(diǎn)選取
? 截取點(diǎn)可根據(jù)凈收入以及預(yù)期的逾期率來進(jìn)行選擇,資金成本+數(shù)據(jù)成本+引流成本+運(yùn)營成本。
【作者】:Labryant
【原創(chuàng)公眾號】:風(fēng)控獵人
【簡介】:某創(chuàng)業(yè)公司策略分析師,積極上進(jìn),努力提升。乾坤未定,你我都是黑馬。
【轉(zhuǎn)載說明】:轉(zhuǎn)載請說明出處,謝謝合作!~
總結(jié)
以上是生活随笔為你收集整理的风控评分模型全流程的开发及应用的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。