风控项目-收集基础知识1
信用違約風險的基本概念
交易對手未能履行約定中的義務而造成的經濟損失的風險(時間)
違約指標:
(PD)違約概率:當前沒有發(fā)生未來可能發(fā)生的可能性
(LGD)違約條件下的損失率:有信貸機構催收期
(EAD)違約風險下的敞口暴露:當前已經發(fā)生違約情況下欠多少錢
信用違約的主體:
個人違約:個人向金融機構,在設定期限內沒有償還
公司違約:公司向金融機構沒有還款,或者公司發(fā)行債券沒有履行
主權違約:一國政府無法向外借來的債務違約(如:阿根廷)
個人違約定義:M3(嚴重逾期)、債務重組、個人破產、銀行主動關戶或注銷
M0:最后繳款日之后一個月
M1:最后還款日后一個月到后兩個月
M3:最后還款日超過3個月
?
申請評分卡
信貸場景中的評分卡:
1、分數形式衡量風險
2、對未來一段時間內預測
3、有一個明確正區(qū)間
4、通常分數越高越安全(信用和逾期率成反比模型)
5、數據驅動
6、反欺詐評分卡、申請評分卡(申請)、行為評分卡(監(jiān)控)、催收評分卡(逾期管理)
申請評分卡:
用在貸款的申請環(huán)節(jié),以申請者在申請日以及過去的信息為基礎預測未來放款后的逾期或者違約概率
風險控制:借貸生命周期的第一個關口
營銷:優(yōu)質客戶識別 (放款額度,利率)
資本管理:可作為PD模型的因子
評分卡特性:
1、穩(wěn)定性
2、區(qū)分性:違約和正常應該有顯著差異
3、預測能力:低分人群的違約率更高
4、評分和逾期概率等價:評分可以準確的反應違約概率
用戶申請--》準入規(guī)則--》滿足--》反欺詐--》滿足--》三方檢驗--》申請評分通過--》放款
評分卡模型開發(fā)步驟:
1、立項:場景、對象(個人、賬戶、公司)、目的(決策、流失預警、反欺詐)
2、數據準備與預處理:賬戶、客戶
個人:賬戶級別信息收集? 外部數據:外部機構如電商這個人的相關行為
3、模型構建:邏輯回歸 && 機器學習(adboost 參數推導等等)
4、模型評估:區(qū)分度、預測性、平穩(wěn)性
5、驗證/審計:是否計算錯誤、邏輯錯誤
6、模型部署:從開發(fā)環(huán)境到生產環(huán)境、容量
7、模型監(jiān)控:性能是否減弱,是否需要優(yōu)化甚至從開發(fā)(滯后性)
評分卡開發(fā)的常用模型:
優(yōu)點:可解釋性,易于監(jiān)控和部署
缺點:準確度不高
決策樹:對數據質量要求低,易解釋
缺點:準確度不高
其它元模型:
組合模型:
優(yōu)點:準確度高,不易過擬合
缺點:不易解釋;部署困難;計算量大
?
貸款申請環(huán)節(jié)的數據介紹和描述
申請評分卡常用的特征
個人信息? 學歷 性別 收入
負債信息? 在本機構或者其它機構負債情況
消費能力? 商品購買記錄,出境游,奢移品消費
歷史信用記錄? 歷史逾期行為
還款意愿(個人信息、歷史信用記錄)* 還款能力(負債信息、消費能力)
新興數據? 人際社交 網絡足跡 出行 個人財務
?
非平衡樣本問題的定義和解決方法
信貸風險:正常用戶遠大于違約用戶
降低減少類樣本的靈敏性
非平衡樣本的解決方案:
過采樣
優(yōu)點:簡單,對數據質量要求不高
缺點:過擬合
欠采樣
優(yōu)點:簡單,對數據質量要求不高
缺點:丟失重要信息
SMOTE(合成少數過采樣技術)
優(yōu)點:不易過擬合,保留信息
缺點:不能對有缺失值和類別變量做處理
?
SMOTE算法
1、采樣最近鄰算法,計算出每個少數樣本的K近鄰
2、從K個近鄰中隨機挑選出n個樣本進行隨機線性插值
3、構造新的少數類樣本
? ? ? new = xi + rand(0,1)*(yj-xi) xi為少數類中的一個觀測點,yj為k個近鄰中隨機抽取的樣本
4、將新樣本與原數據合成,產生新的訓練集
總結
以上是生活随笔為你收集整理的风控项目-收集基础知识1的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mac搭建虚拟环境
- 下一篇: 风控项目-收集基础知识2