當前位置：首頁 >

【大佬漫谈】数字科技驱动的信贷风险技术——乔杨

發(fā)布時間：2025/3/21 45 豆豆

生活随笔收集整理的這篇文章主要介紹了【大佬漫谈】数字科技驱动的信贷风险技术——乔杨小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

轉(zhuǎn)：原文鏈接：https://mp.weixin.qq.com/s/Zltw6taqF5qH46bL6ikHAA

一、構(gòu)建數(shù)據(jù)矩陣

我今天分享的主題是“數(shù)字科技驅(qū)動的信貸風險技術(shù)”。

作為股東及主要數(shù)據(jù)源之一，京東金融的數(shù)據(jù)具備大、厚、動的特點，也就是數(shù)據(jù)量大、數(shù)據(jù)維度高、同時具備實時更新的能力。

基于自身多年在電商零售及不同金融場景下的積累，京東金融每天新增的數(shù)據(jù)量級達到800TB，比一些小型科技公司1年的數(shù)據(jù)增量還要多。

同時，京東金融已與700多家金融機構(gòu)合作，共同服務線上線下商戶達800萬個，個人用戶數(shù)量超過4億。

可入?yún)⒛Ｐ妥兞砍^60萬維，已搭建并成功應用的風險策略超過5000個，風險模型超過500個。

活躍客戶65%以上為80后主力消費人群，也是消費及金融領域的核心客戶人群。

除了京東金融及京東體系的數(shù)據(jù)之外，ZRobot也與中國銀聯(lián)、三大運營商等頭部數(shù)據(jù)合作方展開深度合作。

加上與騰訊、百度等聯(lián)手成立的京騰計劃、京度計劃等，目前可對超過6億的個人進行準確的風險評估。

有了強大的數(shù)據(jù)基礎，ZRobot可以將數(shù)據(jù)技術(shù)發(fā)揮到極致，目前在AI領域?qū)崿F(xiàn)了一系列突破，包括全流程智能風險識別、生物識別、AI模型能力等。

二、數(shù)字科技驅(qū)動的發(fā)展趨勢

整個數(shù)字科技驅(qū)動的風控發(fā)展趨勢是從四個維度去看的：

第一個，從數(shù)據(jù)源的角度講，我們認為將來的數(shù)據(jù)源會變得越來越開放，數(shù)據(jù)孤島會被進一步打通，逐步形成數(shù)據(jù)共享機制。

第二個，是從整個模型的搭建方式上面，我們會看到從監(jiān)督式學習向無監(jiān)督學習的迭代和發(fā)展。

第三個，對于風險的單點判斷，會向群像特征轉(zhuǎn)變。

第四個，中心化管理更多會向去中心化的應用靠攏。

1.打通數(shù)據(jù)源

首先從數(shù)據(jù)源的角度講，通過我們的數(shù)據(jù)挖掘技術(shù)，目前已經(jīng)形成了刻畫完整用戶畫像的數(shù)據(jù)維度及屬性。

包括個人基本信息、生物特征、家庭信息、職業(yè)信息、資產(chǎn)信息、教育信息、消費記錄等等。

有了這個屬性基礎，無論在風險管理方面，還是在精準營銷方面，都能對用戶做出比較全面和準確的判斷。

數(shù)據(jù)孤島的打通，通過什么樣的方式可以有效做到呢？

第一個有效的方式，我們認為可以通過聯(lián)合建模的方式做到。大家都比較熟悉的業(yè)內(nèi)聯(lián)合建模一般遵循五大步驟進行。

從提交樣本到最終部署上線及模型校驗。在整個聯(lián)合建模的過程中，盡管能夠把數(shù)據(jù)資源打通，但是模型效果高度依賴于建模團隊本身的實力。

每家公司的建模團隊實力是參差不齊的，因此我們在建模流程中賦予了合作方的建模團隊一系列額外工具以及定制化的增值服務。

比如我們的數(shù)據(jù)清洗和特征工程階段。

做模型的人都知道，特征工程是建模最核心的過程，我們不僅把積累的數(shù)據(jù)字段推送到建模環(huán)境中供合作方使用，也會通過我們的核心模型加工訓練方法提煉出對業(yè)務方行之有效的特征變量，并輸送到建模環(huán)境中，幫助我們的合作方更好地搭建自己的模型。

同時，我們的模型可以基于合作方的業(yè)務需求做定制化建模，不限于風險類的模型，可以是精準營銷類的模型，也可以是需求預測類的模型等等。

在第二步的模型搭建過程中，可能有一些團隊，尤其是銀行方的建模團隊，對于像機器學習這樣的算法并不是很熟悉或者缺乏一定的業(yè)務相關經(jīng)驗。

如果需要這方面的模型咨詢以及額外的團隊參與和輔導，我們在這個環(huán)節(jié)也會提供一系列定制化服務，直至最終模型上線。

2.單點的判斷會向群像特征演變

第二個趨勢我剛才也提到了，就是向群像特征的演變，現(xiàn)在的欺詐風險，在中國信貸環(huán)境下遠高于信用風險。

隨著欺詐手段的不斷升級，欺詐的團伙化特征也日益明顯，欺詐的上下游產(chǎn)業(yè)鏈也越來越龐大，越來越成熟。

僅僅通過對個人的欺詐風險判斷,很難防范團伙作案帶來的影響和損失。

我們提出的漫網(wǎng)技術(shù)有效的解決了這個問題：類似谷歌提出的GraphLearning, 對用戶全方位的關聯(lián)關系進行識別，包括設備關聯(lián)、地址關聯(lián)、通信關聯(lián)等等。

構(gòu)建用戶的關系網(wǎng)絡圖譜，通過無監(jiān)督算法將無差別用戶劃分為不同群組，同時針對關聯(lián)關系強弱進行判斷設定權(quán)重。漫網(wǎng)的優(yōu)點非常明顯，也有非常成功的應用案例。

這個構(gòu)建過程的優(yōu)點是非常多的，不需要做數(shù)據(jù)打標，也不需要專家經(jīng)驗，同時還可以做提前預警，我們在內(nèi)部做了非常多的應用。

在商城注冊上，我們的覆蓋度達到98%，而且準確度達到99%。

在金融刷券類場景，我們的覆蓋率達到92%，準確率達到96%。

有了內(nèi)部的打磨和迭代，可以將成熟的技術(shù)對外進行賦能。

非監(jiān)督學習的應用會越來越廣泛，我們提出另外一個概念叫“斑馬擴散”，它的含義非常好理解，中國有一句古話叫“近朱者赤，近墨者黑”。

我們不能只關注“黑”而去忽略“白”，這個關聯(lián)關系不光是應用在黑名單擴散和反欺詐領域，還可以應用在白名單授信上。

基于我們積累的黑名單歷史記錄和白名單用戶的表現(xiàn)，進行復雜網(wǎng)絡的搭建，結(jié)合我們的專家規(guī)則，可以把我們的白名單擴散以及額外授信（指商業(yè)銀行向非金融機構(gòu)客戶直接提供的資金，或者對客戶在有關經(jīng)濟活動中可能產(chǎn)生的賠償、支付責任做出的保證）做大。

這種技術(shù)的應用可以在降低授信成本的基礎上大幅提升信貸效率，開辟了金融信貸領域的新天地。

3.特征挖掘

特征挖掘是我們非常核心的技術(shù)壁壘。

我舉一個具體的例子，大家知道用戶的顯性偏好，往往通過一些表層特征的挖掘，基于一些線性模型即可得到結(jié)論，但往往會出現(xiàn)較大偏差。

如果不能對特征進行修正的話，結(jié)論會產(chǎn)生極大的誤導性。

如果把這些結(jié)論作為業(yè)務方面的判斷，甚至會造成災難性的結(jié)果。

怎么對特征進行修正？

很簡單的做法，我們自下而上地看下這個修正流程。

第一步，我們可以對瀏覽、關注、購物車、交易等表層特征進行提煉，通過牛頓冷卻定律對特征進行修正。

牛頓冷卻定律指的是物體當前溫度為前一時間單位下的溫度與時間衰減因子的乘積。

比如從時間維度考慮，一個用戶最近一個月的消費比六個月前的消費對于判斷用戶偏好的貢獻更大。

引入牛頓冷卻定律，賦予不同時間節(jié)點消費特征不同的衰減因子，可以將特征的描述準確度提升。

第二步，可以用Wilson區(qū)間（威爾遜區(qū)間算法，著名排名算法之一）修正低頻行為下的偏好置信度。

通過這個修正，大家可以看到這個用戶的顯性偏好，這類修正方法在數(shù)據(jù)不足、頻次較低的情況下是非常有效的。

在沒有完善方法論的時候，可以通過統(tǒng)計用戶在各個領域的購物頻次、RFM的方法（用來衡量客戶價值和客戶創(chuàng)利能力的工具）也能得到用戶顯性偏好的推斷。但對于用戶的隱形偏好，需要更深層的數(shù)據(jù)挖掘。

比如我們可以將總體平均顯性行為作為先驗概率，通過貝葉斯（當分析樣本大到接近總體數(shù)時，樣本中事件發(fā)生的概率將接近于總體中事件發(fā)生的概率）推斷對比推斷用戶的后驗隱性偏好。

這就是我們通過用戶與群體偏好對比，推斷用戶隱形偏好概率的方法論。

總結(jié)

以上是生活随笔為你收集整理的【大佬漫谈】数字科技驱动的信贷风险技术——乔杨的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：【风控体系】互联网反欺诈体系漫谈
下一篇：【随笔】如何快速转载CSDN中的博客

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

【大佬漫谈】数字科技驱动的信贷风险技术——乔杨

總結(jié)