如何搭建和实现互联网金融授信领域的风控模型?
生活随笔
收集整理的這篇文章主要介紹了
如何搭建和实现互联网金融授信领域的风控模型?
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
互聯(lián)網(wǎng)金融其實就是互聯(lián)網(wǎng)+金融的簡稱,這個詞語算是屬于中國特有,其實就是通過互聯(lián)網(wǎng)的手段進行金融的交易,畢竟國有的金融機構覆蓋人群范圍還是比較狹窄。風控模型是互聯(lián)網(wǎng)金融的核心,能夠決定一個款互金產(chǎn)品的生死,畢竟這個是關系到錢的安全的存在。今天我們就用一篇文章來討論下風控模型的設計方式。第一:什么是風控?風控其實是包含風險管理和風險控制。風險管理,它是指如何在項目或者企業(yè)在一定的風險的環(huán)境里,把風險減至最低的管理過程。它的基本程序包括風險識別、風險估測、風險評價、風險控制和風險管理效果評價等環(huán)節(jié)。 風險控制是指風險管理者采取各種措施和方法,消滅或減少風險事件發(fā)生的各種可能性,或者減少風險事件發(fā)生時造成的損失。所以其實風險控制是風險管理中的一個環(huán)節(jié)。第三:風控模型的設計緯度從下面面的流程我們可以看到,風控模型的審核流程一般都是要經(jīng)過機器審核和人工確認的相結合的方式。模型審核同時大致分為三個階段,它通過用戶提交的數(shù)據(jù),對用戶的資質(zhì)進行審核,最終得到一個評分卡的分數(shù)。對于存疑和通過的進見,需要人工進行確認。所以說,風控模型的計算策略和機制在一個公司屬于絕密,規(guī)則出了核心的員工,其他人是不能知道風控規(guī)則的。第四:如果說金融產(chǎn)品的核心是風控,那么風控的核心是什么?答案其實就是: 信用評估 + 模型規(guī)則。第一步就是獲取數(shù)據(jù)信用評估來自于用戶數(shù)據(jù),模型規(guī)則其實就是用戶數(shù)據(jù)規(guī)則,信息的緯度也比較廣泛,大致可以分為基本信息/行為信息/信用信息/社交信息和消費信息等。當然獲取信息的方式也是千奇百怪,主要的來源有用戶提交/接口用戶授權/爬蟲/信息購買/黑白名單等方法。第三步: 調(diào)整指標分數(shù),給出評分。建立每個指標的評分規(guī)則,反復調(diào)試指標分,保證模型準確性。筆者也只是短暫接觸互聯(lián)網(wǎng)金融方面的知識,貽笑大方了!
簡單回答一下,權當拋磚引玉,希望能有專家出來回答 :-D首先要解釋風控和授信:風控是風險控制,主要是控制業(yè)務流程中作弊和欺詐行為的發(fā)生授信是指企業(yè)向客戶提供資金支持的行為所以,互聯(lián)網(wǎng)金融授信過程中的風控,目的主要是控制欺詐,核實本人身份和資料真假。領域限定:互聯(lián)網(wǎng)上的個人信貸。不同領域的風控業(yè)務相差較大,其他領域不太熟悉。目前主要的風控方式有3種:線下風控:就是靠人工面對面確定身份、居所和工作單位等;線上風控:銀行卡實名認證、手機號實名認證、央行征信、第三方征信、其他黑名單數(shù)據(jù)、自己黑名單、防偽冒欺詐數(shù)據(jù)……主要是各種自己獲取的數(shù)據(jù)和第三方數(shù)據(jù)交叉驗證,訓練自己的風控模型;線上和線下結合風控:部分高風險業(yè)務,可以投入人力審核,但要注意ROI。如果是線上風控,核心3要點有:數(shù)據(jù)模型規(guī)則其中,最重要的是數(shù)據(jù),因為核心數(shù)據(jù)資源是稀缺的。線上風控使用的數(shù)據(jù)大多屬于2類:行為數(shù)據(jù)和資質(zhì)數(shù)據(jù)。做個人信貸,比較重要的資質(zhì)數(shù)據(jù)是:個人身份信息、社交信息、電商購物信息、信用信息。常用的數(shù)據(jù)采集點包括:個人身份信息(身份證、學生證、學信網(wǎng))社交信息(通訊錄、通話記錄、搜索引擎、微博人人等社交網(wǎng)站)電商購物信息(電商購物、快遞記錄)信用信息(信用卡、貸款情況)以上資料,主要是由客戶主動提供,再加上企業(yè)從各種渠道拿到的數(shù)據(jù),進行交叉驗證。比較重要的行為數(shù)據(jù)有:設備數(shù)據(jù)(cookie、MAC、IMEI)、位置數(shù)據(jù)(IP/LBS/GPS)、時間屬(填寫速度、時間)、業(yè)務行為(資料修改)等等。業(yè)界使用的風控模型差距不大,比較通用。從線性的LR模型,到GBDT、隨機森林,再到最近很火的神經(jīng)網(wǎng)絡,性能逐步提升。模型的選取,主要考慮業(yè)務需求和技術能力,雖然LR比較簡單,但也有很多優(yōu)點,所以在特定領域特定問題上表現(xiàn)很好,仍被廣泛采用。具體到個人信貸業(yè)務上,需要一個非常抗過擬合、非線性能力的模型。規(guī)則一般由經(jīng)驗豐富的專家來人工定義,在業(yè)務量不大的初期,完全可以通過人工規(guī)則來處理風控問題。當然,隨著業(yè)務量的增大,后期還是很依賴模型的學習能力。常見的應用案例paypal/支付寶在支付領域的風控:https://gigaom.com/2016/how-paypal-uses-deep-learning-and-detective-work-to-fight-fraud/如何評估效果有2個關鍵指標:準確率/召回率,分別對應誤警和漏警。準確率/誤警:錯誤識別,將好客戶當做風險點處理。需要平衡用戶體驗和可解釋性,處罰規(guī)則不應過于粗暴。召回率/漏警:漏掉了風險,將風險客戶當做好客戶處理。模型和規(guī)則的更改,在上線前,需要做很多離線和在線的測試,確保最終效果是可以接受的。暫不清楚業(yè)界是否有其他方法,請專家補充。其他除了風控模型,整體的風控流程也非常重要。風控與業(yè)務高度相關,更換客戶群體和領域后,風控策略、模型特征、規(guī)則就會發(fā)生巨大的變化,所以很多東西是不能通用的。比如大學生消費貸款和白領的信用貸款,所需要的數(shù)據(jù)特征就很不一樣。
謝邀!感覺回答完你的問題,可以寫本書了,哈哈。。今天先嘗試第一個問題:風控模型是如何搭建的?我本身并不是專門從事風控這一塊的,但一直對風控建模這塊挺有興趣,加之在銀行的工作,對風控模型的理解如下,如有錯誤之處歡迎指正:1)風控模型的作用,四個字“量化風險”;2)進行量化的話,有兩種方法:一是評級,主要是對各個指標進行打分,然后;二是建模,數(shù)學模型或計量模型。FICO就是一種評級的方法。3)無論是評級,還是建模,第一步就是選取量化因子,通俗的說就是哪些指標可以反映客戶的風險情況4)第二步,確定模型。如果是評級的話,需要確定每個指標的分數(shù)等級和指標間的權重;如果是建模的話,需要確定具體采用哪種模型,我對計量比較熟悉,如果是計量模型的話,還要考慮指標間的多重共線性、模型的擬合優(yōu)度等等問題。3)第三步,就是需要大量數(shù)據(jù)和信息驗證模型的正確性和精確性。
@神器諸葛
簡單回答一下,權當拋磚引玉,希望能有專家出來回答 :-D首先要解釋風控和授信:風控是風險控制,主要是控制業(yè)務流程中作弊和欺詐行為的發(fā)生授信是指企業(yè)向客戶提供資金支持的行為所以,互聯(lián)網(wǎng)金融授信過程中的風控,目的主要是控制欺詐,核實本人身份和資料真假。領域限定:互聯(lián)網(wǎng)上的個人信貸。不同領域的風控業(yè)務相差較大,其他領域不太熟悉。目前主要的風控方式有3種:線下風控:就是靠人工面對面確定身份、居所和工作單位等;線上風控:銀行卡實名認證、手機號實名認證、央行征信、第三方征信、其他黑名單數(shù)據(jù)、自己黑名單、防偽冒欺詐數(shù)據(jù)……主要是各種自己獲取的數(shù)據(jù)和第三方數(shù)據(jù)交叉驗證,訓練自己的風控模型;線上和線下結合風控:部分高風險業(yè)務,可以投入人力審核,但要注意ROI。如果是線上風控,核心3要點有:數(shù)據(jù)模型規(guī)則其中,最重要的是數(shù)據(jù),因為核心數(shù)據(jù)資源是稀缺的。線上風控使用的數(shù)據(jù)大多屬于2類:行為數(shù)據(jù)和資質(zhì)數(shù)據(jù)。做個人信貸,比較重要的資質(zhì)數(shù)據(jù)是:個人身份信息、社交信息、電商購物信息、信用信息。常用的數(shù)據(jù)采集點包括:個人身份信息(身份證、學生證、學信網(wǎng))社交信息(通訊錄、通話記錄、搜索引擎、微博人人等社交網(wǎng)站)電商購物信息(電商購物、快遞記錄)信用信息(信用卡、貸款情況)以上資料,主要是由客戶主動提供,再加上企業(yè)從各種渠道拿到的數(shù)據(jù),進行交叉驗證。比較重要的行為數(shù)據(jù)有:設備數(shù)據(jù)(cookie、MAC、IMEI)、位置數(shù)據(jù)(IP/LBS/GPS)、時間屬(填寫速度、時間)、業(yè)務行為(資料修改)等等。業(yè)界使用的風控模型差距不大,比較通用。從線性的LR模型,到GBDT、隨機森林,再到最近很火的神經(jīng)網(wǎng)絡,性能逐步提升。模型的選取,主要考慮業(yè)務需求和技術能力,雖然LR比較簡單,但也有很多優(yōu)點,所以在特定領域特定問題上表現(xiàn)很好,仍被廣泛采用。具體到個人信貸業(yè)務上,需要一個非常抗過擬合、非線性能力的模型。規(guī)則一般由經(jīng)驗豐富的專家來人工定義,在業(yè)務量不大的初期,完全可以通過人工規(guī)則來處理風控問題。當然,隨著業(yè)務量的增大,后期還是很依賴模型的學習能力。常見的應用案例paypal/支付寶在支付領域的風控:https://gigaom.com/2016/how-paypal-uses-deep-learning-and-detective-work-to-fight-fraud/如何評估效果有2個關鍵指標:準確率/召回率,分別對應誤警和漏警。準確率/誤警:錯誤識別,將好客戶當做風險點處理。需要平衡用戶體驗和可解釋性,處罰規(guī)則不應過于粗暴。召回率/漏警:漏掉了風險,將風險客戶當做好客戶處理。模型和規(guī)則的更改,在上線前,需要做很多離線和在線的測試,確保最終效果是可以接受的。暫不清楚業(yè)界是否有其他方法,請專家補充。其他除了風控模型,整體的風控流程也非常重要。風控與業(yè)務高度相關,更換客戶群體和領域后,風控策略、模型特征、規(guī)則就會發(fā)生巨大的變化,所以很多東西是不能通用的。比如大學生消費貸款和白領的信用貸款,所需要的數(shù)據(jù)特征就很不一樣。
謝邀!感覺回答完你的問題,可以寫本書了,哈哈。。今天先嘗試第一個問題:風控模型是如何搭建的?我本身并不是專門從事風控這一塊的,但一直對風控建模這塊挺有興趣,加之在銀行的工作,對風控模型的理解如下,如有錯誤之處歡迎指正:1)風控模型的作用,四個字“量化風險”;2)進行量化的話,有兩種方法:一是評級,主要是對各個指標進行打分,然后;二是建模,數(shù)學模型或計量模型。FICO就是一種評級的方法。3)無論是評級,還是建模,第一步就是選取量化因子,通俗的說就是哪些指標可以反映客戶的風險情況4)第二步,確定模型。如果是評級的話,需要確定每個指標的分數(shù)等級和指標間的權重;如果是建模的話,需要確定具體采用哪種模型,我對計量比較熟悉,如果是計量模型的話,還要考慮指標間的多重共線性、模型的擬合優(yōu)度等等問題。3)第三步,就是需要大量數(shù)據(jù)和信息驗證模型的正確性和精確性。
@神器諸葛
總結
以上是生活随笔為你收集整理的如何搭建和实现互联网金融授信领域的风控模型?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 微信支付超过20万怎么办
- 下一篇: 虹猫蓝兔中七把剑的属性(按长虹剑、冰魄剑