关于数据驱动消费金融业务的几点看法
本文將從數據驅動、風險收益平衡、換入換出、實驗、指標幾個角度來談一談我對數據渠道消費金融業務的一些看法。
數據驅動
隨著移動互聯網深入到人類生活的方方面面,大數據和機器學習技術不斷發展,各種簡單易用的工具(creditmodel?)也層出不窮,使得數據分析和機器學習的門檻也越來越低,這些技術在互聯網和消費金融行業迅速普及,現在各家銀行和消費金融機構,或外包或自建團隊,砸重金到數據平臺、決策引擎、模型和算法等新奇玩意上,我覺得并非是這些機構要引領行業變革,而是一種由于深怕自己在數字化改革浪潮中滯后或被同行恥笑的焦慮導致——有哪家銀行或機構敢說自己的消費金融業務沒有大數據風控模型?
大數據、機器學習、深度學習,這些名詞和概念聽起來很有科技感和未來感,但這些技術僅僅只是豐富了我們的信息維度,強化了我們收集和處理數據的能力,這些都是“術”的迭代,“道”,即金融的本質和基本規律并沒有改變。
一些消費金融從業人員,沉迷于大量的統計技術和花樣繁多的模型,長期被從樣本(可能是有偏的)抽離出的表象所“蒙騙”,忽視了業務的基礎和本質,從而做出錯誤的業務決策,造成重大損失。我們應該利用信息技術的優勢,高效地從錯綜復雜的信息中,提煉出問題的根本原因,我們必須有充足的知識和經驗提出正確的問題,從而做出正確的決策。我們要透過表象看到本質,從風險、成本、收益等基礎角度去思考消費金融每個環節的基本規律。
說了這么多,所謂數據驅動消費金融業務到底是什么呢?其實就是數據科學和科學方法論在金融業務里面的一個實際運用。經濟學、生物、化學、物理等基礎學科也是在應用這一套方法論。物理學大牛費曼對這套科學方法論做了一個深刻的總結:
首先你要猜測,這是最重要的一步。然后計算結果。將結果與經驗(實驗)進行比較。如果與經驗(實驗)不符,這種猜測就是錯誤的。這句簡單的話就是科學的關鍵。不管你猜得有多漂亮也不管你有多聰明,或者你叫什么名字。如果它與經驗不符,那它就是錯誤的。就是這樣。——理查德·費曼(Richard P. Feynman)
社會學家華萊士對科學研究方法做了更加深入的總結,提出了著名的“科學環”,如下圖所示:
具體來說,就是我們會在業務實踐中總結出一系列的假設出來,我們會根據這些假設對業務做一些判斷和預測,據此做出一些業務決策。我們的業務決策是不是正確的,是不是能夠拓展,這在假設的基礎上并不是很清楚的,必須通過實踐:要么驗證這些假設,要么推翻這些假設,我們在驗證假設過程中,又會根據現實提出一些新的假設,在這個基礎上我們不斷循環、反復,不斷的提高我們的業務水平,這就是所謂數據驅動的方法。
它并不是說你建套模型,然后根據這個模型,你就可以把這個模型運用到各個業務的方方面面。實際上數據驅動是這么一套方法論,這套方法論讓我們對我們所開展的業務的每個環節都有正確的認識,然后在正確的認識的基礎上指導我們把業務做得更好。
風險與收益平衡
很多傳統金融銀行的風險管理人員通過貸前、貸中、貸后一系列復雜的流程,希望盡可能杜絕壞賬,他們認為沒有壞賬就沒有風險。你要辦理一張信用卡,可能會去你單位進行調查,看你的社保公積金,看你的銀行流水,然后再決定是否發卡給你。這一套流程已經將很多人拒之門外,而實際上沒有一家銀行的壞賬為0,他們在盡力避免壞賬的同時,也損失了利潤。在這里,我要吐槽一下,很久之前,我在宇宙行申請了人生第一張信用卡,只有1萬額度,8年了,還是1萬額度。
消費信貸的目標不應只是減低壞賬,而應該是在利潤最大化的前提下盡力避免損失或壞賬風險,利潤最大化是比減少損失更合理的業務目標,要堅持風險和收益平衡的原則。
基于客戶生命周期的P&L分析(Profit & Loss analysis)分析,它是整個數據驅動的一個核心的工具。它告訴我們,在不同的情況之下,我們的盈利損失的表現是什么,我們的決策最終會怎么樣影響利潤和損失。(后面,我會詳細介紹這個P&L 分析工具,請大家關注漢森定理公眾號。)
換入換出
前一篇文章已經介紹了換出換出分析:
熟練掌握風控策略的換入換出(Swap Out & Swap In)分析
?
mp.weixin.qq.com
圖標
,有興趣的同學可以參考。
換入換出分析本來叫做:swap set analysis。換入換出在做一件什么事情呢?簡單來說,如你有A、B、C、D四類人,你當前的準入策略,通過A、B客群,拒絕C、D客群,當你迭代了策略之后,變成了通過B、C客群,拒絕A、D客群。這個時候C就是換入客群( swap out set ),A就是換出客群(swap out set),這個時候你需要知道A和C的實際表現是什么樣子,對于A你有歷史數據,可以估算,對于C你可能沒有歷史表現數據,無法準確估算。將來新的策略運用到實際業務當中去的時候,你要對A和C做好監控。因為你通過歷史樣本的分析,知道客群是什么樣子,過去的表現是什么樣子,從而證明采用新策略是不是正確,對于業務有什么影響,但是你不知道將來在你實施新策略之后,這樣的事情還會不會發生。如果不做換入換出分析的話,你不知道會得到什么樣的結果。
你的策略過去拒絕掉的客戶,現在要通過他,這是一個非常重要的決策。換入換出分析所做的事情,就是讓你知道這一決策會對業務產生什么樣的影響。不做換入換出分析,模型迭代之后,直接就上線決策了,結果最后發現實際結果和預測很不一致,這種情況在國內非常常見。我覺得從從業務的角度來說,這是一項不管采取什么樣的策略,上線新產品也好,開放新客群也好,都一定要做的非常重要的事情。
實驗
實驗是我們開展業務過程中檢驗假設、因果推斷和獲得正確結論,支持正確決策的重要的工具和方法。
如果你建了一個分數在0-1之間的信用評分模型,你根據模型的壞賬分布,增加了一條策略,即信用評分模型在0.4以上的人全部拒絕。這意味著,在策略實際上線后,不會有模型分大于0.4的人。下一次建模或者策略迭代的時候,你只能從0-0.4之間通過的客戶做樣本,這是一個非常糟糕的事情,這樣一來,你的客群會越做越窄。
從另外一個角度來看,大于0.4的客戶,并非沒有好客戶。模型評分大于0.4的人,如果壞賬率是30%,還有70%的人是好客戶,這這70%的人不是說不是說我們就永遠不要他們了,而是通過現在我們掌握的數據和信息、模型和工具、策略和手段,不能把這70%的好人與這30%的壞客戶區分開來,我們只好把他們拒絕了,但是將來如果我們有新的數據、新的模型和新的策略,很有可能把這70%的人當中一些好客戶給找出來。如果你不做實驗,不預留樣本,在你下一次的模型和策略迭代時,就沒有辦法把就70%的好好人給挑出來,所以一定要想辦法保留一個樣本,這會讓你將來在做新的模型或策略的時候,能夠有合適的樣本,支撐你的模型和策略迭代。
業務指標
設計、開發并使用可以準確報告當前業務實際現狀和預測業務發展趨勢的業務管理指標體系是管控消費信貸業務的關鍵。為什么這么說呢?首先業務管理指標會告訴我們決策系統是否有效,其次,能夠讓迅速獲取關鍵信息對業務的發展趨勢進行預測,并對問題進行迅速定位。最后,我們掌握信息后,可以迅速決策且采取行動。大家可以參考一下這篇文章:
全面了解消費金融業務指標體系—(一)資產質量分析
全面了解消費金融業務指標體系—(二)模型監控
?
后記
credtimodel 是漢森老師開發的一個R語言數據科學工具包,有數據預處理、變量衍生、數據分析、數據可視化、自動化建模五大功能模塊,已經發布接近兩年時間。
漢森定理( hansenmode )公眾號是我的個人公眾號,會定期分享風控策略、數據分析、風控建模的相關知識,歡迎關注。有問題需要交流的,可以在關注本公眾后之后,加我的個人微信,拉你入群。
總結
以上是生活随笔為你收集整理的关于数据驱动消费金融业务的几点看法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: css3动画制作转动相册
- 下一篇: 国内镜像各种加速器