互联网金融售前心得数据脱敏分析 | PMCAFF微分享
本期主題 | 互聯網金融售前心得&數據脫敏分析
分享嘉賓 | Gina
文字整理 | Mayi-天享
入群請聯系管理員37°C微信號:erhuoyimei
Gina 本期嘉賓
Gina曾在花旗銀行做系統分析師和Java開發,在搜狐暢游做過App前端開發,后轉做手游數據分析師,目前在明略數據做產品經理,參與過的項目有河北公安系統,武漢城商行數據脫敏項目,動車運維系統。
首先,都說產品經理和銷售是捆綁的關系,經常一起見客戶,而我覺得雖然是一起見客戶,但是我們的關注點自然和銷售是不同的。銷售的職責是簽單子,而我們產品經理的職責則是挖掘客戶的需求,讓對方把痛點暴漏出來,然后讓對方知道,我們可以幫他們解決問題。
最近見了一些銀行、金融方面的客戶,這些客戶的痛點比較一致,無外乎兩點:一種是數據不全,甚至是沒有數據;而另一種是有數據,但是又不知道該如何去利用數據。對于第一種用戶而言,他們的首要工作是要建立業務模型,去做數據埋點。而第二種用戶,他們需要是解決方案。
對于銀行大數據的應用的需求總結下來,主要有5點:
1、客戶畫像(個人客戶畫像、企業客戶畫像)
2、運營優化,包括快速放貸、產品組合優化、輿情分析、服務升級(個性化、多樣化服務)
3、風險控制,包括反欺詐應用(申請欺詐和交易欺詐)、小微企業貸款評估以及P2P平臺
4、精準營銷(精準預測、個性化推薦、聯合營銷)
5、業務創新(批量獲客、跨界融合、整合資源和升級產業)
1
客戶畫像
大家應該都比較了解了,就是對用戶打標簽,以表示不同屬性的用戶。例如打上性別標簽、年齡標簽、消費偏好標簽。這點在電商行業已被廣泛運用??蛻舢嬒竦脑硎?#xff0c;通過樣本數據學習不同標簽用戶的行為特征,再根據學習到的知識來將未知標簽的用戶進行分類??蛻舢嬒竦膽妹娣浅V泛。可用于快速識別白名單和黑名單;給予其余中間層客戶的詳細評級分類;利用大數據提高自動核準率,從而大幅提升運營效率,也用于精準營銷;征信評級;反欺詐;動態調整級別和監控(增收和降低壞賬率)、快速放貸和提升金融服務水平。
2
運營優化
其中我主要說一下快速房貸。這個也是我們公司為河北郵儲做的一個主要解決方案。目前銀行的放貸速度很慢,主要時間浪費在信用審核和人力上。因此一個完善的用戶信用模型在這里至關重要。目前已經有銀行在做微信申請信用卡,貸款的項目了。其實對于國內的銀行來說,還有一個非常無奈的痛點,就是數據同步的問題。通常都是各個分行都拿著自己的數據。數據不互通,是導致用戶畫像不完善的主要原因,如果能夠打通行內外數據,分析發現優質客戶,實現超短期放貸真的是極好的。
3
風險控制
貼一張應用場景的圖片
風險管理的主要應用在反欺詐上,金融行業的反欺詐驗證,主要有以下三點:
1、網絡申請信用卡收入過分或故意夸大
2、網絡申請信用卡姓名,手機號碼和身份證的一致性的校驗
3、是否存在銀行交易欺詐記錄
第一點:可以通過分析用戶的社保數據、運營商數據、網絡行為數據(職業、收入等預測畫像…)來進行規避。
第二點和第三點:實時分析數據進而監測潛在風險并預警,實時監控系統內的各類數據,例如用戶操作、交易流水、訪問記錄等如某內部工作人員在某段時間內操作存貸/匯交易的時間大幅度快于其歷史水平;比銀行平均水平也要快出很多;內部員工每個月由其自己賬戶向幾家銀行匯款或支付好幾家信用卡;美國這2-3年留學生臨到畢業之前的2-3個月,信用卡消費是歷史平均的好幾倍甚至更多(如果能結合網絡行為信息:查詢來源國工作,航旅公司機票那確定性…)美國留學生這個是個很經典的案例。有很多留學生在即將畢業回國的時候,會拼命地透支信用卡,等到他們回國,這筆錢就無法被追回。因此風險控制,不只是要利用用戶信用模型,還要實時監控用戶的消費行為軌跡是否發生突變。而這點,目前很多銀行都沒有合適的解決方案。
下面是某銀行反欺詐模型:
4
精準營銷
這里又用到了用戶畫像,如下面的應用場景圖所示
隱私權問題肯定會有,因此在做大數據分析的時候,安全方面也要注意。在國內,買賣數據的現象真心很嚴重。精準營銷這個我們公司應用在了銀聯商務項目中,主要是對海量交易流水的客戶行為分析和預測。舉兩個案例,一個是中國銀行排隊機交叉銷售系統,一個是招商銀行VIP客戶大數據精準營銷。這個也不僅僅局限于金融行業,而是被廣大行業所應用。
5
業務創新
這個比較有意思,主要應用于批量獲客和資源整合應用。批量獲客包括垂直類電商,如同程旅游和銀行的合作,北京銀行和小米的合作,資源整合應用就比較廣了。
例如,招商銀行與海爾或美的合作,實現快速回流貸款,優化資產負債表。上下游供應商、分銷商的融資難問題。根據供應商和分銷商的交易流水記錄、行業行情狀態、關聯擔保公司經營狀況等;銀行直接替上下游企業付款給海爾。實現對整個產業鏈的提升,產業的升級和轉型。平安銀行通過在線平臺與農產品交易市場對接,把農戶,批發商,零售商和消費者融合起來,通過綜合的大數據分析,把融資,結算,撮合甚至物流結合起來。使得傳統的農業產業實現產業升級,或者說農業的互聯網+的落地。
總結
引用銀之杰李總的話,當前互聯網金融的三大支柱:大數據、征信、超級支付,當然也會有互聯網保險,同時也包括電子簽名,這是所有線上合同合法化的基礎。對于互聯網金融來說,牌照是保護傘,可以保障他們獲得更多的數據源。因此有個征信的牌照真的是超級吃香的。一直很期待中國的征信可以做起來,不過任重而道遠。
Q
A
&
Q:什么是超級支付?
A:這個概念其實也是個宏偉的戰略目標,實現二維碼支付、互聯網pos機、跨O2O概念等,接入互聯網的一切商家,一碼統付。
Q:你做pm主要負責的產品是什么?具體涉及哪些工作
A:我們公司主要是為企業做大數據解決方案,我們公司主要是為企業做大數據解決方案。我這邊主要負責河北公安項目、武漢城商行數據脫敏,還有最近接的動車監控項目。
Q:用戶畫像的這類數據,特別是第三方的數據都是怎么獲取的呢?
A:關于數據獲取,公司這邊我剛入職的時候也是很納悶的,公司這邊的第三方數據主要是通過和對方企業合作來獲取,比如我們公司和電商有合作,和聯通也有合作。所以公司對的企業越多,其實對于我們來說,用戶畫像就會越完整。公安的項目就運用了很多家的數據,畢竟是為了預測犯罪,要監控失足人員庫中人員的很多數據。
Q:用戶信用模型的主要結構是怎樣的?
A:銀行目前為每個用戶建立了一個非常非常非常系統的信用模型。首先信用卡分為A\B\C\D\E五個評級。銀行主要是在申請環節和中間環節進行監控。申請環節的審核包括入學年限審核、是否有穩定工作、身份證+電話+居住地是否一致,民事訴訟公開列表是否出現申請人姓名等。比如你是經常用3G還是wifi,電話打得多還是上網流量用的多,旅游去向,機票航班。黨派身份,家庭成員,孩子在兩歲以下風險較高 五歲~20歲風險度降低 20歲以上、30歲以上風險再次增高尤其注意用父母身份證申辦信用卡。中間環節的信用卡反欺詐判定就比較不合理,具體的我舉幾個例子。網上購物比較多的信用評級在B/C/D之間,網上支付少轉賬多尤為注意(可能為變相套現)這種都是D-。依賴4G網絡評級在C\D,電話>上網評級在B\C,黨派身份評級:民主黨>共產黨>無黨派
Q:銀行怎么看待第三方數據?比如信用卡消費明細。
A:現在銀行已經開始重視這方面數據了,可以分析出各個地區各個分行的用戶消費行為軌跡,當然信用卡消費明細,也用來監控信用評級。消費類別也會影響到評級,超市刷卡消費 交通等消費水平較高可提高信用度。比如:還款日前后有大額還款建議凍結 E,還款日前大額透支 D,長期在一個pos機在很短時間內有小額多筆等額支出套現嫌疑大,建議直接凍結;大額使用在沃爾瑪、宜家刷爆并還上套現嫌疑大等等。
Q:精準營銷是指從過往行為分析可能感興趣的銀行產品嗎?這種模型的開發主要用什么數據回歸?
A:是這樣的,比如說我還沒結婚就不會收到電話向我推薦子女教育方面的理財產品。使用的是弱關聯模型。
Q:批量獲客怎么實現的?
A:主要就是和電商、旅游之類的合作啦。比如剛剛說的和微信合作,在微信上做快速放貸等等。其實理解起來很容易,就是和其他行業合作,來獲取更多的用戶。具體的批量獲客的內容后期會有專門的嘉賓進行分享。
Q:從銀行的應用考慮,可用數據的標準是什么?
A:可用數據就是對結果導向有影響的數據。銀行對數據質量上其實以前存在很多問題,很多時候采集的都是弱關聯的數據。對于數據的有用性,銀行傳統的做法是有一張矩陣表格的表,分項目和屬性值限定,也就是一個指標,和指標的參考范圍。會有專門的部門編制這種白皮書,大家都按這個白皮書來操作。你去申請貸款,信貸員讓你填表格,表格上列的就是這些項目。到信貸審核人員手上的時候,他根據表格上填的屬性值去做判定,分等級歸類。
Q:數據清洗工作是怎么做的?
A:我們首先做市場上存在數據的初篩,然后離線測試。先看場景匹配。匹配率達標就納入業務模型回歸,然后看對結果的關聯性。但是仍然缺乏統一的標準。(匹配率:假設我面對某一個信貸的人群 從某一個第三方數據源獲取數據的成功率,就是匹配率,類似于缺失率。銀行傳統的風控,數據清洗時也是先看變量的缺失率,對于這個用戶群的缺失率。缺失率越大,匹配率越低。)以個貸舉例:一些比較有價值的外部數據都沒有特別成熟的供應商,比如我們想確定一個人的收入,而又不能只依賴銀行提供的流水單。有一個辦法就是找銀行短信服務商。但是短信服務商就有問題,他們的數據不全,這就產生了成熟度的問題。統計模型在銀行里也是一張excel表,分維度來記錄,有的也會填錄在CRM系統和業務系統里面。
Q:請解釋一下評價數據質量的維度:覆蓋率、穩定性、覆蓋周期、質量。
A:看數據質量 傳統的方法都是用歷史數據去篩選 但是對數據的應用銀行應該走得更遠 這點需要更多童鞋來教我,覆蓋率不用多說就是對產品場景人群的匹配。覆蓋周期是說很多數據源只有主體3m、 6m 、12m的數據,那我們評估更多波動和該數據的關聯就會受到影響。質量通常指該項數據包含的內容和我們要評估的關鍵行為的關聯性 比如逾期用戶在黑名單中的匹配率。穩定性是數據的開通、覆蓋、質量等指標的波動。我們在享受創投資金的時候為了找出更好的模型往往需要盡量占有數據,但是業務盈利的要求往往需要在后期選擇最有價值的數據,因此建立一套有效的數據引入標準很重要。
入群辦法
請加PMCAFF互聯網金融圈管理員微信:erhuoyimei
入群規則
1、入群需參與一次群分享(話題內容不限)
2、敲門磚:姓名+公司+可以分享的話題
推薦閱讀
《PMCAFF 2015上半干貨精選》
PMCAFF原創內容,轉載請注明出處
商業使用請聯系PMCAFF
投稿請發送至郵箱:tougao@pmcaff.com
商務合作請聯系:xiaoxi@pmcaff.com
PMCAFF合作媒體:Chinaz
總結
以上是生活随笔為你收集整理的互联网金融售前心得数据脱敏分析 | PMCAFF微分享的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: PMCAFF微分享 | 供应链金融套利套
- 下一篇: PMCAFF《产品经理第一课》第三期开始