【干货下载】大数据分析——如何消除金融不确定性
本文整理自桑文鋒在消費金融沙龍上的精彩分享,演講主題是《大數(shù)據(jù)分析——如何消除金融不確定性》。
“信息是用來消除不確定性的東西?!薄戕r(nóng)《信息論》
“大數(shù)據(jù)的本質(zhì),就是通過信息消除不確定性?!薄獏擒姟豆韫戎i》
桑文鋒非常認同這兩點,引入更多的信息,可以消除更多的不確定性,這就是為什么信息是重要的。顯然大數(shù)據(jù)是更多的信息,在數(shù)據(jù)處理上可以在業(yè)務中起到更多作用。
數(shù)據(jù)到底能做什么?一點是數(shù)據(jù)驅(qū)動決策,另一點是數(shù)據(jù)驅(qū)動人工智能。
數(shù)據(jù)驅(qū)動決策主要是 BI 方面,不論是做產(chǎn)品改進、營銷、運營監(jiān)控、商業(yè)決策,都是通過收集更多的數(shù)據(jù),讓決策變得更加有效,而非拍腦袋憑感覺。
數(shù)據(jù)驅(qū)動產(chǎn)品智能方面更多體現(xiàn)數(shù)據(jù)價值,驅(qū)動決策只能發(fā)揮 20% 的價值?;跀?shù)據(jù)改進產(chǎn)品,數(shù)據(jù)的價值遠遠大于幾張報表。驅(qū)動產(chǎn)品智能更多稱為 AI 人工智能,智能就是在數(shù)據(jù)的基礎上,通過一些策略算法,例如深度學習,得出結(jié)果,把結(jié)果回歸到產(chǎn)品里,產(chǎn)品本身具有學習能力就是一種智能。
數(shù)據(jù)處理的第一步是數(shù)據(jù)采集;第二步是數(shù)據(jù)建模,整合數(shù)據(jù)模型;第三步是通過數(shù)據(jù)模型做數(shù)據(jù)分析;最后一步是做指標。
數(shù)據(jù)采集原則
數(shù)據(jù)采集離不開數(shù)據(jù)源,這是桑文鋒八年百度構(gòu)建數(shù)據(jù)平臺的經(jīng)驗之談。數(shù)據(jù)分析出問題,往往是數(shù)據(jù)本身收集不夠好,基于如此的基礎上建高臺,肯定是不穩(wěn)定的?;陔S心所欲的需求出業(yè)務報表,就會發(fā)現(xiàn)日后的想法沒有數(shù)據(jù)支撐。如何把數(shù)據(jù)源整好?原則就是大、全、細、時。
大”強調(diào)宏觀的“大”,而非物理的“大”。大數(shù)據(jù)不是一味追求數(shù)據(jù)量的“大”,比如每天各地級市的蘋果價格數(shù)據(jù)統(tǒng)計只有2MB,但基于此研發(fā)出一款蘋果智能調(diào)度系統(tǒng),就是一個大數(shù)據(jù)應用;
?“全”強調(diào)多種數(shù)據(jù)源。大數(shù)據(jù)采集講求全量,而不是抽樣。除了采集客戶端數(shù)據(jù),還需采集服務端日志、業(yè)務數(shù)據(jù)庫,以及第三方服務等數(shù)據(jù),全面覆蓋。
“細”強調(diào)多維度數(shù)據(jù)采集,即把事件的維度、屬性、字段等都進行采集。如電商行業(yè)“加入購物車”的事件,除了采集用戶的 click 數(shù)據(jù),還應采集用戶點擊的是哪個商品、對應的商戶等數(shù)據(jù),方便后續(xù)交叉分析。
“時”強調(diào)數(shù)據(jù)的時效性。顯然,具有時效性的數(shù)據(jù)才有參考價值。
數(shù)據(jù)采集方式
數(shù)據(jù)采集方式共有三種:第一類是通過界面配置采集的可視化埋點;第二類是通過前端和后端將核心邏輯的數(shù)據(jù)信息、維度信息記錄下來的代碼埋點;第三類是人工審核數(shù)據(jù),實時、批量引入的輔助工具導入。
數(shù)據(jù)建模階段,許多人對數(shù)據(jù)分析存在一個很嚴重的錯誤理解:將數(shù)據(jù)庫當成數(shù)據(jù)倉庫使用。這將導致三個問題。
業(yè)務人員難以理解,無法直接使用復雜的數(shù)據(jù)庫,或者業(yè)務數(shù)據(jù)經(jīng)常改變,達不到人人皆可用數(shù)據(jù)的狀態(tài),效率降低。
常規(guī)數(shù)據(jù)庫性能降低。常規(guī)數(shù)據(jù)庫無法很好地支持大批量數(shù)據(jù)或長時間跨度數(shù)據(jù)分析。
數(shù)據(jù)不全,無法靈活組合做分析。
針對用戶的運營情況,我們有不同的模型進行專業(yè)分析,如用戶分群、漏斗分析、留存分析等。之所以可以做到專業(yè)化、標準化,是因為前期數(shù)據(jù)基礎采集與建模工作的專業(yè),使數(shù)據(jù)分析工作變得容易。
把業(yè)務常關注的東西指標化,是數(shù)據(jù)分析的正確思想。金融行業(yè)天然跟數(shù)據(jù)打交道,在獲取信息的過程中,大家需要圍繞業(yè)務建立指標體系,如獲客渠道、用戶激活情況、復投復購率、交易數(shù)據(jù)、引薦獎勵等,這些指標也都體現(xiàn)在了 AARRR 模型中。
案例一 渠道優(yōu)化
金融類產(chǎn)品的獲客成本還是相對較高的,渠道分析非常重要。以互金行業(yè)融 360 為例,融 360 作為一個連接貸款機構(gòu)的中間平臺,肩負橋梁作用,貸款機構(gòu)的許多數(shù)據(jù)不能做到實時交互。如果廣告推廣只能跟蹤到點擊行為,無法跟蹤轉(zhuǎn)化與消費,就會缺失核心數(shù)據(jù),所以要進行渠道分析。
如上圖,將用戶的價值數(shù)據(jù)打通,為公司提供可以全景觀察的數(shù)據(jù),在渠道分析層面,市場部門通過對效果轉(zhuǎn)化的分析來判斷廣告取舍,從而讓每一分錢都花的更有價值。
案例二 產(chǎn)品優(yōu)化
互聯(lián)網(wǎng)金融產(chǎn)品業(yè)務復雜,產(chǎn)品更需優(yōu)化。舉個例子,某產(chǎn)品有一個拉新的理財項目,新人第一次使用返利 9.9%,很多人在使用過程中發(fā)生了獲取驗證碼失敗的問題,用戶只能流失,并且還容易損傷產(chǎn)品口碑。這個例子充分說明了拉新容易留存難的事實。細致監(jiān)控用戶注冊、轉(zhuǎn)化、激活過程,優(yōu)化產(chǎn)品功能,讓用戶體驗到產(chǎn)品的優(yōu)勢,有助于用戶留存。
案例三 用戶流失
用戶流失率是每個產(chǎn)品的核心指標之一。每一個用戶都是企業(yè)花錢“買”來的,拉新成本非常高,企業(yè)更希望用戶在自建平臺上持續(xù)活躍,而非每次都要通過廣告跳轉(zhuǎn)過來。這也是自建平臺的核心價值之一:為用戶提供落地頁,減少營銷成本。甚至我們還希望用戶引薦身邊的人,進一步降低獲客成本。對用戶進行詳細的留存分析和流失分析,可以及時找到運營問題環(huán)節(jié),對用戶“查漏補缺”。
優(yōu)質(zhì)運營的本質(zhì)是不斷細分,針對不同的用戶使用不同的策略。最極端的案例就是個性化運營,每一個人都擁有定制版本。傳統(tǒng)銀行業(yè)務通常采用這種方式,但是互聯(lián)網(wǎng)用戶過多,所以需要用有限的設備和工具做精細化運營。
神策數(shù)據(jù)的產(chǎn)品神策分析有三個特點:
私有化部署,幫助金融產(chǎn)品保障數(shù)據(jù)源頭安全。
基礎數(shù)據(jù)采集與建模,為客戶梳理搭建數(shù)據(jù)基礎。
PaaS 平臺深度開發(fā),幫助金融產(chǎn)品對接自有的系統(tǒng)。
總結(jié)
以上是生活随笔為你收集整理的【干货下载】大数据分析——如何消除金融不确定性的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【干货下载】金融大数据专场沙龙内容分享
- 下一篇: 转化与流量到底哪一个更重要?