日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 人工智能 > ChatGpt >内容正文

ChatGpt

独家 | 大数据与AI技术在金融科技的应用

發布時間:2025/3/21 ChatGpt 30 豆豆
生活随笔 收集整理的這篇文章主要介紹了 独家 | 大数据与AI技术在金融科技的应用 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

獨家 | 大數據與AI技術在金融科技的應用


[導讀]本文選自百融金服CEO張韶峰和CRO季元于2017年9月14日晚在清華大數據“技術·前沿”系列講座——大數據與AI技術在金融科技的應用上的分享。兩位學長結合自己在金融行業和金融科技領域多年的探索,結合金融領域的反欺詐、信用風險識別、不良資產催收、精準營銷等業務場景,深入淺出地闡述對抗生成網絡、遷移學習、強化學習等方法的金融行業建模實踐。

百融金服CEO張韶峰


?百融金服CRO季元


張韶峰:首先非常激動能夠回到母校跟各位校友,還有各位朋友,來分享這次報告。我們進入到金融科技領域是2012年,我們最早跟銀行交流,想推動我們公司用機器學習算法作為模型在銀行應用,銀行那時候習慣運用的算法叫邏輯回歸算法(Logistic regression algorithm),是一種比較簡單的算法。但是我堅定地認為數據有用,至于有什么用,其實想不清楚,只是后來遇到金融行業的大爆發、變革,才發現數據在金融領域的應用那么直接。


金融領域一個非常重要的支柱就是信用體系。中國還有七八億有金融需求的人沒有信用記錄,這是制約中國所謂普惠金融,刺激小微企業發展、消費發展,這是屬于基礎設施的問題。

?

大數據應用分層


?

從大數據行業來看,有些是共通的。


第一步,收集數據。


第二步,數據處理。把數據進行標準化,清洗臟數據、不準的數據,或者做一些脫敏。


第三步,數據降維。如果表格的每一行是一個用戶,一個表的列數多達50萬列,這是非常龐大的一個維度,處理起來會導致效率下降,需要做一些數據的降維,需要做一些衍生變量。


第四步,數據建模。金融里有兩個模型最重要:第一類是營銷獲客模型,預測什么人需要什么樣的金融服務,主要是預測客戶的需求。第二類是風控模型。


第五步,大數據應用。不同的行業做的應用不同。

?

金融行業可以在哪些方面具體使用呢



第一步,解決精準營銷。找好的而且有需求的客戶,這兩個標準要疊加。金融行業的精準營銷難度遠遠超過普通消費品,這是金融行業精準營銷的特殊性。


第二步準入。他如果來申請你的貸款,或者買你的保險,你能不能把他放進來?你得審批一次。比如你去銀行辦個貸款,或者辦一個信用卡,讓你填一大堆資料。


第三步,存量客戶的經營或者貸中管理。


第四步逾期。這是貸后管理。


從營銷、準入、經營、逾期,這四步每一步都可以充分使用大數據和人工智能算法來提升效率。



我們完善了一套反欺詐引擎評分,評估你有多大概率會欺詐。規則是遇到什么情況要采取什么措施。模型是抽像出決策邏輯以及跟欺詐相關的數據。

?


我們為金融機構提供定制化的服務,因為你的產品和你的客戶跟別的金融機構不可能一模一樣。我們的模型可以有差異化,數據的準備、初步篩選、交驗檢驗,篩選相關性比較高的變量、數據的分段,最后建立模型。



我們用一些可視化的算法使金融機構和我們監管人員看得更清楚,規則有沒有命中,客群分布怎么樣。在客觀的分數段中,比如我們公司是300分到1000分,比如700分的人對應100個人里只有3個人違約,而500分的人對應100個人里頭有7個人違約,不同的分數段意味著不同的違約率,這個時候你就知道我應該給700分以上的放貸。這個評分對金融機構很重要,你算清楚每給500分的人放款一萬塊錢出去會虧多少錢,評分系統會幫你預測。


隨后,百融金服CRO季元先生與大家分享了具體的應用案例。


案例一:圖深度學習應用于團伙欺詐偵測


季元:百融在群體欺詐的跟蹤、反欺詐方面主要通過無監督-異常行為監測,還有通過監督學習-地理位置異常分析(Geohash)

,具體的實現方式是通過圖特征學習算法。


這是圖特征學習算法大概的框架。因為我們輸入的是我們客戶圖的特征,這張圖包括邊和點,圖的拓譜和節點的這些屬性構造了客戶的基本特征。通過深度神經網絡,從這些基本特征出發衍生出更復雜的特征。最終我們輸出的是什么?一個是衍生后的特征,再一個是觀察,觀察為了從基礎端衍生數學特征,把這個算法形成好東西移植到其他部分。


左邊這個表是我們常用的一些特征算子。這個圖反映了某個局部的具體的階段,百融從DI特征出發通過Faier做衍生,衍生出新的特征。這個算法其實有四個優點:


第一它支持不同的屬性圖,因為通常我們的圖只是節點和邊,只能反映拓撲結構;


第二它能輸出復雜關系函數用于跨網絡遷移學習;


第三它能夠學習出稀疏特征。


第四它支持并行,算法效率高。

?

這是我們某個客戶在2017年1月到5月份的用戶申請數據,申請次數34萬,用戶數4.7萬,總共70個特征。通過我們的算法識別出了它有12000多欺詐用戶,隸屬于238個團體。

?

案例二:強化學習應用于催收模型構建



在你借了金融機構的錢之后,如果你一旦逾期不還錢,這個時候金融機構在內部是按照你逾期的時間給你劃分的,M1代表逾期一個月,M2是兩個月,在不同的逾期時間,它會給你不同的催收動作。


我們應該從序列的觀點看,因為不同的人對不同動作的響應是不一樣的。實際上你每一步的動作都會影響到后續的結果,應該以整個過程的最大的回饋,來決定我們在什么環節采取什么樣的動作。這塊我們就把催收過程定義成一個馬爾科夫決策過程。


通過強化學習來求解馬爾科夫決策過程。首先要定一個價格函數,其次就是你在不同時間段收回的錢,用折現因子折算到當前來看你的最大值,我們要求價值函數的最優點,這個算法是通過價值迭代來實現。

?

案例三:遷移學習應用于客群評分構建


我們的信用評分體系包括一個通用評分加上6個客群評分,通用評分類似于芝麻評分。這個評分在金融機構是怎么用的呢?我們可以看到這個圖,柱狀圖表示不同分數段人數的占比,線圖是不同分數段人數的的違約率,我們看到最低的300分數段違約率達到20%以上,最高的700分以上的不到1%。所以一個金融機構如果選擇了500分以上的人,那么就意味著500分左邊的這些人他都要拒絕掉,而且如果只要500分以上的人的不良率在8%以下,如果他想降低不良率,比如降低4%,那就意味著他要提高準入標準,可能把準入的門檻提高到600或者更高。

?


這是我們的6個客群評分,這個評分實際上對金融機構來講非常重要,因為大家希望我們把壞人全過濾掉,好人全放進來,這是不可能實現的。現實中我們的評分通常居于兩者之間,我們的目標是盡可能的靠近最好的那個部分。除了這7個標準評分之外我們還有定制產品,剛才邵峰介紹的給客戶做定制化的建模,因為好的客戶希望結合他的內部數據和我們百融數據一起構建一個專屬于他的評分,這樣效果會比標準評分更好。

?

在信用評分構建的過程中存在一些現實問題,在講這些問題之前我先給大家簡單介紹一下什么叫遷移學習。兩個基本概念:


第一個,域實際上包括兩個元素,X是特征區間,這些變量的維度, P(X)是特征空間上的概率分布,實際上是我們的樣本和這些特征的分布。


第二個任務,任務包括一個標簽空間,是在樣本特征空間上好或者壞甚至更多的內容,屬于監督學習的一部分。


我們知道域和標簽空間來求這個條件概率。

?

在遷移學習里面需要兩個域和目標,一個是源域和源任務,一個是目標域和目標任務。按照剛才定義我們現在有四種情況:


第一,源域的特征空間和目標域的特征空間不同;


第二,邊際概率分布不同;


第三,標簽空間不同;


第四,條件概率不同。


這四種組合起來就是16個,但是現實生活中這16種組合不會都存在。包括比較典型的就是這三類:


第一種是線上客群和線下客群,它們的特點不一樣,因為線上客群我們能采集的特征的維度更多;


第二種是同產品不同機構的客群,主要體現在邊際概率分布和條件概率分布;


第三種是同機構不同產品的客群,主要是特征空間和條件概率不一樣。


我們建模過程中碰到的比較現實的問題,有些客戶不會告訴你標簽空間,那這種情況下怎么建模?


第一步,通過域適應算法對源目標域的特征進行降維處理。


第二步,構造邊際分布實驗。構造一個函數來刻畫源域和目標域的邊際分布的差異,度量兩個概率分布的差到底有多大。


第三步,策劃條件分布實驗。識別源任務的條件概率和目標任務的條件概率的差。


第四步,基于前兩步構造目標函數做優化。


第五步,進行迭代運算。

?

案例四:知識圖譜應用于貸前反欺詐


知識圖譜本質上是一個語義網絡,在人工智能里一直有兩個流派,一個叫連接主義,我們第一個案例里面講的深度神經網絡屬于連接主義,它是模擬人腦的硬件結構,本質上是統計學。第二個流派叫符號主義,知識圖譜就歸屬于符號主義,它模擬的是人腦的推理方式,實際上是人腦軟件。這兩種流派實際上一直并行,上世紀五六十年代人工智能剛興起的時候是符號主義領先,近年來隨著計算能力的提升,連接主義開始突起。


知識圖譜相當于你要把人的經驗做知識表示和推理,所以你要把經驗固化成知識圖譜,通過這些語義的運算來做反欺詐判斷。我們通常把推理分為:不一致性驗證;機構異常分析。


未知性的驗證,比方說兩個人用的是同一個單位電話,但是寫的單位名稱和單位地址不一樣,根據我們經驗這不符合邏輯,通過知識圖譜能把這種欺詐方式識別出來。


靜態分析像我們第一個案例里面講的結構。動態分析,通常情況下人的行為特征應該是穩定的,如果你短時間變化快的話,那我們認為你也有欺詐嫌疑。?


以上是我分享的主要內容,謝謝大家。? ?

總結

以上是生活随笔為你收集整理的独家 | 大数据与AI技术在金融科技的应用的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 亚洲国产日韩欧美一区二区三区 | 小泽玛丽亚在线观看 | 成人动漫在线观看视频 | 仙踪林av| 中文字幕精品久久久 | 草久在线观看 | 午夜福利一区二区三区 | 成人一级生活片 | 波多野结衣一区二区三区高清av | 最近日韩中文字幕 | 久色精品| 性日本xxx| 国产又色又爽无遮挡免费 | 椎名空在线 | 亚洲九九色 | 2025中文字幕 | 日本激情免费 | 成人永久免费 | 亚洲第一黄色网址 | 午夜av一区二区三区 | 找av导航 | 国产伦精品一区二区三区精品 | 国产又粗又长又爽 | 最新在线视频 | 精品五月天 | 久久精品性爱视频 | 在线观看黄色国产 | 精品人妻aV中文字幕乱码色欲 | 免费国产视频 | 女av在线 | 国产一级黄色大片 | 日本人添下边视频免费 | 国产亚洲激情 | 国产高潮流白浆喷水视频 | 国产二区视频在线观看 | 91网站在线免费观看 | 久久久久久国 | 亚洲人成人无码网www国产 | 好吊妞一区二区三区 | 中文字幕乱码人妻一区二区三区 | 成人黄色片免费看 | 97干干| 久久99精品国产.久久久久久 | 精品无码国产一区二区三区51安 | 午夜影院福利 | 三级欧美视频 | 在线免费观看黄色网址 | 免费黄网站在线 | 欧美18一20男同69gay | 大奶一区 | 久久99精品久久只有精品 | 激情久久免费视频 | 亚洲综合日韩 | 精品h视频 | 三上悠亚久久 | 黑森林福利视频导航 | 国模私拍在线观看 | 欧美日韩一区二区三区四区五区 | 中文字幕在线亚洲 | 亚洲爽爽网 | 欧美日韩四区 | 国产成人精品一区二区三区网站观看 | 黄色大网站 | 青青在线 | 日本免费不卡 | 黄色av免费在线播放 | 麻豆av免费在线观看 | 综合色亚洲 | 国产拍拍视频 | 天天色图片 | 美女尻逼视频 | 日韩一区二区三区av | 亚洲午夜精品一区二区三区 | 欧美日韩国产网站 | 免费人妻一区二区三区 | 国产美女久久 | 黄色av免费在线观看 | 波多野吉衣一区 | www.brazzers.com| 精品中文字幕在线 | 日韩一级影视 | 色戒av| 天堂av2018 | 中文字幕日韩人妻在线视频 | 久久偷看各类wc女厕嘘嘘偷窃 | 天天碰天天碰 | 青娱乐国产在线视频 | 国产男女无遮挡猛进猛出 | 91porny九色 | 国产强伦人妻毛片 | 欧洲成人午夜精品无码区久久 | 婷婷成人综合网 | 中文字幕在线观看欧美 | 亚洲精品网站在线 | 国产在线视频资源 | 色视频国产 | 伊人91 | 亚洲爽片 | 蘑菇福利视频一区播放 |