译:Dataiku 白皮书之《在银行和保险行业应用数据科学》
Data Science For Banking?& Insurance
如果不能正常訪問,請點擊備份獲取。
互聯(lián)網(wǎng)巨頭和金融技術(shù)創(chuàng)業(yè)時代的求生和發(fā)展
介紹
在數(shù)個世紀的進程中,銀行和保險行業(yè)開發(fā)出的程序、產(chǎn)品和基礎(chǔ)設(shè)施,塑造了整個人類的經(jīng)濟史。
但是現(xiàn)在,他們正面臨著消亡的威脅,而挑戰(zhàn)者們出現(xiàn)在世界舞臺上只是幾十年的事,甚至其中幾個就出現(xiàn)在短短幾年前。盡管如此,卻正是這些后來者正在重新制定金融服務(wù)的行業(yè)規(guī)則。這些挑戰(zhàn)者包括像 Google、亞馬遜、Facebook、蘋果、百度和阿里巴巴這樣的互聯(lián)網(wǎng)時代巨頭;也包括像 Credit Karma、Lending Club、Square、Lemonade、TransferWise 和 GoFundMe 這樣靈活的創(chuàng)業(yè)公司;甚至,通過物聯(lián)網(wǎng),還可能包括看起來完全不可能成為競爭對手的消費品和工業(yè)產(chǎn)品制造商。
銀行和保險公司可以通過加快數(shù)字化進程這條途徑進行反擊,并采用新手所在行業(yè)的工具日益完善——即數(shù)據(jù)科學(xué)、大數(shù)據(jù)和算法。與此同時,他們還應(yīng)該最大限度地利用其獨特的資產(chǎn),包括諸如擁有在數(shù)學(xué)和統(tǒng)計方面頗受歡迎的專家、許多數(shù)據(jù)科學(xué)探索中嚴重缺乏的深度專題知識、一個龐大的源源不斷的客戶數(shù)據(jù)資源池,以及由分支機構(gòu)和營業(yè)廳組成實體網(wǎng)絡(luò),這在追求有意義、多渠道和多感知的客戶體驗時可提供人員上的優(yōu)勢。
然而,能否成功取決于傳統(tǒng)銀行和保險公司對這些新挑戰(zhàn)者的回應(yīng)速度,回應(yīng)體現(xiàn)在對其具有競爭力的資產(chǎn)進行巧妙利用以及組織合適的人員、數(shù)據(jù)、工具和流程從而完成任務(wù)。
第一部分:威脅
90 年代的挑戰(zhàn):進化或毀滅
在 1995 年一場具有預(yù)見性的演講中,當(dāng)時即將出任美國銀行 CEO 的 Hugh L. McColl Jr.,激勵銀行監(jiān)管機構(gòu)的成員要適應(yīng)新生的互聯(lián)網(wǎng)時代,否則將會走向滅亡:
“正如每個學(xué)生都知道的那樣,恐龍在冰河時代沒有幸存下來……不是因為恐龍無法進化。只是它們沒有時間進化。與恐龍不同,銀行家可以預(yù)見未來的變化。在這件事上,我們有所選擇。這是恐龍所不曾有的。”
——Hugh L. McColl Jr
包括銀行和保險公司在內(nèi)的金融服務(wù)行業(yè),大部分都注意到了這條警告,并在接下來的 20 年里開始適應(yīng)從傳統(tǒng)系統(tǒng)和紙張流程到新數(shù)字時代的轉(zhuǎn)變。
這是一個艱難的過程,但也逐漸開始獲得回報,包括運行效率、新的便捷性以及對客戶的價值。然而,2007-2008 年的全球金融危機減慢了這一數(shù)字化轉(zhuǎn)型,因為金融機構(gòu)需要重新分配資源以恢復(fù)損失并適應(yīng)更嚴格的監(jiān)管環(huán)境。
新的挑戰(zhàn):GAFA、FINTECH、以及物聯(lián)網(wǎng)
GAFA 巨頭進入金融服務(wù)行業(yè)
如今,在 2016 年,銀行和保險行業(yè)基本上已從經(jīng)濟危機中恢復(fù)過來,它們發(fā)現(xiàn)自己正在面臨互聯(lián)網(wǎng)時代誕生的新的挑戰(zhàn)。首先,也是最重要的,數(shù)字時代的巨頭,如西方市場的谷歌、蘋果、Facebook 和亞馬遜(即 GAFA),以及東方市場來自中國的超級公司百度、阿里巴巴、騰訊和小米(即 BATX),開始直接進入銀行和保險市場。
特別是,GAFA 及其海外的同行已經(jīng)開始逐步試水,提供服務(wù)包括在線和移動支付、匯款、個人借貸、賬戶和儲蓄管理、點對點貸款(眾籌)、保險和貨幣交易。
然而截止到目前,對 GAFA 而言結(jié)果卻喜憂參半,因為 BATX 玩家在市場滲透方面占據(jù)了領(lǐng)先地位。美國的大型科技企業(yè)已經(jīng)表示出堅定的承諾,會增加其在金融服務(wù)領(lǐng)域的業(yè)務(wù)。這可以在 Financial Innovation Now 這樣的倡議中看出,一個包括亞馬遜、蘋果、谷歌、Intuit 和 PayPal 的技術(shù)領(lǐng)袖聯(lián)盟,正致力于“使消費者和企業(yè)管理錢款和進行交易的方式更加現(xiàn)代化“,并倡導(dǎo)能夠更好地支持”金融服務(wù)領(lǐng)域的新市場創(chuàng)新者“的監(jiān)管政策。
它們也在這塊新興市場投資金融技術(shù)(fintech)創(chuàng)業(yè)公司。這些創(chuàng)業(yè)公司,像其支持者 GAFA 巨頭一樣,會選擇交易量大的金融服務(wù)切入,并為在線和移動世界量身打造這些服務(wù)。
FINTECH 的崛起
隨著投資資本在 2015 年達到 223 億美元(較 2014 年增長75%),fintech 正在加大力度大范圍地開展銀行服務(wù),包括虛擬銀行、 個人和小額商業(yè)貸款、 財務(wù)咨詢和融資中介、信用評級、貨幣交易和匯款、股權(quán)眾籌、支付處理等。
雖然這些 fintech 公司開始是(現(xiàn)在仍然是)傳統(tǒng)銀行的顛覆性挑戰(zhàn)者,但銀行已開始通過合作、收購和投資的方式進行反擊(2010 年銀行機構(gòu)占 Fintech 總投資資本的 38%,并在 2015 年增長到 44%)。
對于保險市場而言,又是另外一番景象。Google 和 Amazon 對保險的直接介入非常有限,另外目前市場出現(xiàn)的對 Fintech(或“insurtech”)的投資相對較低,盡管這種局面正在改變并且創(chuàng)新性保險公司的數(shù)量在不斷增加。
例如,目前有很多端到端型業(yè)務(wù)保險公司,比如 Friendsurance、Lemonade、InsPeer 和 InShared。其中,Friendsurance 是最早創(chuàng)立也是發(fā)展得最好的一家,它建立在社交媒體大數(shù)據(jù)基礎(chǔ)設(shè)施之上,用戶能夠建立一個既真實又虛擬的朋友圈來分攤小額索賠和免賠額的成本,而大額索賠業(yè)務(wù)則由傳統(tǒng)保險公司覆蓋。另一個發(fā)展中的初創(chuàng)企業(yè) Teambrella,通過使用比特幣競價來達成端到端服務(wù),從而使保險“公平透明”。它的運行機制為:“團隊”中的每個成員將資金存入特殊的個人比特幣錢包中,只在提交申請的成員和 3/8 的半隨機選擇成員共同簽署后,才能完成相互報銷。
其他創(chuàng)新性的保險服務(wù)包括特定項目或事件的保險,以及按需保險。例如,Trōv 提供了一款稱之為“智能保險”的業(yè)務(wù),允許人們在任何時間對任何事物進行投保,而且保險期限任意——這完全由移動應(yīng)用程序?qū)崿F(xiàn)。具體來說,應(yīng)用程序會收集有關(guān)客戶財產(chǎn)的數(shù)據(jù),并為單個項目所覆蓋范圍提供經(jīng)機器學(xué)習(xí)加強的風(fēng)險定價,該保險可以設(shè)置任意保險期(低至秒)和保險費(低至便士),最終由聊天機器人處理索賠。據(jù) Trōv 的 CEO 及創(chuàng)始人 Scott Walchek 所說,其結(jié)果是一種極致的客戶體驗:
“如今的保險受冗余的流程和表格所拖累,通常需要與人直接交談。 通過將整個流程轉(zhuǎn)移到我們正在研制的手機上,使得其變得和在亞馬遜下單時的一次單擊一樣簡單。不僅如此,報銷和退換貨索賠可以像短信收發(fā)一樣簡單,在幾分鐘內(nèi)即可完成,而不需要數(shù)天或數(shù)周。“
? —— Scott Walchek, Trōv 的 CEO 及創(chuàng)始人
盡管存在這種保險技術(shù)革新浪潮,但可以說,保險行業(yè)面臨的更為直接的挑戰(zhàn)正在物聯(lián)網(wǎng)中逐漸形成,而且其也正在侵占銀行業(yè)務(wù)。
信息互聯(lián)網(wǎng):在你和你的客戶之間
在物聯(lián)網(wǎng)(IoT)中存在著數(shù)十億個傳感器,計算機處理器和通訊設(shè)備正在被嵌入或附著到每一種可想到的常見“物體” ——人體(通過可穿戴產(chǎn)品)、手機、網(wǎng)球鞋、水管、葡萄藤、牛、烤面包機、路燈等等,它們會在移動網(wǎng)絡(luò)和互聯(lián)網(wǎng)上共享數(shù)據(jù)。到 2020 年將會有高達 300 億已連接的智能設(shè)備為人類提供服務(wù)(不包括最普遍的“智能”設(shè)備:智能手機),這無疑是一場革命。
盡管收集到的數(shù)據(jù)類型及其用途是廣泛和高度多樣化的,不過其功能角色主要還是遠距離監(jiān)控、分析及控制(比如自動駕駛汽車和家庭病人護理)。
目前,像制造、醫(yī)療、零售和安全等行業(yè)在物聯(lián)網(wǎng)市場處于領(lǐng)先地位,而金融服務(wù)也已經(jīng)準備好迎接由物聯(lián)網(wǎng)革命帶來的轉(zhuǎn)型。例如,制造消費品和工業(yè)產(chǎn)品的公司正在試圖為其智能且聯(lián)網(wǎng)的產(chǎn)品搭載服務(wù),這可以幫助他們進行實時監(jiān)控和控制。
這些服務(wù)包括預(yù)測建議,如遠程診斷、維修以及主動維護,而在非常規(guī)領(lǐng)域利潤也有增長,像保險(產(chǎn)品本身或其監(jiān)控的環(huán)境,如作物或生產(chǎn)線)以及目前級別相對低一點的,根據(jù)設(shè)備使用情況的數(shù)據(jù)提供貸款、租賃或采購。例如,遠程信息處理技術(shù)使得勞斯萊斯、通用電氣和普惠公司等制造商能夠繞過傳統(tǒng)的融資、租賃流程和提供商,按飛行小時(并綁定主動維護服務(wù))將飛機發(fā)動機租給航空公司。
意識到物聯(lián)網(wǎng)的市場機會,GAFA 也開始在這個領(lǐng)域積極投資。Google 的資本主要流入四個垂直領(lǐng)域,包括智能家居、可穿戴設(shè)備(如智能手表)、汽車(聯(lián)網(wǎng)的汽車)和機器人。而在其中一個垂直領(lǐng)域,Google 就出資超過 30 億美元收購了一家公司——智能溫控器制造商 Nest Labs 。新興一代的汽車、房屋和人壽保險產(chǎn)品,基于對行為數(shù)據(jù)的實時監(jiān)控、收集和分析,而智能家居、可穿戴設(shè)備和智能汽車市場則都是其基礎(chǔ)環(huán)節(jié)。
目前還不能確定 Google 會通過這些領(lǐng)域直接進入保險市場,還是簡單的通過豐富的新數(shù)據(jù)流獲利,包括在保險公司和消費者之間扮演中介的角色,正如其現(xiàn)在與 Nest 的保險合作伙伴之間的關(guān)系。
目前,蘋果也開始以中介模式來運作,例如與 Evrythng 合作進入房屋保險行業(yè),后者是智能家居產(chǎn)品的 IoT 平臺制造商。此類辦法對亞馬遜似乎也是可行的,其“Dash”按鈕從一觸即下達命令的設(shè)備演變成用于管理智能家居功能的控制器。
然而,保險公司并不是只與 GAFA 及其合作伙伴或所收購公司合作。他們也直接與 Water Hero 和 Gem 等初創(chuàng)設(shè)備制造商進行合作。這兩家公司生產(chǎn)的設(shè)備能夠持續(xù)監(jiān)測家用水管和水流。
當(dāng)檢測到異常時,它們會即時警報,而 Water Hero 還支持自動關(guān)閉水流。大約三分之一的家庭索賠與漏水有關(guān),這種技術(shù)的吸引力對保險公司是顯而易見的。
不過問題仍然存在,誰將擁有客戶關(guān)系? 為接近客戶,這場競賽正在進行,同時也對銀行業(yè)形成挑戰(zhàn)。迄今為止,用到物聯(lián)網(wǎng)的銀行業(yè)務(wù),大部分都要涉及使用智能手機技術(shù)進行認證和定位,以及內(nèi)部或運營的用途如監(jiān)控庫存和營業(yè)廳或分支機構(gòu),也是如此。然而,目前還是在由 Fintech 公司引導(dǎo)大部分銀行開發(fā)以智能手機為中心的 IoT 技術(shù),以支持創(chuàng)新的面向客戶的移動銀行和支付交易體驗,這些正在去中介化但尚未取代銀行。
如果銀行和保險公司想要保護自身免受物聯(lián)網(wǎng)帶來的去中介化或?qū)诵姆?wù)的直接侵入,他們需要更好地利用物聯(lián)網(wǎng)技術(shù)來推動創(chuàng)新,并且需要適應(yīng)在物聯(lián)網(wǎng)和非物聯(lián)網(wǎng)領(lǐng)域給予新競爭對手優(yōu)勢的工具:大數(shù)據(jù)和算法。
GAFA/FINTECH 的優(yōu)勢:大數(shù)據(jù)和算法
作為互聯(lián)網(wǎng)時代誕生的純數(shù)字玩家,GAFA 和 Fintech 公司的經(jīng)濟資本都是基于大數(shù)據(jù)應(yīng)用通過智能算法獲取巨大優(yōu)勢。
對于 GAFA,他們收集了大量數(shù)據(jù),并將算法應(yīng)用于這些數(shù)據(jù),以針對個體級別生成實時內(nèi)容、服務(wù)、建議和廣告,這個近乎神奇的“單人市場”促進形成了當(dāng)今強勢且苛刻的客戶。一個很好的例子就是,亞馬遜使用大數(shù)據(jù)挖掘和預(yù)測分析來提供個性化的購買建議。
Fintech 公司也做了同樣的工作,使用大量不符合 GAFA 的數(shù)據(jù),但包括從 GAFA 和非 GAFA 大數(shù)據(jù)生產(chǎn)者(如政府機構(gòu)和氣象服務(wù))獲取的數(shù)據(jù)集。而且,像 GAFA 一樣,Fintech 公司通過創(chuàng)新性地使用大數(shù)據(jù)技術(shù)、數(shù)字/移動優(yōu)先策略、基于算法的數(shù)據(jù)挖掘和預(yù)測分析,實現(xiàn)了引人注目的個性化體驗。
使用非傳統(tǒng)數(shù)據(jù)實現(xiàn)非凡結(jié)果
例如,處于融資環(huán)節(jié)的 Fintech 初創(chuàng)公司(以及 BATX 公司)正在使用算法和非傳統(tǒng)數(shù)據(jù)來源(例如社交媒體活動和手機使用情況),來更加快速準確地評估身份、欺詐風(fēng)險和信用價值,以及自動化承保和貸款發(fā)放流程。
除了能夠更加便捷、更加經(jīng)濟、更加準確地為客戶提供服務(wù),這種多樣化的大數(shù)據(jù)加上高級算法的方式也在幫助這些公司擴大市場。他們通過為年輕或尚未被開發(fā)的人群提供服務(wù)來實現(xiàn)這一目的,這些人幾乎沒有信用記錄,而其人數(shù)總量全球估值在 25 億以上。
通過尚未被開發(fā)的人群提高市場份額
正如對 fintech 通過大數(shù)據(jù)和算法(“大數(shù)據(jù)和線上評分:Fintech 及其他領(lǐng)域”)進行創(chuàng)新的描述,尋求貸款的人可以安裝 InVenture 的移動應(yīng)用程序,然后跟蹤他們?nèi)绾问褂檬謾C,而該使用情況會提供一個有效的新型風(fēng)險評估方法。
例如,根據(jù) InVenture 收集和分析的歷史數(shù)據(jù),發(fā)送太多短信或經(jīng)常性的電池電量低可能是申請人信用有風(fēng)險的一個跡象,而晚上打電話較多或使用賭博網(wǎng)站的人卻往往(令人驚訝地)更值得信賴。
通過機器學(xué)習(xí)獲得突破性的效率
在第一步將基于紙張的申請流程數(shù)字化之后,機器學(xué)習(xí)組件也被開發(fā)出來用以自動化承保的工作流程。這些組件包括一個模糊邏輯規(guī)則引擎用于對承保人準則進行編碼、一種演進算法用于隨著準則和數(shù)據(jù)的發(fā)展優(yōu)化引擎的性能,以及一種自然語言解析器用于限制承保人審查所需的自由文本量。該系統(tǒng)在 19% 的應(yīng)用程序上實現(xiàn)了完全自動化承保,并提供了預(yù)處理,可以幫助承包人從人力審查中抽身出來將重點放在應(yīng)用程序最能夠獲益的地方。它還支持開發(fā)基于 Web 的客戶自助服務(wù)應(yīng)用程序。
Genworth 成功地在其早期投入到基于算法的承保中,部分原因是系統(tǒng)設(shè)計人員在一系列中間步驟中實施了解決方案,以便精算師和承保人可以用新的方法構(gòu)建必要的“舒適度”。這是一個很好的榜樣。這對任何基于算法的自動化系統(tǒng)都是有幫助的,可為專業(yè)人員提供他們需要的時間和工具,從而了解并獲得對其工作原理以及決策方式的信心。不管如何,至少顯而易見的是,盡快擁抱對算法和大數(shù)據(jù)源的應(yīng)用勢在必行。
除了改變,別無選擇
如果傳統(tǒng)的銀行和保險公司不能夠快速采取行動,那么他們將會面臨失去擴大市場的機會的風(fēng)險,這是毋庸置疑的。更糟糕的是,這些風(fēng)險,往小了說,會使其淪為“金融服務(wù)新市場開拓者”的交易基礎(chǔ)設(shè)施,往大了說,將令他們遍體鱗傷而經(jīng)受死亡的威脅,因為其盈利的業(yè)務(wù)線會逐漸被蠶食。
這些公司需要立即做出改變,Fintech 風(fēng)險資本家 Mircea Mihaescu 在他的 BankNXT 中的一篇文章 “算法的新時代”中對此有力地進行了說明。在這篇文章中,他認為,盡管銀行看待和使用數(shù)據(jù)的方式有所改變并且這一改變正在慢慢顯現(xiàn),在 fintech 創(chuàng)新的核心環(huán)節(jié)他們依然需要在擁抱“新的算法實現(xiàn)的技術(shù)”時采取更快的行動。他指出,算法驅(qū)動的方法對傳統(tǒng)挑戰(zhàn)的優(yōu)勢似乎是顯而易見的,但是很少有人使用它們:
“使用算法做貸款業(yè)務(wù),優(yōu)勢顯而易見,而且沒有銀行在做,只有初創(chuàng)公司。對交易數(shù)據(jù)進行深入學(xué)習(xí),優(yōu)勢顯而易見,目前很少有銀行在做這些,但是很多初創(chuàng)公司都在做。從 IT 日志中提取模型以檢測內(nèi)部欺詐,優(yōu)勢顯而易見,而如今只有初創(chuàng)公司在做。將客戶實體與實體支付數(shù)據(jù)相關(guān)聯(lián),優(yōu)勢顯而易見,而如今只有初創(chuàng)公司在做。對交易數(shù)據(jù)進行實時支出分析,優(yōu)勢顯而易見,而如今只有初創(chuàng)公司做得不錯。使用區(qū)塊鏈技術(shù)來完成“不需要可信任的第三方”的交易,優(yōu)勢顯而易見的,而如今只有初創(chuàng)公司在做。”
無論 Mihaescu 所言是否 100% 準確,毫無疑問的是傳統(tǒng)銀行和保險公司在開發(fā)大數(shù)據(jù)和算法方面已落后于 GAFA 和 Fintech 同行,但并不算太晚,如果能夠縮小算法差距,他們將會開發(fā)出完全獨特的資產(chǎn),并配備強大的競爭戰(zhàn)略。
第二部分:解決方案
利用獨特資產(chǎn)和數(shù)據(jù)科學(xué)進行競爭
銀行和保險機構(gòu)的獨特資產(chǎn)
傳統(tǒng)的銀行和保險公司在算法新時代中競爭,既有優(yōu)勢又有劣勢。缺點包括根深蒂固的遺留技術(shù)和業(yè)務(wù)流程,實體分支和營業(yè)廳的過度開銷,以及目前的不平等監(jiān)管負擔(dān)。
此外,對 GAFA 而言,金融服務(wù)公司永遠不可能與技術(shù)巨頭的數(shù)十億用戶或客戶群基礎(chǔ)和隨之產(chǎn)生的資源相抗衡,也不能達到其在人們的數(shù)字生活中無所不在程度(據(jù)估計,人們花費一半以上線上時間在使用 GAFA 提供的服務(wù),而今天的智能手機,無論是 iOS 還是 Android,更是無法達到)。然而,傳統(tǒng)銀行和保險公司也具有獨特的競爭優(yōu)勢,即:
來自(大部分尚未開發(fā)的)客戶數(shù)據(jù)中的價值信息。
作為補充實體網(wǎng)點 ,以及人性化的數(shù)字通道,實現(xiàn)獨特的多渠道體驗。
消費者對于維護個人資料的信任程度更高。
擁有包含大量專家的人才庫,這些專家具備廣泛領(lǐng)域的專業(yè)知識和高級數(shù)量技能。
優(yōu)勢 #1:客戶數(shù)據(jù)中尚未開發(fā)的儲備
大量儲存的日常交易的客戶數(shù)據(jù)是此優(yōu)勢的隱藏價值,有了數(shù)據(jù)挖掘和預(yù)測分析的幫助,在更好地理解、預(yù)測和交付客戶需要的內(nèi)容這方面,它可以提供獨特的益處,同時幫助更好地解決風(fēng)險、欺詐和市場不確定性。
優(yōu)勢#2:廣泛的分支機構(gòu)/營業(yè)廳網(wǎng)絡(luò)
第二個優(yōu)勢,實體分支機構(gòu)或營業(yè)廳網(wǎng)絡(luò)似乎只是間接成本,但隨著金融服務(wù)日益數(shù)字化,它可以在開發(fā)有意義的客戶關(guān)系中發(fā)揮至關(guān)重要的作用。正如線上巨頭所認識到的,僅數(shù)字化的關(guān)系有其局限性:具有粘結(jié)性的客戶體驗需要建立在同時具備實體的和數(shù)字化的接觸點上。
如果傳統(tǒng)銀行和保險公司對其網(wǎng)絡(luò)實現(xiàn)最充分的利用以建立客戶關(guān)系,那么傳統(tǒng)的銀行和保險公司就會體現(xiàn)出優(yōu)勢。例如,美國銀行和 M&T 銀行這些公司的區(qū)域經(jīng)理正在目擊一場真正的演變,因為他們的實體分支正在轉(zhuǎn)變?yōu)榭蛻舻淖稍冎行?#xff0c;其中 M&T 的一個區(qū)域經(jīng)理注意到那些正在進行中的服務(wù)活動,其組成從 80% 交易和 20% 專家意見過渡到了 20% 的交易和 80% 的專家意見。
數(shù)字巨頭正在尋找實體連接
像亞馬遜和 Google 這樣的數(shù)字巨頭正在加入蘋果的行列,開始發(fā)展零售店,以培養(yǎng)與他們的產(chǎn)品、用戶和品牌的物理聯(lián)系:
-
蘋果正在擴大其在中國、印度和拉丁美洲的時尚商店基礎(chǔ),同時通過下一代設(shè)計來翻新美國的商店。
-
亞馬遜計劃將其在美國購物中心的快閃商店的基礎(chǔ)積極地擴大到 100 家,據(jù)報道預(yù)計會在未來 10 年內(nèi),在美國開設(shè)多達 2000 家亞馬遜新品牌雜貨店,而這要建立在進行中的 20 個試點成功的基礎(chǔ)上。
-
Google 正在試水實體商店,其在紐約開了一家新的快閃商店。
-
具有豐富線上銀行經(jīng)驗的 ING 正在以咖啡館的模式補充其僅數(shù)字化的 ING Direct 服務(wù),咖啡館像辦公室一樣提供服務(wù),配有舒適的沙發(fā)、價格適中的咖啡、免費無線網(wǎng)絡(luò)、免費會議室和其他設(shè)施(但不提供傳統(tǒng)分支機構(gòu)的服務(wù),否則將會觸犯社區(qū)再投資法)。
優(yōu)勢 #3: 更堅固的客戶信任度
傳統(tǒng)金融服務(wù)公司現(xiàn)有的實體網(wǎng)點還可以用來鞏固重要的第三大優(yōu)勢:信任。雖然最終的危機確實動搖了消費者的信心,但個人對傳統(tǒng)金融機構(gòu)依然十分信任。根據(jù) IBM 調(diào)查,70% 的受訪者表示,相對于非銀行競爭者,他們更信任傳統(tǒng)銀行。而當(dāng)他們在另一項調(diào)查中被問及就保護他們的個人信息和隱私一事更信任哪個機構(gòu)時,消費者的選擇中傳統(tǒng)金融機構(gòu)比新的在線提供商排名更加靠前。
優(yōu)勢 #4:具備數(shù)量技能的人才和行業(yè)專家
傳統(tǒng)金融服務(wù)公司在人才方面具有更大的優(yōu)勢,他們擁有長期受聘的專家,這些專家具備高級數(shù)學(xué)和統(tǒng)計技能,為其提供了一個由相當(dāng)數(shù)量的熟悉行業(yè)的專家組成的員工隊伍,這些人能夠接受培訓(xùn),從而面對 GAFA 和 fintech 的主戰(zhàn)場優(yōu)勢與其進行競爭:對大數(shù)據(jù)和算法的靈活應(yīng)用,在數(shù)字化中創(chuàng)造出極致的客戶體驗,以及在越來越多的實體范圍。換句話說,銀行和保險公司在掌握數(shù)據(jù)科學(xué)方面處于有利地位。
適宜地利用 GAFA/FINTECH 的數(shù)據(jù)科學(xué)優(yōu)勢
數(shù)據(jù)科學(xué)是什么?數(shù)據(jù)科學(xué)是一門需要協(xié)作的學(xué)科,它使算法時代成為可能。具體來說,它是人員、數(shù)據(jù)、工具和流程的結(jié)合,GAFA 和 Fintech 用其將統(tǒng)計和數(shù)學(xué)技能、信息技術(shù)(特別是大數(shù)據(jù)技術(shù))和行業(yè)主題專家轉(zhuǎn)化為可行的見解和業(yè)務(wù)創(chuàng)新。
金融服務(wù)中的數(shù)據(jù)科學(xué)
具體來說,數(shù)據(jù)科學(xué)使這些公司能夠利用數(shù)據(jù)挖掘和預(yù)測建模來提供個性化提議、降低風(fēng)險、創(chuàng)造顛覆性的新產(chǎn)品、擴大市場、最大限度地減少運營費用、自動化傳統(tǒng)的手動流程等等。這些對傳統(tǒng)銀行和保險公司也將是非常有益的業(yè)務(wù)鞏固,而其中一些公司已經(jīng)在使用數(shù)據(jù)科學(xué)來著手進行實現(xiàn)。讓我們來看一下這方面的具體例子,然后我們將詳細介紹企業(yè)如何在數(shù)據(jù)科學(xué)中獲得最大的競爭能力。
數(shù)據(jù)科學(xué)的應(yīng)用:在傳統(tǒng)的銀行和保險公司的應(yīng)用案例
在汽車保險市場實現(xiàn)個性化的保險單和保險費
挑戰(zhàn)
為了實現(xiàn)對充足儲備的需求能夠與具有競爭力的價格相平衡,保險費通常使用諸如駕駛員或車輛歷史這類歷史性數(shù)據(jù)以及與年齡和性別等因素相關(guān)的統(tǒng)計概率來確定風(fēng)險。
這是一個非常有效的策略,但它其實是風(fēng)險的一份靜態(tài)記錄,無法在事先報告的事件基礎(chǔ)上將個人司機的行為作為因素來考量,在準確并持續(xù)評估個人風(fēng)險并提供真正個性化的產(chǎn)品方面限制了保險公司的能力。
解決方案
IoT 技術(shù)(或遠程信息處理)現(xiàn)在能夠通過這些行為提供可見性
通過車載設(shè)備傳輸?shù)拇罅繉崟r的、保險相關(guān)數(shù)據(jù),如關(guān)于位置、速度、加速度、制動等數(shù)據(jù),也許在不久的將來還會包括 DUI 或交通法規(guī)遵守情況。Allianz 正是一家利用了該新型可見性優(yōu)勢的傳統(tǒng)保險公司。Allianz 提供的汽車保險單允許通過綁定了裝有 GPS 的電子狗的移動應(yīng)用進行數(shù)據(jù)跟蹤,用戶只需要簡單地將電子狗插入汽車的 USB 端口。公司使用數(shù)據(jù)開發(fā)創(chuàng)新的個性化定價模式,如根據(jù)駕駛情況付費(PHYD,pay-how-you-drive )和靈活的選項,如按英里付費計劃。
結(jié)果
Allianz 使用這些新數(shù)據(jù)流開發(fā)出新的 PHYD 策略,使其能夠以較低的保費回報優(yōu)質(zhì)司機(28 歲及以下的車主占據(jù)高達 40%),并更好地了解客戶,減少欺詐,鼓勵積極的駕駛行為(減少事故和索賠)。此外,新數(shù)據(jù)使 Allianz 能夠擴展服務(wù),如道路救援、被竊車輛跟蹤和找回,以及緊急或事故救援,這些都是基于事故的實時檢測和響應(yīng)服務(wù)實現(xiàn)的自動啟動。由于這些創(chuàng)新,Allianz 2015 年總收入達到了 1252 億歐元新高,比 2014 年上漲 2.4%,2015 年營業(yè)利潤增長 3.2%,達到了 107 億歐元。
在銀行業(yè)務(wù)中積極地防止客戶違約
挑戰(zhàn)
像很多行業(yè)的很多公司一樣,美國銀行一直在努力尋找有效的方式來預(yù)防身后的風(fēng)險,也就是說確定那些可能投向競爭對手的客戶,并進行干預(yù)從而挽留他們。該公司求助于其數(shù)據(jù)科學(xué)團隊,以探索阻止這種情況發(fā)生的新策略。
解決方案
數(shù)據(jù)科學(xué)家使用交易歷史,針對有抵押貸款的客戶和有轉(zhuǎn)移風(fēng)險的持卡人開發(fā)新的行為模型。然后,科學(xué)家們與同事一起,開發(fā)基于這些模型的推薦系統(tǒng),可以在客戶下一次與銀行聯(lián)系時挽留有風(fēng)險的客戶,無論是通過線上、營業(yè)廳還是呼叫中心。
結(jié)果
雖然該轉(zhuǎn)型的關(guān)鍵績效指標(biāo)不具有普適性,但美國銀行依然對項目結(jié)果和其他數(shù)據(jù)科學(xué)計劃感到非常滿意,包括在增強其風(fēng)險管理能力方面對算法和大數(shù)據(jù)的應(yīng)用,報告表明前者使他們減少了貸款默認計算時間約 95%。 因此,美國銀行通過統(tǒng)一的分析小組并以矩陣匯報關(guān)系對應(yīng)多個業(yè)務(wù)功能和單元的方式,來擴展和加強其數(shù)據(jù)科學(xué)能力。
幕間休息:來自我們的朋友
基于量子的解決方案如何改變銀行和保險業(yè)
? —— 作者 John Kelly,QxBranch 首席分析師
數(shù)據(jù)科學(xué)與金融:一個有挑戰(zhàn)性的關(guān)系
數(shù)據(jù)科學(xué)正在徹底改變銀行和金融機構(gòu)。機器學(xué)習(xí)作為分析數(shù)據(jù)的主要方法,它的出現(xiàn)在能力以及實施尖端解決方案所需的技能基礎(chǔ)和管理結(jié)構(gòu)方面體現(xiàn)出了相對快速的提升。金融公司正在尋求外部幫助來識別和利用新的機會。
大部分數(shù)據(jù)的敏感性、監(jiān)管要求、大量的高分辨率信息以及系統(tǒng)的關(guān)鍵性,使得該領(lǐng)域成為最具挑戰(zhàn)性的領(lǐng)域之一。在 QxBranch,我們的團隊自豪地提供了先進的解決方案,能夠無縫地應(yīng)對這種復(fù)雜性。
大數(shù)據(jù)如何幫助銀行更好地了解客戶
正如你所預(yù)期的那樣,金融行業(yè)在風(fēng)險管理、交易和經(jīng)濟分析方面受益于高級分析。高級分析還為欺詐、惡意或其他非法交易的監(jiān)控行為提供了極大的價值。與其他行業(yè)一樣,應(yīng)用于客戶的高級數(shù)據(jù)分析可以通過產(chǎn)品(信用卡、家庭購買、投資等)展示詳細的洞察力,包括定義和分析銀行客戶、闡明行為、了解他們的行程。這有助于銀行根據(jù)客戶的需求定制產(chǎn)品,提供更好的服務(wù)和優(yōu)化客戶壽命值和保留期。
用機器學(xué)習(xí)了解風(fēng)險
QxBranch 看到將高級數(shù)據(jù)分析應(yīng)用于保險產(chǎn)品的巨大潛力,這是保險公司的主要活動領(lǐng)域。高級模型特別適用于動態(tài)演變的風(fēng)險區(qū)域,即隨著時間的推移模型不一定按照相同的原則做出行為,比如網(wǎng)絡(luò)保險。 我們使用一個簡單的端到端分析框架 Dataiku 來開發(fā)一些最復(fù)雜的解決方案。
量子解決方案:下一個腳步
QxBranch 是開發(fā)量子計算軟件的領(lǐng)導(dǎo)者。量子計算機會在未來幾十年對經(jīng)濟的各個領(lǐng)域進行革新,其中許多初期的應(yīng)用程序都將基于機器學(xué)習(xí)。QxBranch 與金融行業(yè)(和其他垂直行業(yè))的領(lǐng)先公司合作,描述技術(shù)如何影響其業(yè)務(wù)和競爭格局。Dataiku 將無縫集成到量子軟件中。量子計算需要在預(yù)處理過的、清潔的數(shù)據(jù)上運行。對于這樣的計算,我們采用 Dataiku 來攝取、清理和準備手頭的數(shù)據(jù)。之后,我們輸入一個調(diào)用量子函數(shù)的自定義 python 模塊。計算過程在量子計算機上運行,而概率結(jié)果會被重新注入 Dataiku 進行分析和可視化。
注:QxBranch 是一家在全球運營的高級數(shù)據(jù)分析公司,在系統(tǒng)工程方面運用專業(yè)知識,為投資銀行、對沖基金和保險公司針對聚焦數(shù)據(jù)的問題開發(fā)復(fù)雜、強大的解決方案。
在銀行業(yè)務(wù)中發(fā)現(xiàn)新的客戶細分
挑戰(zhàn)
一個大型零售銀行集團認為,其用來定位銷售和進行市場營銷活動的對現(xiàn)有客戶的細分仍有改善的余地,但分析師似乎已經(jīng)使用銀行的 CRM 系統(tǒng)盡最大可能完善了客戶細分。
解決方案
該公司決定嘗試類似于美國銀行部署的策略來幫助解決其身后的風(fēng)險:挖掘大型交易數(shù)據(jù)檔案,以開發(fā)新的客戶行為模式。具體來說,保險公司將交易數(shù)據(jù)和 CRM 數(shù)據(jù)結(jié)合在一起,并利用挖掘算法來顯現(xiàn)之前未檢測到的行為與配置文件的相關(guān)性。
結(jié)果
鑒于這些相關(guān)性的結(jié)果,新的細分市場現(xiàn)在正在被營銷和銷售用于指導(dǎo)報價和促銷活動,轉(zhuǎn)化率提高了三倍。令人高興的是,該公司現(xiàn)在已經(jīng)向他們的數(shù)據(jù)科學(xué)家指派了任務(wù),分析網(wǎng)絡(luò)日志和其他在線行為指標(biāo),從而優(yōu)化數(shù)字和全方位的客戶體驗。
自動化保險行業(yè)中生活事件的市場營銷
挑戰(zhàn)
一家較大的保險公司認為確認重大事件(如嬰兒出生、結(jié)婚或離婚、購車、出售房屋等)何時發(fā)生具有很大的挑戰(zhàn)性,如果能夠確認,就能及時根據(jù)這些事件為客戶和潛在客戶提供合適的產(chǎn)品。
解決方案
該公司的數(shù)據(jù)科學(xué)團隊結(jié)合了 CRM 數(shù)據(jù)、合同數(shù)據(jù)、博客和社交媒體數(shù)據(jù),并對綜合數(shù)據(jù)進行了分析,以開發(fā)出能夠預(yù)測這些事件何時發(fā)生或?qū)⒁l(fā)生的預(yù)測模型,并將消息傳送給銷售和營銷部門。
結(jié)果
該項目根據(jù)生活事件提高了對客戶的檢測和定位能力,從而實現(xiàn)了可以實時自動觸發(fā)的以事件為主題的新活動的開發(fā)。該公司正在擴大其數(shù)據(jù)科學(xué)項目,包括根據(jù)個人客戶行為檢測欺詐性索賠和開發(fā)新的個性化產(chǎn)品和服務(wù)。
檢測欺詐保險索賠的新效率和準確性
挑戰(zhàn)
一家補充保險的大型提供商希望找到更有效的方式,來檢測潛在的針對眼科護理的欺詐性索賠,據(jù)他們估計這類索賠使他們每年花費 15 萬歐元。他們只有足夠的資源對被認定是潛在欺詐索賠的 10% 進行跟蹤,所以他們想找到一種方法來確保最高可能的概率,即建議做調(diào)查的索賠確實是那些看起來最具欺詐性質(zhì)的。
解決方案
保險公司的數(shù)據(jù)科學(xué)團隊將處方、患者和護理人員的內(nèi)部數(shù)據(jù)結(jié)合在一起,并針對此綜合數(shù)據(jù)測試了大量欺詐檢測算法。在找到一個證明可靠的模型后,他們基于該模型建立了一個實時 API,以便根據(jù)索賠具有的可能的合法性指導(dǎo)索賠管理系統(tǒng)內(nèi)的索賠自動決策。
結(jié)果
該公司報告說,識別潛在欺詐行為的新系統(tǒng)已被證明在欺詐檢測方面比傳統(tǒng)方式有效三倍,并且通過實時數(shù)據(jù)流持續(xù)對模型進行改進,他們預(yù)期會有更好的表現(xiàn)。
幕間休息:來自我們的朋友
銀行和保險數(shù)據(jù)項目中待解決的 3 個挑戰(zhàn)
? —— 作者 Julien Cabot,BlueDME 公司 CEO
自 2011 年以來,我有機會參加了 Data Lab 在銀行和保險行業(yè)的一些項目。這些年的經(jīng)驗告訴我,為了取得成功,必需先解決三個重大挑戰(zhàn),而對一個 Data Lab 項目的簡單準備可以先放一邊。
訪問和資格認證是成功的關(guān)鍵因素,因為沒有數(shù)據(jù),所有的辦法都起不到作用,無論這種方法多么巧妙。此外,項目中 60% 到 70% 的努力與數(shù)據(jù)的資格和準備相關(guān),而必要的任務(wù)卻沒有增加什么價值。鑒于數(shù)據(jù)科學(xué)家的小時成本,有效性和生產(chǎn)力在收集、研究和準備數(shù)據(jù)的過程中是至關(guān)重要的。任何有助于加速這一階段的工具和方法,很快都會被證明是值得的。
將數(shù)據(jù)科學(xué)工作的結(jié)果加入到操作流程中的能力,無論對于預(yù)先計算的指標(biāo)還是對于實時可用的預(yù)測模型,都是至關(guān)重要的。實際上,分析研究導(dǎo)致數(shù)據(jù)和“數(shù)學(xué)對象”以預(yù)測模型的方式發(fā)生新的轉(zhuǎn)變,操作信息系統(tǒng)仍然能夠?qū)ζ溥M行集成。然而,往往要看研究產(chǎn)出的真實價值。
衡量數(shù)據(jù)科學(xué)項目的投資回報率很重要。由于項目的探索性質(zhì),對每個項目的單位投資回報的確切估算是特別復(fù)雜的。采用廣泛項目的方法,可以使產(chǎn)生重要投資回報率的項目能夠為僅獲得相對有限結(jié)果的實驗提供資金,就像私募股權(quán)投資策略一樣。
IDEA 1:為專業(yè)團隊準備一個數(shù)據(jù)搜索引擎
專門針對精算師專業(yè)團隊準備一個數(shù)據(jù)搜索引擎,對于負責(zé)統(tǒng)計研究的人員以及與 Data Lake 和 Data Lab 合作的風(fēng)險團隊會從中受益。它有助于實現(xiàn)內(nèi)部和外部數(shù)據(jù)目錄、以能夠適應(yīng)不同任務(wù)的方式對這些數(shù)據(jù)的探索、以及在銀行保險領(lǐng)域?qū)ψ钣杏脭?shù)據(jù)的共享。Blue DME 的數(shù)據(jù)交換平臺的基本概念是一種協(xié)作方法的發(fā)展,由 Data Lab 豐富了功能,目的是在兩個專業(yè)領(lǐng)域之間應(yīng)用 Data Lake 數(shù)據(jù)。
IDEA 2:通過 WEB 服務(wù)從新生代的預(yù)測模型中進行展示
得益于 Dataiku DSS v3 等數(shù)據(jù)科學(xué)領(lǐng)域的現(xiàn)代解決方案,通過 Web 服務(wù)進行展示的效率和效果正在提升。這些展示來自預(yù)測模型的新產(chǎn)物,如隨機森林、漸變增強,等等。手動配置邏輯回歸的日子即將結(jié)束。對二進制預(yù)測模型的直接展示提升了這些先進模型的性能,同時最重要的一點是使其得到了簡化。
IDEA 3:成功的內(nèi)部和外部貨幣化的邏輯
ROI 的計算由預(yù)測模型提供的結(jié)果生成,其受限于內(nèi)部優(yōu)化,而預(yù)測模型則與之前的環(huán)境相關(guān)。基于數(shù)據(jù)開發(fā)新服務(wù)的想法正在變得越來越重要,從而使新的高利潤收入成為可能。
注:在銀行和保險行業(yè),Data Lab 項目通常是一個更大的進程的第一步,它將組織轉(zhuǎn)變?yōu)椤皵?shù)據(jù)驅(qū)動型業(yè)務(wù)”模式,遠遠超過客戶意識或風(fēng)險。
正如所看到的
盡管 Mircea Mihaescu 是對的,在對大數(shù)據(jù)和算法的利用上,傳統(tǒng)銀行和保險公司落后于對手 GAFA 和 Fintech,不過有很多領(lǐng)導(dǎo)者已經(jīng)開始采取相應(yīng)的措施來消除算法差距,他們常常通過利用他們最有價值的資產(chǎn)之一來實現(xiàn),即他們深度的客戶數(shù)據(jù)歷史檔案。
他們也在充分利用其專業(yè)基礎(chǔ)以及行業(yè)專家,前者需要良好的數(shù)學(xué)和統(tǒng)計知識,而后者能夠相對容易地使用大數(shù)據(jù)工具和技術(shù)進行高級分析,他們是像 Prudential 的副總裁兼精算師 Christine Hofbeck 這樣的人,Christine Hofbeck 將她的精算技巧引入預(yù)測分析。正如她所說,只需要一點點努力,而機遇卻是廣闊的:“價格優(yōu)化。壽命值和保留模型。價格彈性。風(fēng)險選擇優(yōu)化。預(yù)測承保。注冊優(yōu)化。目標(biāo)營銷。了解投保人行為的驅(qū)動因素。購買傾向。失效和流失分析。綁定的可能性。了解基于客戶行為的市場變化。市場細分。中介細分。尋找人群中隱藏的需求,開發(fā)盈利產(chǎn)品...我可以繼續(xù)列舉,機會是無止境的。“
踏上正確的道路,充分把握這些機會,只需將人、數(shù)據(jù)、工具和流程放到一起形成的正確組合。
第三部分:采取行動
合適的人
數(shù)據(jù)科學(xué)家的長期性短缺
理想的數(shù)據(jù)科學(xué)家應(yīng)該擁有先進的數(shù)學(xué)或統(tǒng)計知識、堅實的計算機編程技能、大數(shù)據(jù)處理及存儲工具和技術(shù)的知識,以及他們工作領(lǐng)域的專業(yè)知識。
擁有這種多樣化技能、知識和經(jīng)驗的專業(yè)人士數(shù)量不多,遠低于市場需求。 正如麥肯錫公司所預(yù)測的那樣,到 2018 年,只美國就會有 490,000 名數(shù)據(jù)科學(xué)家需求,而候選人卻少于 200,000 人。雖然許多大學(xué)已經(jīng)通過新的數(shù)據(jù)科學(xué)計劃來加強填補這一空白,但長期性的短缺還是會持續(xù)一段時間。
機構(gòu)內(nèi)部策略:用內(nèi)部人才滿足需求
這種短缺導(dǎo)致一些公司采取幫助現(xiàn)有人才的策略,如 Christine Hofbeck,以此來發(fā)展數(shù)據(jù)科學(xué)能力。例如,思科系統(tǒng)與兩所大學(xué)合作,在數(shù)據(jù)科學(xué)領(lǐng)域建立遠程學(xué)習(xí)教育和認證計劃,目前已有超過 200 名員工接受過數(shù)據(jù)科學(xué)家培訓(xùn)和認證。
除了簡單地幫助滿足對數(shù)據(jù)科學(xué)人才的需求外,這種內(nèi)部方法還提供了額外的好處,即為即將參加工作的數(shù)據(jù)科學(xué)家配備了必要的企業(yè)知識和學(xué)科專業(yè)知識。幸運的是,正如思科的例子所示,現(xiàn)在有很多資源可以幫助企業(yè)通過內(nèi)部策略獲得成功。包括:
-
通過大學(xué)提供的大量線上的、業(yè)余時間的和按需的數(shù)據(jù)科學(xué)培訓(xùn)課程。
-
由專業(yè)服務(wù)公司和軟件提供商提供現(xiàn)場培訓(xùn)。
-
數(shù)據(jù)科學(xué)啟動訓(xùn)練營。
-
專業(yè)協(xié)會的發(fā)展項目,如事故精算學(xué)會最近在數(shù)據(jù)科學(xué)和預(yù)測分析方面為精算師增加了認證。
發(fā)展內(nèi)部人才
識別候選人
如前所述,大多數(shù)銀行和保險公司已經(jīng)具備擁有數(shù)學(xué)和統(tǒng)計學(xué)專業(yè)知識的分析師和科學(xué)家,包括許多碩士或博士人員。這些專業(yè)人士包括精算師、索賠分析師、風(fēng)險分析師、保險商、經(jīng)濟學(xué)家、股票分析師、市場分析師和許多其他可以輕松利用數(shù)學(xué)和統(tǒng)計知識、定量技能來理解和操作新類型機器學(xué)習(xí)算法的分析師,這些人能夠相對輕松地使用 Python 或 R 語言擴展其現(xiàn)有的編程技能(VBA、 SQL、SAS/JMP 等),這可以幫助他們執(zhí)行這些算法。
建立在核心數(shù)學(xué)和統(tǒng)計技能上
例如,對于信用評分中的廣義線性建模(GLM)、使用機器學(xué)習(xí)算法來增強 GLM 結(jié)果、甚至使用 R 和支持向量機器或神經(jīng)網(wǎng)絡(luò)算法作為替代方法而言,用 Excel 和 VBA 的差別不大,盡管人員之間的差別相對較大,如運行封裝算法卻不真正理解其內(nèi)涵的人與可以在一個算法中解密數(shù)學(xué)和統(tǒng)計運算并根據(jù)需要對其進行優(yōu)化或調(diào)整的人,他們深厚的行業(yè)經(jīng)驗背景也有較大差別。
開發(fā)大數(shù)據(jù)需要的 IT 技能
除了這些核心定量技能外,大多數(shù)銀行和保險分析師都對信息系統(tǒng)有所了解,并經(jīng)常從各種來源獲取和準備數(shù)據(jù),盡管他們可能不熟悉大數(shù)據(jù)管理技術(shù)。但需要再次強調(diào)的是,他們可以學(xué)習(xí),而且幸運的是,大數(shù)據(jù)技術(shù)已經(jīng)成熟到具有通用信息系統(tǒng)技能的人都能夠?qū)⑵湔莆铡>唧w來說,與第一代大數(shù)據(jù)技術(shù)相比,目前大多數(shù)大型數(shù)據(jù)系統(tǒng)都具有能夠使連接、轉(zhuǎn)換、查詢和可視化數(shù)據(jù)更加簡單接口和工具。
盡管獲取這些新的或擴展的技能也許相對容易,參與者應(yīng)該對終身學(xué)習(xí)有一個自然的傾向,因為如果數(shù)據(jù)科學(xué)有一個常量,那么它會是不斷變化的,正如它的發(fā)展速度所證明的那樣,持續(xù)演進的大數(shù)據(jù)管理技術(shù)、編程語言和算法策略都融入到了數(shù)據(jù)科學(xué)。
對于迎接這一挑戰(zhàn)并致力于這一學(xué)科的專業(yè)人士而言,回報有很多,包括專業(yè)地區(qū)分自己的能力、吸引高額薪酬、推動職業(yè)發(fā)展。還可以減輕其與手工過程和計算相關(guān)的大量工作,釋放他們?nèi)ヅ囵B(yǎng)更多的好奇心、創(chuàng)造力和判斷力。
合適的數(shù)據(jù)
從“數(shù)據(jù)排放”獲取價值
盡管銀行和保險公司在其擁有的歷史客戶數(shù)據(jù)方面,較行業(yè)新進入者具有潛在的優(yōu)勢,他們?nèi)孕枰m當(dāng)?shù)墓ぞ邅韽臄?shù)據(jù)中收集可行的見解,并能夠利用外部數(shù)據(jù)對其進行豐富。正如 Fintech 公司所表明的那樣,來自社交媒體和多媒體、智能手機、電腦、IoT 等消費和工業(yè)設(shè)備的數(shù)字化的“數(shù)據(jù)排放”,可供銀行和保險公司使用,并且在某些情況下已經(jīng)被用作行為洞察的豐富來源。
超越常規(guī)來源
例如,如果你正在開發(fā)用于家庭保險索賠的欺詐分析工具,則可能需要集成索賠管理系統(tǒng)的內(nèi)部數(shù)據(jù)、文檔管理系統(tǒng)和帶有外部數(shù)據(jù)(如天氣、信用和財務(wù)信息)的第三方聲明,以驗證索賠人的身份和可靠性以及在特定時間發(fā)生特定事件的可能性(同時,也是在為使用智能家居系統(tǒng)的遠程信息數(shù)據(jù)和區(qū)塊鏈認證交易數(shù)據(jù)來解決大部分當(dāng)前的索賠歧義做準備)。
獲得開放數(shù)據(jù)的優(yōu)勢
盡管一些有用的外部數(shù)據(jù)的現(xiàn)有來源其獲取代價昂貴,但是以前大量不可用的外部數(shù)據(jù)現(xiàn)在可用作公開的公共部門數(shù)據(jù)使用。
例如,美英兩國政府和歐盟最近推出了“開放數(shù)據(jù)”門戶網(wǎng)站,以使大量的政府統(tǒng)計數(shù)據(jù)能夠被利用,包括健康、教育、工人安全和能源數(shù)據(jù)。從廣泛的來源對第三方數(shù)據(jù)進行更好地訪問、內(nèi)部獨一無二的歷史數(shù)據(jù)、適當(dāng)?shù)娜瞬?#xff0c;使得保險公司和銀行家能夠穩(wěn)健地獲得和 GAFA 一樣的優(yōu)勢,這些優(yōu)勢體現(xiàn)在基于事件的背景提出新的問題(這些問題有關(guān)客戶以及更深入地了解他們的需求、要求和習(xí)慣)并利用這些洞察力為特定的客戶群體甚至單獨的“單人市場”更好地打造體驗和產(chǎn)品。
然而,確保所使用的數(shù)據(jù)及其使用方式是合法和道德的,并且其質(zhì)量足以產(chǎn)生可靠的分析結(jié)果是非常重要的。對于諸如此類的問題,必須有正確的技術(shù)和流程。
合適的技術(shù)和流程
現(xiàn)在,你有了合適的數(shù)據(jù)源和合適的人員,而接下來重要的是讓你的數(shù)據(jù)科學(xué)團隊配備合適的工具和流程從而獲取成功。為實現(xiàn)此目的并最大限度地提高數(shù)據(jù)科學(xué)投資的回報,有以下四個重要步驟:
加速和確保基本工作流程。
采用平臺方法,并進行明智地選擇。
建立良好的分管理措施。
站在數(shù)據(jù)科學(xué)產(chǎn)品和 KPI 的角度思考。
加速和確保基本工作流程
要取得成功,數(shù)據(jù)科學(xué)家的三個基本工作流程需要是精簡的、自動化的和靈活的。數(shù)據(jù)科學(xué)家應(yīng)該能夠輕松地從任何數(shù)據(jù)源連接和準備數(shù)據(jù),從而使用喜歡的語言并應(yīng)用最適合其需求的算法類型執(zhí)行建模和預(yù)測,以及輕松生成可供不同的內(nèi)部和外部系統(tǒng)所用的可行的結(jié)果。
數(shù)據(jù)準備和豐富
數(shù)據(jù)收集和準備階段是勞動力最密集的階段,平均消耗一名數(shù)據(jù)科學(xué)家 60-80% 的時間。因此,選擇一個工具可以實現(xiàn)自動化或者至少加快與數(shù)據(jù)準備相關(guān)聯(lián)的提取、轉(zhuǎn)換和加載(ETL)工作流是至關(guān)重要的。
工具應(yīng)具備以下功能:
非遠程的、基于向?qū)У倪B接器,可用于各種數(shù)據(jù)源。
可視化處理器,用于代碼自由的數(shù)據(jù)審查和清潔。
能夠像 Excel 一樣輕松地過濾和搜索數(shù)據(jù)。
能夠輕松執(zhí)行大規(guī)模轉(zhuǎn)換,包括用于常規(guī)轉(zhuǎn)換的內(nèi)置處理器和用于定制處理的宏。
隨著數(shù)據(jù)的發(fā)展,輕松適應(yīng)變化的能力。
最后一項功能是至關(guān)重要的,因為高級分析世界中的數(shù)據(jù)永遠不會是靜態(tài)的,而不能解決這種變化的技術(shù)和方法將一直無濟于事。
建模與預(yù)測在數(shù)據(jù)準備階段,開放性、自動化和靈活性對于支持建模和預(yù)測階段的工作流程至關(guān)重要。因此,一個有效的工具需要提供以下功能:
逐步的可視化的指導(dǎo),以加快模型建設(shè)。
對普通機器學(xué)習(xí)庫的本地支持,具有專門的 API 訪問權(quán)限。
可以直接使用 Python 和 R 等通用語言編寫代碼。
評估性能、比較結(jié)果和優(yōu)化模型的視覺反饋。
白盒透明度及報告,以幫助分析師了解各種互動以及選擇帶來的影響。
執(zhí)行和部署由于數(shù)據(jù)科學(xué)的最終目標(biāo)是產(chǎn)生可操作的可用結(jié)果,所以最后一個工作流程階段應(yīng)該:
自動化產(chǎn)品生產(chǎn)流程,包括數(shù)據(jù)可視化和可使用的基于標(biāo)準的 API。
可以讓數(shù)據(jù)科學(xué)家將整個工作流程(包括數(shù)據(jù)和模型)打包成單個可部署和可復(fù)制的包。
在捕獲的工作流程中支持版本控制和回滾。
采用平臺方法,并進行明智地選擇
要想能夠回滾到以前的版本,或者容易地生成可部署和可重復(fù)的包,而在從數(shù)據(jù)收集到建模再到生產(chǎn)的所有項目階段卻不使用一個單一的數(shù)據(jù)科學(xué)平臺,這幾乎是不可能實現(xiàn)的。
最大化效率
采用單一平臺而不是使用專門的工具,除了回滾和部署外,還有許多其他好處。一個重要的好處是消除時間浪費,包括在各種數(shù)據(jù)源、系統(tǒng)和工具之間切換所花費的時間,以及科學(xué)家在項目之間切換時(這很常見)趕上之前工作的速度所損失的時間。
支持協(xié)作
平臺策略還使團隊能夠協(xié)同工作,例如數(shù)據(jù)工程師收集和準備數(shù)據(jù)、分析師運行模型、或者初級數(shù)據(jù)科學(xué)家一邊工作一邊向更有經(jīng)驗的同事學(xué)習(xí)。這是必不可少的,因為數(shù)據(jù)科學(xué)團隊通常是多樣化的,每個成員都有獨特的優(yōu)勢和劣勢。
知識獲取
平臺戰(zhàn)略還提供了一種“生命周期”方法,使得能夠構(gòu)建一個可行的與知識產(chǎn)權(quán)資產(chǎn)有關(guān)的基礎(chǔ)知識庫,類似于產(chǎn)品生命周期管理(PLM,Product Lifecycle Management)平臺在制造過程中發(fā)展的方式,以避免從設(shè)計理念到制造到最終商品處置的過程由于捕獲、存儲、重新使用知識而重復(fù)造輪子。
開放是關(guān)鍵
然而,除非平臺是開發(fā)的,否則這個方法將最終證明在快速發(fā)展的數(shù)據(jù)科學(xué)世界中會受到限制。開放性及不確定的供應(yīng)商和技術(shù)意味著,盡管基礎(chǔ)的數(shù)據(jù)源、編程語言、大數(shù)據(jù)存儲和管理技術(shù)以及算法不可避免地會發(fā)生變化,為數(shù)據(jù)科學(xué)家提供的用于收集、分析和可視化數(shù)據(jù)的框架將保持不變。
建立良好的分析管理
平臺方法的另一個優(yōu)點是,它更容易實現(xiàn)強大的“分析管理”。在 PLM 中,好的管理對于確保結(jié)果的有效性和創(chuàng)建“安全數(shù)據(jù)空間”至關(guān)重要,其中隱私、保密性和安全性得到嚴格保護。數(shù)據(jù)科學(xué)的管理對于生產(chǎn)高品質(zhì)、可復(fù)制的分析項目很重要,而這也是許多行業(yè)所面臨的困難。
然而,銀行和保險公司在制定組織結(jié)構(gòu)、管理框架和規(guī)則方面擁有長期和嚴密的經(jīng)驗,可以為他們在擴大和維持其數(shù)據(jù)科學(xué)計劃帶來的初始競爭優(yōu)勢方面帶來好處。然而,無論采取怎樣的具體技術(shù)框架或管理策略,銀行和保險公司都應(yīng)該致力于建立自己的內(nèi)部數(shù)據(jù)分析能力、資產(chǎn)和知識產(chǎn)權(quán),而不依靠第三方提供商,盡管最初的工具、流程、人員轉(zhuǎn)型數(shù)據(jù)可以由合作伙伴進行協(xié)調(diào)和啟用。這些合作伙伴可以協(xié)助奠定數(shù)據(jù)訪問、協(xié)作和知識資產(chǎn)化的基礎(chǔ),并協(xié)助部署所需的工具和基礎(chǔ)設(shè)施,以確保可持續(xù)的數(shù)據(jù)科學(xué)能力。
站在數(shù)據(jù)科學(xué)產(chǎn)品和 KPI 的角度思考
最后,企業(yè)需要努力設(shè)計項目,尋求解決明確的業(yè)務(wù)問題,即使有些資源被用于純粹的數(shù)據(jù)挖掘。這可以幫助避免數(shù)據(jù)科學(xué)計劃中的主要缺陷之一:在太多的實驗項目中陷入困境,探索性的建模永遠不會引入到可用的數(shù)據(jù)科學(xué)“產(chǎn)品”的生產(chǎn)中。
最后,預(yù)測和處方僅在可使用(例如,通過 API 集成到外部應(yīng)用程序,如客戶自助服務(wù) Web 應(yīng)用程序、移動應(yīng)用程序或內(nèi)部執(zhí)行決策系統(tǒng))或至少能夠以可視化形式呈現(xiàn)從而指導(dǎo)利益相關(guān)者的決策時,才是有用的。
因為需要確保算法驅(qū)動創(chuàng)新的變革力量能夠被最大化地利用,所以進一步確定和跟蹤 KPI,從而評估業(yè)務(wù)用量和數(shù)據(jù)科學(xué)項目的價值以及產(chǎn)品,是確保數(shù)據(jù)科學(xué)項目有效落地以及調(diào)整方向的最終的寶貴手段。
總結(jié)
在配備合適的人員、流程和工具后,傳統(tǒng)銀行和保險公司不僅可以避免成為挑戰(zhàn)者 GAFA 和 Fintech 的后臺基礎(chǔ)設(shè)施的命運,還可以占用這些后來者的優(yōu)勢,將其并入自身,從而成為 21 世紀新市場的創(chuàng)新者。
銀行和保險公司有他們所需要的人員。它們具有獨特的數(shù)據(jù)資產(chǎn)和獨特的物理存在。他們在組織、管理和信任方面都有優(yōu)勢。接下來就是要清楚地認識我們所處的大數(shù)據(jù)和分析時代,通過掌握數(shù)據(jù)科學(xué),抓住機遇,在新的時代蓬勃發(fā)展。
-
如果業(yè)界資深人士這樣做,他們既可以蓬勃發(fā)展,也可以塑造銀行和保險的未來,未來可能會如何?
-
我們在一個舒適的銀行咖啡館里品嘗一杯拿鐵,同時享受著裝備有人工智能的人類和機器人代理為我們提出有先見之明的建議,這樣的事會發(fā)生嗎?
-
生物識別認證是否會成為規(guī)范,手指觸摸或用眼睛一瞥會使錢包、點擊和卡片過時嗎?
-
我們會在一個安全的全球區(qū)塊鏈網(wǎng)絡(luò)上交換虛擬貨幣、付款和保險單嗎?
-
同行、代理商、客戶、經(jīng)紀人、銀行家、保險商等之間的關(guān)系是否會在一個互相連接的世界中消失?
很難說,但這會是一個銀行和保險行業(yè)有利于幫助描繪的未來。
轉(zhuǎn)載于:https://www.cnblogs.com/fortunel/p/7711517.html
總結(jié)
以上是生活随笔為你收集整理的译:Dataiku 白皮书之《在银行和保险行业应用数据科学》的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 共享经济已成资本傀儡,背后是腾讯和阿里的
- 下一篇: 中兴和华为的面试经历