连毕马威也看好这家金融科技公司,面对AI不跟风、有理想!
最近一個關(guān)于金融科技公司的評獎結(jié)果出爐了,就是“畢馬威中國2017領(lǐng)先金融科技企業(yè)50強”。
“領(lǐng)先、金融、科技、畢馬威”……小編覺得這個獎項的名字真的很高(you)大(dang)上(ci)!
話說接近年關(guān),評獎活動以及頒獎典禮還真多,但這個獎可是大大不同,這可是畢馬威牽頭組織評選的,除了名字很高端之外,在金融科技領(lǐng)域也相當(dāng)有含金量。
先上一張2017年上榜企業(yè)“全家福”吧!
畢馬威中國2016金融科技50強
小編認真搜羅了前后兩屆的上榜企業(yè)名單,意外發(fā)現(xiàn)了一家公司已經(jīng)二度上榜,哪家?就是天云大數(shù)據(jù)!
如果僅僅看公司名稱,妥妥的一家大數(shù)據(jù)公司,但實際上人家在AI 領(lǐng)域已經(jīng)深耕多年,經(jīng)驗和產(chǎn)品都很豐富,特別是在金融領(lǐng)域。
據(jù)悉,天云大數(shù)據(jù)的智能平臺已經(jīng)在銀行貸前、貸中、貸后都建立了反欺詐、申請評分、行為評分、早晚期催收模型,此外在互聯(lián)網(wǎng)金融黑名單多頭貸測試、失聯(lián)修復(fù)、循環(huán)擔(dān)保等方面也有成功案例。
這么看,公司的AI金融產(chǎn)品真的很厲害!
其實除了產(chǎn)品“出挑”,小編還了解到該企業(yè)對AI 的認識看法也同樣獨到,完全是一家面對AI 大潮“不跟風(fēng)、有理想”的公司。
下面聽一聽天云大數(shù)據(jù)CEO雷濤關(guān)于目前AI 發(fā)展的一些見解吧!
在頒獎典禮上,雷濤表示,目前人工智能已經(jīng)出現(xiàn)兩輪,方向和趨勢都有所變化。
其實人們最早看到的是人機交互方向的人工智能,這也是大家目前比較熱衷追逐的,例如人臉識別、無人駕駛和自然語言處理等,這些具體的熱點都與視覺和語音相關(guān)。
這就導(dǎo)致目前關(guān)于人工智能的諸多應(yīng)用中,例如無人駕駛、語音識別等人機交互場景更吸引人們的關(guān)注,但未來人工智能發(fā)展趨勢會更加凸顯規(guī)模化模型生產(chǎn)能力。
例如,最近某大型銀行推出新版手機app,功能背后是年生產(chǎn)600種智能推薦模型的算法支撐,是以人工智能賦能金融,實現(xiàn)規(guī)模化模型生產(chǎn)的最佳范本。
其實雷濤提到的“規(guī)模化模型生產(chǎn)能力”,就是谷歌在2015年著手做的AI 的PaaS化。
關(guān)于AI 的PaaS化
延續(xù)雷濤提出的問題,小編先簡單梳理下 AI PaaS化的“前世今生”。
人機交互應(yīng)用發(fā)展“相對成熟化”
計算機視覺在AI 領(lǐng)域是最早被爆出的熱料,早期因為視覺信號比較低,只有紅綠藍像素,但通過這些低階的簡單信號,還是能夠通過循環(huán)神經(jīng)網(wǎng)絡(luò)重復(fù)出大規(guī)模的特征來進行人臉識別,受此影響,計算機在窄場景(語音、圖像等)領(lǐng)域就會催生實踐力很強的算法,進而帶動了圖像識別方面的論文高產(chǎn)以及各類競技比賽的層出不窮。
在這個背景下,2015年、2016年相繼開放了關(guān)于圖像和自然語言的一些基礎(chǔ)數(shù)據(jù)訓(xùn)練集,數(shù)據(jù)資源變得非常有序,在算力方面只要有足夠的資本投入,人機交互變得日漸容易;此外因為像人機交互的數(shù)據(jù)集很多是通用的公開數(shù)據(jù),例如即便用北美人的圖片也可以序列化后用于中國臉,只不過識別率稍微低一點,個別地方需要修整,但是這個業(yè)務(wù)啟動的效率還是很高的;再比如像自然語言處理也是,谷歌10億單詞短語訓(xùn)練集開放以后,門檻也會隨之迅速降低……這么看來第一波市場集中在人機交互還是有理由的。
企業(yè)級的智能應(yīng)用還得靠PaaS形式?
雷濤表示,除了AI應(yīng)用的層出不窮,我們還要密切關(guān)注另一個市場的發(fā)展,也就是企業(yè)級的應(yīng)用市場。
由于企業(yè)級應(yīng)用市場的數(shù)據(jù)主要存在于企業(yè)內(nèi)部,建立模型并不現(xiàn)實,即便開發(fā)了一套系統(tǒng)也不能完全支持各種環(huán)境的通用性,所以企業(yè)級市場需要機器學(xué)習(xí)能力的時候,需要用數(shù)據(jù)驅(qū)動替代一些業(yè)務(wù)流程驅(qū)動的方式的時候,因為數(shù)據(jù)的局部性,必然導(dǎo)致AI的落地形態(tài)發(fā)生變化。
人臉識別、自然語言處理,通常都是以API的調(diào)用方式被應(yīng)用直接獲取,但對于企業(yè)級的應(yīng)用只能通過PaaS形式。
這是為什么呢?
因為企業(yè)級數(shù)據(jù)私有化程度較高,不可能在任何地方都可以用事前架構(gòu)好的模型來應(yīng)用;涉及算法多種多樣,不同的企業(yè)問題就有不同的算法方向,未必是卷積神經(jīng)網(wǎng)絡(luò)一招包打天下,其中有可能用到循環(huán)神經(jīng)網(wǎng)絡(luò),甚至可能只是用一個基礎(chǔ)的分類器SVM,效果同樣好。
在多樣的業(yè)務(wù)場景下,算法的多樣性、數(shù)據(jù)的排他性,決定不可能用一個API的形態(tài)完成整體的智能化過程。
AIPaaS化或許比純粹造應(yīng)用更有價值
2015年,谷歌就開始著手AI的PaaS化。
2016年,Facebook、亞馬遜等公司也開始在這方面努力著。
過去很長一段時間里,人們盯著算法來做各種AI 應(yīng)用,產(chǎn)生了各種智能識別以及預(yù)測,確實給智能零售領(lǐng)域帶來了本質(zhì)性的沖擊,例如無人售貨機,應(yīng)用層面的百花齊放逐漸成為AI行業(yè)的“風(fēng)向標”,但雷濤認為我們應(yīng)該冷靜下來看一看,其實AI PaaS這個層面包含一個更廣泛的企中業(yè)級應(yīng)用市場。
企業(yè)級AI應(yīng)用的落地,其實已經(jīng)不是看臉,聽語音那么簡單了,最核心的是替代原來的經(jīng)驗規(guī)則,也就是怎么用數(shù)據(jù)表達這些非線性的、隱含的事實,通過數(shù)據(jù)科學(xué)能力重塑商業(yè)流程。所以對更廣泛的企業(yè)服務(wù)領(lǐng)域,AI能力的賦予絕對比看人臉,做智能語音客服價值要大。
小編大膽設(shè)想下,AI PAAS市場的到來,無疑就像為移動互聯(lián)網(wǎng)配置了一個安卓平臺,移動互聯(lián)能力、應(yīng)用開發(fā)能力大規(guī)模被釋放出來。這個場景就像2002年只有諾基亞、摩托羅拉這些大公司才能生產(chǎn)一個APPs,而安卓帶來了移動應(yīng)用市場的繁榮。AI to everywhere,AI PaaS會賦予更廣泛的服務(wù)智能。
關(guān)于AI人才
2017年,世界集體見識了人工智能有多么狂熱,Alphago大勝柯潔,Alphago Zero自學(xué)成才完勝Alphago……AI技術(shù)在各行各業(yè)落地應(yīng)用的同時帶來了AI人才“大缺口”的凸顯。
據(jù)小編了解,截止到2017年10月,中國AI人才缺口至少在100萬人以上,AI人才平均月薪2.58萬元,遠遠高于一般的技術(shù)類崗位。
網(wǎng)絡(luò)用圖,具體出處不明
小編赤裸裸的羨慕AI 人才“優(yōu)勢薪資”的同時,也就AI人才這個熱議話題與雷濤探討起來!
記者:您覺得我國在人工智能人才方面真的出現(xiàn)了“人才荒”嗎?
雷濤:坦白來說都挺荒的,我們作為一家深耕AI 的公司,如今摸索到了一些路徑,因為有了AI的PaaS化,現(xiàn)在開始大幅度降低人才板塊的難度。
舉個真實的例子。上周末回公司的時候,我看到一個本科畢業(yè)生正在做一個循環(huán)貸模型,看到這個循環(huán)貸模型后,給我的信心很大。我發(fā)現(xiàn)只要他在平臺上,通過有效的指導(dǎo),在統(tǒng)一的AUC評估方法上得到的結(jié)果,與經(jīng)驗豐富的博士沒有多大差異。
硅谷一個概念是數(shù)據(jù)科學(xué)工程,DataScienceEngineering, 將算法算力融合交付的工程。借助這種工程實踐,我們希望能夠形成一些像藍翔技校這樣的機構(gòu)可以培養(yǎng)年輕人很多AI 方面的能力,前提是這些年輕人原來就具備數(shù)理統(tǒng)計的基礎(chǔ),現(xiàn)在提供給他們一套自動化的工具就可以靈活處理數(shù)據(jù)和駕馭算力。
這種過程實際上是可以被透明化的,讓開發(fā)者完全透明化,只要灌輸數(shù)據(jù),通過數(shù)據(jù)本身的表達來形成算法,進而降低人員對數(shù)據(jù),和對數(shù)據(jù)科學(xué)的一些要求。
經(jīng)過這樣一個過程,我們就把AI 人才的門檻兒降下來了,完成了人才的搭建。這個道理就類似于以前一個游戲只能在北美大規(guī)模實驗室里產(chǎn)出,因為只有摩托羅拉和諾基亞才有原生的操作系統(tǒng),才能夠從底層一直寫到屏幕。
用PaaS化的工具完成對AI 人才的牽引,AI的這種能力就會快速的形成,這對整個IT人員的轉(zhuǎn)型和沖擊非常大,逐漸形成“年輕大廚”PK“年長配菜師”的局面。
同時,從這個角度出發(fā),人才的結(jié)構(gòu)也會發(fā)生很大變化,突出表現(xiàn)就是學(xué)數(shù)理統(tǒng)計這一批人的價值會凸現(xiàn)出來。
當(dāng)有工具能力出現(xiàn)的時候,這類人才的市場需求量會很大,相比之下以前那種懂業(yè)務(wù)的,例如ERP流程專家會被大規(guī)模替代。
伴隨這種情況進而會出現(xiàn)一個新的職業(yè),人稱人工智能產(chǎn)品經(jīng)理。
在移動互聯(lián)網(wǎng)和傳統(tǒng)ID時代,產(chǎn)品經(jīng)理強調(diào)流程設(shè)計,商業(yè)實踐的點子,以及用戶體驗等,例如Facebook產(chǎn)品經(jīng)理更多的是關(guān)注用戶的感受。但AI產(chǎn)品經(jīng)理人需要的是能夠把握不同的算法替代不同的流程,也就是商業(yè)流程的再造或重塑。
什么時候該用規(guī)劃算法,什么時候該用分類算法,什么時候該用一個預(yù)測的回歸算法……頭腦中要有清晰的技術(shù)上線與技術(shù)邊界,能夠解決什么問題等。這一類產(chǎn)品經(jīng)理人會賦予未來更多的應(yīng)用智能,這種職業(yè)人才在未來是十分稀缺的。
對于天云大數(shù)據(jù)自己的人才儲備,我們現(xiàn)也做了一些“產(chǎn)學(xué)研”的嘗試,例如開始規(guī)模化試訓(xùn),這個過程中如果政府能夠參與進來,效果會更好。
關(guān)于AI的安全
最近爆出谷歌免費開放給AI設(shè)計者的編程平臺TensorFlow其實有嚴重的安全隱患,一旦被黑客利用后果將不堪設(shè)想……由此引發(fā)的關(guān)于AI 安全的思考又登上了話題熱議榜單。
網(wǎng)絡(luò)用圖,具體出處不明
記者:關(guān)于機器學(xué)習(xí)框架被爆出安全隱患的問題,您是否可以聊一聊AI 的安全?
雷濤:首先TF是個交流和開放的數(shù)據(jù)科學(xué)環(huán)境,它本身不是一個企業(yè)的應(yīng)用平臺,如果把Tensorflow上某個算法直接拿來去做一個企業(yè)應(yīng)用的話,這個想法也太簡單了。
其實谷歌Tensorflow的目標是為了提供一個科學(xué)家相互交換能力的平臺,用數(shù)據(jù)實現(xiàn)一個回歸模型并釋放出來,衡量下是否好用。
如果這個框架直接拿過來在企業(yè)部署內(nèi)完全使用,沒有充分考慮到安全的話,發(fā)生問題就說這個框架存在安全隱患,我覺得說法有點太片面,畢竟谷歌的出發(fā)點不是這個。
安全的問題更多在于企業(yè)自身,這需要企業(yè)去做大量的固化和防護,尤其數(shù)據(jù)方面,安全的挑戰(zhàn)更大。
我覺得應(yīng)該關(guān)注谷歌Tensorflow2周年時提到的方向,即將打算走向分布式的問題,也就是如何將算法從單純強調(diào)精確度,到現(xiàn)在開始考慮算法與數(shù)據(jù)與算力的規(guī)模化融合問題。
在這個問題上,實際上Python作為解釋語言很難做到作業(yè)任務(wù)調(diào)度,所以這個時候也要開始一輪更新的更本質(zhì)native的一些調(diào)動計算資源的方式。換句話說,如何解決算力的問題,部署大規(guī)模的算法,目前有效的方式就是與分布式相關(guān)聯(lián)。
是AI本身的安全性還是利用AI服務(wù)安全?這是兩個問題!
關(guān)于AI服務(wù)安全這方面,差分隱私DifferencialPrivacy就是一個很好的實踐。現(xiàn)在連手機上的信息輸入都會有隱私泄露的風(fēng)險,用AI 保護數(shù)據(jù)隱私就是在本地這個環(huán)節(jié)進行加密,通過AI的方法將數(shù)據(jù)離散、抽樣、加噪音,進而做到將虛擬層面的個體與物理層面的個體相互分離,達成數(shù)據(jù)歸屬“不明”。
因為算法的核心就是個性化,需要解決充足性問題,就不單單是一個簡單的概率,所以必須要借助個性數(shù)據(jù)。只有經(jīng)過上面的分離程序,開發(fā)者才可以利用個性化數(shù)據(jù)完成個性化服務(wù),又可以做到不侵犯個人隱私。
個性數(shù)據(jù)保護有效方法就是從“來源”入手,所以利用這種技術(shù)概念來詮釋AI如何保護個人隱私,是每天都可以操作并切實可行的。
關(guān)于知識圖譜落地金融行業(yè)
知識圖譜最初是由谷歌提出用來優(yōu)化搜索引擎的技術(shù),在不斷發(fā)展中外延一度擴大,目前已經(jīng)助力了很多熱門的人工智能場景應(yīng)用,例如語音助手 Siri,聊天機器人等。
網(wǎng)絡(luò)用圖,具體出處不明
由于金融領(lǐng)域數(shù)據(jù)量以及數(shù)據(jù)類型的龐大多樣,知識圖譜也日漸成為其數(shù)據(jù)處理的主要工具之一,更成為很多大數(shù)據(jù)企業(yè)進軍金融場景的突破口。
記者:現(xiàn)在有很多大數(shù)據(jù)企業(yè),提供企業(yè)級知識圖譜的解決方案并應(yīng)用到金融領(lǐng)域,您覺得知識圖譜助力金融領(lǐng)域做數(shù)據(jù)分析和挖掘的工作,對此有什么看法?
雷濤:知識圖譜或者圖計算或者復(fù)雜網(wǎng)絡(luò),在金融信息工程中應(yīng)用越來越多。
知識圖譜的金融實踐也是逐步發(fā)展的。比如初期技術(shù)上圖計算,實體會用到一些人工定義的方式,從傳統(tǒng)數(shù)據(jù)庫抽取出來,例如工商數(shù)據(jù),或者是自然語言實體抽取的方式。做一個可視化表達面向業(yè)務(wù),或者提供基礎(chǔ)的頂點查詢或距離計算,這是知識圖譜經(jīng)常使用的方法。高階應(yīng)用會涉及到聚類分類機器學(xué)習(xí)等,更大規(guī)模網(wǎng)絡(luò)還會采用Encoding編碼方式的表達來降低運算規(guī)模,比如Node2Vector,deepwalk。
復(fù)雜網(wǎng)絡(luò)會用在很多場景,因為它提供的是一個數(shù)據(jù)基礎(chǔ)緯度的升維化過程,把文件一維的結(jié)構(gòu)、二維的表結(jié)構(gòu)做成一個高維的向量結(jié)構(gòu),它可以表達很多事物隱含的關(guān)聯(lián)關(guān)系,而且可以把關(guān)聯(lián)量化出來。
知識圖譜的表達不僅僅是可視化,更多是量化計算。例如我們在2015年給人民銀行做循環(huán)擔(dān)保的關(guān)聯(lián)系統(tǒng),當(dāng)時構(gòu)建了6000多萬個節(jié)點的規(guī)模,當(dāng)時覺得已經(jīng)很大了,因為把全國范圍內(nèi)所有的有組織機構(gòu)代碼全覆蓋了,但隨后為一線BATJ服務(wù)的復(fù)雜網(wǎng)絡(luò),已經(jīng)達到百億節(jié)點規(guī)模,做更深度的風(fēng)控手段,對黑名單和多頭貸做預(yù)測。
關(guān)于天云的AI之路
據(jù)記者了解,目前業(yè)界已經(jīng)出現(xiàn)能夠?qū)⑺惴芰εc業(yè)務(wù)人員相融合的AI平臺,其中天云大數(shù)據(jù)的MaximAI就是這樣一個平臺的形式。
這個平臺能夠?qū)⒂嬎隳芰Α⒃诰€數(shù)據(jù)、業(yè)務(wù)價值融合在一起,通過AI算法平臺快速建立模型。例如現(xiàn)金分期響應(yīng)模型,預(yù)測篩選辦理此業(yè)務(wù)的高概率客戶,同時幫助銀行等貸款機構(gòu)有效推送現(xiàn)金分期服務(wù);建立循環(huán)授信模型,對客戶行為特征進行分類,并確立客戶對循環(huán)授信響應(yīng)評分等。
記者:是否可以聊一聊,天云大數(shù)據(jù)是如何進入AI 領(lǐng)域的?
雷濤:其實我們一直也沒有從本質(zhì)上離開過AI領(lǐng)域。
早在2011年團隊在云基地時做的第一個大規(guī)模分布式項目,就是運營商的上網(wǎng)內(nèi)容基地,也就是手機報如何區(qū)分出動漫、游戲、音樂等,這是典型的NLP AI項目。
在做這個項目的時候,第一天我們碰到的問題就是分布式和算法的融合,如何面向1.2億用戶行為數(shù)據(jù)的機器學(xué)習(xí)。
其實在早期大數(shù)據(jù)領(lǐng)域,很多大數(shù)據(jù)的廠商屬于BI廠商,他們做報表、可視化,所以給人感覺離AI 還是有些距離的。
其實大數(shù)據(jù)是一個很廣泛的概念。
最早的UC Berkeley大數(shù)據(jù)實驗室是AMPlab,大數(shù)據(jù)的頂級項目Spark就是從這個實驗室流出的,AMP的A首先強調(diào)的就是Algorithm,也就是算法,AMP的M是指Machine算力,Hadoop/NoSQL一類計算棧;P更強調(diào)的是數(shù)據(jù)的商業(yè)化,也就是數(shù)據(jù)怎么生產(chǎn)和流通,通過眾包、交易、定價、流通等方式,所以大數(shù)據(jù)本身是個很廣泛的概念,而AI算法能力是其核心要素。
例如2015年,大型銀行給我們提出的要求是如何對接SAS數(shù)據(jù)挖掘平臺,泰康人壽給我們提出的要求是如何全量數(shù)據(jù)上完成一個聚類分析……其實這些都是有關(guān)機器學(xué)習(xí)的要求,畢竟AI也并不是今天才產(chǎn)生的新鮮事物,我們在業(yè)務(wù)中也一直滲透著做這些工作。
記者:未來會不會利用貴公司在人工智能和大數(shù)據(jù)領(lǐng)域的相關(guān)優(yōu)勢,服務(wù)其它行業(yè)?
雷濤: PaaS本身就是跨行業(yè)的,非常基礎(chǔ)的賦能平臺,因為在Fintech領(lǐng)域用的人最多,這些EarlyAdopter容易接受機器學(xué)習(xí)的建模方法做風(fēng)控定價等業(yè)務(wù)操作,所以我們在這方面先啟動了。
但同時,BI 和AI有顯著不同。BI進入一個行業(yè)中,就要做到比客戶還了解業(yè)務(wù),才能做出KPI,進而做出儀表盤、報表這種決策支持體系。
相比之下,AI是數(shù)據(jù)驅(qū)動的,所以可以部分忽略這些因素,只要滿足對數(shù)據(jù)的的特定要求。簡單來說無論是人臉識別、無人駕駛還是下圍棋,都利用了卷積神經(jīng)網(wǎng)絡(luò)。輸入端特征不完全依靠業(yè)務(wù)定義。
這樣來看,無論輸入黑白落子,還是RGB像素,其實對于算法描述具體業(yè)務(wù)是沒有影響的。所以在BI領(lǐng)域,行業(yè)背景knowhow要求非常高,做零售就做不了制造業(yè),做醫(yī)療肯定不懂金融……但如果采用AI PaaS化平臺這種能力交互,就會發(fā)現(xiàn)問題回歸到了基礎(chǔ)數(shù)學(xué)的特征表達問題,也就跨領(lǐng)域的問題泛化能力更強。
作為專注于大數(shù)據(jù)基礎(chǔ)設(shè)施軟件平臺和分布式人工智能算法的科技創(chuàng)新公司,天云大數(shù)據(jù)自2013年成立即深耕金融科技,如今已經(jīng)是驚喜不斷,我們期待未來繼續(xù)在AI 領(lǐng)域的長足進步。
總結(jié)
以上是生活随笔為你收集整理的连毕马威也看好这家金融科技公司,面对AI不跟风、有理想!的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 浏览器事件模型捕获、冒泡
- 下一篇: 【AI教程】AI基础学习笔记(第3天)