蚂蚁资深算法专家周俊:从原理到落地,支付宝如何打造保护隐私的共享智能?...
中生代技術(shù)
鏈接技術(shù)大咖,分享技術(shù)干貨
全文:6000字
隨著互聯(lián)網(wǎng)技術(shù)發(fā)展,人們對(duì)于隱私保護(hù)的要求不斷提升,世界各國(guó)紛紛都出臺(tái)法律法規(guī)保護(hù)人們的隱私。前段時(shí)間我國(guó)發(fā)布了《民法典》,明確了個(gè)人隱私權(quán)和信息保護(hù)的辦法。而這對(duì)于數(shù)據(jù)時(shí)代的技術(shù)提出了更高要求。
?
本月初,螞蟻資深算法專家周俊在2020年AI開(kāi)發(fā)者大會(huì)上,分享了支付寶如何利用共享智能技術(shù)保護(hù)數(shù)據(jù)安全與用戶隱私,我們將內(nèi)容整理分享給大家。
?
背景介紹
在金融服務(wù)當(dāng)中,核心三要素是場(chǎng)景、數(shù)據(jù)和智能化,在場(chǎng)景里面有大量微貸、保險(xiǎn)、支付、財(cái)富等等相應(yīng)金融場(chǎng)景,由于海量用戶跟場(chǎng)景有大量的交互,所以會(huì)形成大量的數(shù)據(jù)。
?
在金融場(chǎng)景里處理海量數(shù)據(jù)里面臨幾項(xiàng)大挑戰(zhàn):
?
第一是對(duì)時(shí)間敏感,用戶隨著時(shí)間在金融場(chǎng)景下的興趣會(huì)發(fā)生比較大的變化。
?
第二由于交互量很大,所以會(huì)沉淀下來(lái)非常多的數(shù)據(jù),并且數(shù)據(jù)跟傳統(tǒng)電商不太一樣,由于金融業(yè)務(wù)多樣化,有支付、保險(xiǎn)各式各樣的服務(wù),帶來(lái)數(shù)據(jù)本身也有很大多樣性。并且金融場(chǎng)景是互相聯(lián)系的,要想解決保險(xiǎn)、支付、微貸等問(wèn)題,必須站在更高角度,給出系統(tǒng)性的解法。
?
最后是安全和隱私,安全跟隱私是整個(gè)金融服務(wù)邁向智能時(shí)代最關(guān)鍵核心的技術(shù),有了對(duì)安全和數(shù)據(jù)隱私理解之后,才能夠給大家提供更好金融智能服務(wù),才能將普惠金融服務(wù)更多的人。
?
當(dāng)前,各家企業(yè)與機(jī)構(gòu)都積累了大量的數(shù)據(jù),但是由于政策與技術(shù)的原因,數(shù)據(jù)無(wú)法打通,形成了一個(gè)個(gè)的數(shù)據(jù)孤島。打造開(kāi)放平臺(tái)、共享數(shù)據(jù)、創(chuàng)造更大價(jià)值成為了很多互聯(lián)網(wǎng)企業(yè)的一個(gè)迫切的需求。但是,開(kāi)放平臺(tái)的建立需要解決以下幾個(gè)難點(diǎn):
?
第一,數(shù)據(jù)共享在引入巨大價(jià)值的同時(shí),也存在泄露的風(fēng)險(xiǎn)。比如說(shuō)國(guó)外社交網(wǎng)絡(luò)巨頭5000萬(wàn)用戶數(shù)據(jù)隱私泄露事件,告訴我們?nèi)绻麛?shù)據(jù)共享鏈路不安全,會(huì)帶來(lái)巨大的風(fēng)險(xiǎn)。
?
第二,公眾和政府對(duì)隱私保護(hù)和數(shù)據(jù)安全重視程度越來(lái)越高,所以歐盟GDPR法律正式實(shí)施之后,有很多國(guó)家紛紛效仿,立法保護(hù)大家的隱私。
?
第三,對(duì)于整個(gè)金融科技行業(yè)而言,怎么樣設(shè)計(jì)滿足安全、隱私和新監(jiān)管要求下的模式,是擺在所有科技行業(yè)從業(yè)者面前一道難題。
?
作為一個(gè)科技公司,我們迫切希望能有相應(yīng)的技術(shù)承擔(dān)社會(huì)責(zé)任,能夠給到用戶更好、更安全的隱私保護(hù)技術(shù),從而給用戶提供更好的服務(wù)。
?
?
從技術(shù)角度來(lái)抽象我們遇到的問(wèn)題,則是:如何讓各自擁有數(shù)據(jù)的雙方或多方機(jī)構(gòu),在不泄露數(shù)據(jù)隱私的前提下,進(jìn)行數(shù)據(jù)融合建模?
?
在建模里主要有兩個(gè)大場(chǎng)景,一是水平切分,多個(gè)數(shù)據(jù)方之間特征空間是一樣的,每個(gè)數(shù)據(jù)方持有不同的數(shù)據(jù)。二是垂直切分,數(shù)據(jù)方持有不同特征空間,每一小塊都是完整的多維空間。水平切分主要出現(xiàn)在面向C端用戶的場(chǎng)景和一些圖像、語(yǔ)音數(shù)據(jù)的場(chǎng)景,而金融機(jī)構(gòu)之間的合作,則往往以垂直切分為主。
?
怎么樣達(dá)到水平切分和垂直切分情況下構(gòu)建安全保護(hù)隱私聯(lián)合建模方案呢?我們希望達(dá)到三個(gè)目標(biāo),第一隱私數(shù)據(jù)不能出域,第二模型隱私不能泄漏,第三中間交互信息不能反推隱私信息。
?
這里面臨很大挑戰(zhàn),首先隱私保護(hù)機(jī)器學(xué)習(xí)是交叉學(xué)科,它面臨著又要懂機(jī)器學(xué)習(xí)、密碼學(xué),還要對(duì)工程系統(tǒng)有更好理解才能打造夠工業(yè)界的系統(tǒng)。第二,這對(duì)工業(yè)界來(lái)說(shuō)屬于比較前沿的方向,可借鑒的工業(yè)級(jí)方案非常少。第三,對(duì)于工業(yè)界追求安全和效率有一個(gè)平衡,這樣才能更好處理海量用戶和海量數(shù)據(jù)。
螞蟻共享智能主要技術(shù)
我們提出的方案是共享智能隱私保護(hù)解決方案,它需要解決問(wèn)題是多個(gè)參與方,并且每個(gè)參與方跟數(shù)據(jù)方不是信任情況下,能夠聚合多方信息進(jìn)行數(shù)據(jù)分析和機(jī)器學(xué)習(xí)等AI運(yùn)算,并且能夠確保各個(gè)參與方之間隱私不能泄漏、數(shù)據(jù)不能濫用。涉及主要技術(shù)包括可信執(zhí)行環(huán)境、安全多方計(jì)算、差分隱私等技術(shù)。
接下來(lái)看一下技術(shù)主要涉及一些技術(shù)點(diǎn),首先是差分隱私,差分隱私這個(gè)技術(shù)提出來(lái)時(shí)間不短了。顧名思義,差分隱私主要是用來(lái)防范差分攻擊,即攻擊者對(duì)數(shù)據(jù)庫(kù)進(jìn)行多次略有差異的查詢來(lái)推測(cè)出原始數(shù)據(jù)的信息。差分隱私的目標(biāo),就是讓攻擊者在相似數(shù)據(jù)庫(kù)上的查詢結(jié)果難以區(qū)分。那么最常用的方法,就是對(duì)結(jié)果添加噪音。噪音的強(qiáng)度,可以通過(guò)需要隱私保護(hù)的級(jí)別計(jì)算得到。隱私保護(hù)級(jí)別越高,添加的噪音就越大,對(duì)結(jié)果的擾動(dòng)就越大。
?
差分隱私可以有效地保護(hù)計(jì)算結(jié)果的隱私,但是對(duì)于多方聯(lián)合計(jì)算過(guò)程中的隱私保護(hù),還需要用其他的技術(shù)。
?
?
共享智能第二項(xiàng)技術(shù)是可信執(zhí)行環(huán)境,它是基于硬件的解決方案,主要解決兩個(gè)大的問(wèn)題,一個(gè)是內(nèi)存窺探和軟件篡改問(wèn)題,通過(guò)內(nèi)存中開(kāi)辟加密空間,稱為飛地(Enclave)保護(hù)來(lái)自虛擬機(jī)、操作系統(tǒng)和惡意程序的攻擊。其次為了確保軟件篡改涉及遠(yuǎn)程認(rèn)證RA機(jī)制,確保在這里執(zhí)行程序是經(jīng)過(guò)用戶認(rèn)證和授權(quán)的程序,通過(guò)密碼箱飛地的設(shè)計(jì),可以在這里完成大量的保護(hù)隱私計(jì)算。
?
?
第三項(xiàng)是多方安全計(jì)算技術(shù),包括秘密分享、同態(tài)加密和混淆電路。用的比較多的有兩個(gè),一個(gè)是秘密分享,秘密分享通過(guò)原始數(shù)據(jù)隨機(jī)拆分,得到密態(tài)數(shù)據(jù)之后,多方協(xié)同密態(tài)下面進(jìn)行計(jì)算,之后得到相應(yīng)計(jì)算結(jié)果,整個(gè)優(yōu)勢(shì)是計(jì)算復(fù)雜度比較小,因?yàn)橛写罅棵軕B(tài)數(shù)據(jù)交互,所以網(wǎng)絡(luò)通訊比較大,同時(shí)需要多個(gè)參與方參與。
?
第二同態(tài)加密,在密態(tài)下面對(duì)密態(tài)數(shù)據(jù)進(jìn)行加密,在密態(tài)下面進(jìn)行計(jì)算得到結(jié)果,跟明文下得到結(jié)果是一樣的,通過(guò)這樣一個(gè)原理來(lái)實(shí)現(xiàn)密態(tài)下計(jì)算得到相應(yīng)結(jié)果,相對(duì)來(lái)說(shuō)計(jì)算復(fù)雜度要大,因?yàn)榧訙p密計(jì)算復(fù)雜度是非常高的,但是網(wǎng)絡(luò)通訊相對(duì)比較少,因?yàn)橹虚g只需要單次通訊就OK了。
?
這兩個(gè)技術(shù)中間有很強(qiáng)的安全性和封閉性,安全性是這里沒(méi)有任何信息泄漏,可以很好進(jìn)行復(fù)合運(yùn)算。
共享智能實(shí)施架構(gòu)概述
介紹完前面背景信息和主要技術(shù)之后,我們看一下共享智能怎么實(shí)施,怎么用技術(shù)解決前面提到的核心問(wèn)題。
?
基于TEE的共享智能
首先是基于TEE共享智能,首先利用SGX搭建分布式的TEE可信計(jì)算環(huán)境,里面有相應(yīng)計(jì)算模塊和認(rèn)證模塊,各個(gè)參與方之間相應(yīng)的數(shù)據(jù)密文傳到可信計(jì)算環(huán)境中完成分布式的計(jì)算。
?
這里面有幾個(gè)關(guān)鍵技術(shù)點(diǎn),怎么樣搭建出來(lái)可信異構(gòu)計(jì)算集群,第二怎么在可信計(jì)算環(huán)境實(shí)現(xiàn)各式各樣機(jī)器學(xué)習(xí)的框架,從而達(dá)到實(shí)現(xiàn)機(jī)器學(xué)習(xí)的完整工作流。它的優(yōu)勢(shì)是集中式部署,所以部署計(jì)算效率相對(duì)比較高,第二安全性比較高,即使集群里存在惡意的服務(wù)器也有比較好的防護(hù)能力,并且支持所有算法,這是TEE共享智能的優(yōu)勢(shì)。
?
?
如何搭建TEE可信集群呢?我們的目標(biāo)是對(duì)普通用戶提供和單機(jī)一樣的可信執(zhí)行環(huán)境,通過(guò)原來(lái)方式進(jìn)行管理,將數(shù)據(jù)通過(guò)認(rèn)證方式傳到可信執(zhí)行環(huán)境進(jìn)行相應(yīng)計(jì)算。里面有幾個(gè)點(diǎn),一是密鑰同步中心,通過(guò)密鑰同步中心用戶只需要和同步中心做認(rèn)證,由同步中心完成集群中其他節(jié)點(diǎn)的認(rèn)證,而不需要用戶自己與集群中所有節(jié)點(diǎn)做認(rèn)證。第二,Kubernetes云原生技術(shù),可以很好的實(shí)現(xiàn)負(fù)載均衡、故障轉(zhuǎn)移的機(jī)制,使得可信執(zhí)行環(huán)境本身具備負(fù)載均衡,動(dòng)態(tài)擴(kuò)縮容特性,從而更好支持復(fù)雜計(jì)算和大數(shù)據(jù)計(jì)算能力,有了復(fù)雜計(jì)算和大數(shù)據(jù)計(jì)算能力,從而更好實(shí)現(xiàn)各式各樣分布式AI計(jì)算能力。
?
?
有了可信計(jì)算環(huán)境之后,我們看一下怎么實(shí)現(xiàn)大規(guī)模分布式XGB的算法。在上圖中,首先數(shù)據(jù)提供方通過(guò)兩個(gè)飛地將數(shù)據(jù)傳到可信計(jì)算集群里,在集群里對(duì)XGB進(jìn)行了相應(yīng)的改造,一是所以模型訓(xùn)練的計(jì)算都在飛地中完成,保證計(jì)算時(shí)數(shù)據(jù)安全;第二飛地之間的通訊通過(guò)TLS進(jìn)行加密,保證了通信的安全;第三對(duì)飛地中的內(nèi)存訪問(wèn)做了Oblivious加固,以防御側(cè)信道攻擊。通過(guò)這樣方式得到分布式XGB模型,在模型發(fā)布的時(shí)候同樣通過(guò)權(quán)限控制方式,使模型發(fā)布也是安全的。
?
所以從數(shù)據(jù)提供到訓(xùn)練最后到模型發(fā)布,整個(gè)端到端的過(guò)程都是高安全的。我們通過(guò)構(gòu)造了分布式可信質(zhì)量空間跟算法進(jìn)行加固之后,使得大規(guī)模數(shù)據(jù)在這樣一個(gè)框架里可以實(shí)現(xiàn)多種機(jī)器學(xué)習(xí)算法,比如神經(jīng)網(wǎng)絡(luò)等方法都可以,同時(shí)因?yàn)橹虚g每一步都進(jìn)行了安全加固,所以整個(gè)過(guò)程是安全可信的。
?
基于MPC的共享智能
第二是基于MPC的共享智能技術(shù),它主要通過(guò)多個(gè)協(xié)作方之間傳遞隨機(jī)數(shù)和加密數(shù)的方式完成神經(jīng)網(wǎng)絡(luò)或者模型構(gòu)建,所有模型本身都是加密,在密態(tài)計(jì)算空間完成計(jì)算,主要會(huì)涉及秘密分享、同態(tài)加密和混淆電路等技術(shù)。
?
這里關(guān)鍵技術(shù)是密態(tài)存儲(chǔ)和計(jì)算,并且確保這些機(jī)器學(xué)習(xí)算法的安全性,不會(huì)泄露信息,在確保安全性之后高效實(shí)現(xiàn)大規(guī)模深度學(xué)習(xí)算法。它的優(yōu)勢(shì)是數(shù)據(jù)不需要出域,安全性非常高,這里由于算法復(fù)雜度比較高,對(duì)于加密函數(shù)的性能消耗是非常高的,部分實(shí)現(xiàn)難度也很大,因?yàn)閜arty A和party B都需要進(jìn)行部署,降低部署成本也是需要解決的問(wèn)題。
?
?
為了解決這個(gè)問(wèn)題,我們搭出了這樣一個(gè)架構(gòu)。主要分了這么幾層,最底層是密碼學(xué)的原語(yǔ),通過(guò)秘密分享、同態(tài)加密、混淆電路密碼學(xué)的原語(yǔ),同時(shí)對(duì)底下密碼學(xué)原語(yǔ)進(jìn)行了工程效率優(yōu)化,使得原語(yǔ)本身有更高的效率。基于密碼學(xué)原理之上,測(cè)算出來(lái)像矩陣加法、矩陣乘法、數(shù)值比較、安全求交的安全算子層,在這之上通過(guò)DSL的分裝提供了類似Python語(yǔ)言給算法層實(shí)現(xiàn)類似于線性模型、樹(shù)模型、深度模型和圖神經(jīng)網(wǎng)絡(luò)先進(jìn)模型,從而更好利用底下三層能力,實(shí)現(xiàn)安全版本保護(hù)的隱私學(xué)習(xí)。
?
?
我們來(lái)看一個(gè)具體神經(jīng)網(wǎng)絡(luò)的例子,業(yè)界在這個(gè)問(wèn)題上主要有兩種做法。一種稱為安全神經(jīng)網(wǎng)絡(luò),這種方法把訓(xùn)練數(shù)據(jù)轉(zhuǎn)成密態(tài)存儲(chǔ),所有的訓(xùn)練過(guò)程都由密態(tài)完成,這個(gè)方法當(dāng)然很安全,但是計(jì)算效率非常低,不具實(shí)用性。另一種方法稱為拆分學(xué)習(xí),這個(gè)方法是數(shù)據(jù)提供方基于自己的數(shù)據(jù)單獨(dú)訓(xùn)練幾層網(wǎng)絡(luò),之后集中到一個(gè)中心化節(jié)點(diǎn)上做后續(xù)網(wǎng)絡(luò)的聯(lián)合訓(xùn)練,這個(gè)方法雖然效率高,但是由于淺層網(wǎng)絡(luò)由數(shù)據(jù)提供方自己訓(xùn)練,無(wú)法聯(lián)通全局?jǐn)?shù)據(jù),所以在模型效果上大打折扣。
?
我們提出的基于共享智能的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)框架方案能夠更好保護(hù)隱私,并且效率也比較高,在安全、效率、效果之間取得比較好的折中。
?
具體方式是,數(shù)據(jù)擁有方之間通過(guò)多方計(jì)算能夠更安全計(jì)算出一個(gè)中間結(jié)果,對(duì)這個(gè)中間結(jié)果能夠比較好實(shí)現(xiàn)特征之間交互,有了特征之間交互放到一個(gè)服務(wù)器上,進(jìn)行隱層相關(guān)計(jì)算。
?
我們提出了基于對(duì)抗學(xué)習(xí)的防御機(jī)制。該防御機(jī)制目的是讓數(shù)據(jù)擁有者自己訓(xùn)練一個(gè)防御者模型,目的是模擬攻擊者的行為,即盡可能的訓(xùn)練一個(gè)模型用于恢復(fù)出各自的輸入,如上圖所示。基于這個(gè)框架能搭出DNN、CNN、RNN、GNN等深度學(xué)習(xí)的模型,并且也有多篇高質(zhì)量頂會(huì)論文產(chǎn)出,有了這個(gè)框架之后能夠更好實(shí)現(xiàn)隱私保護(hù)神經(jīng)網(wǎng)絡(luò)。
?
?
前面講了MPC下共享智能主要依賴于混合協(xié)議密態(tài)計(jì)算,怎么設(shè)計(jì)出來(lái)更高效的混合協(xié)議密態(tài)計(jì)算呢?這是我們?cè)O(shè)計(jì)出來(lái)相應(yīng)密態(tài)計(jì)算協(xié)議框架,相對(duì)已經(jīng)有框架如ABY框架,一是比較靈活,可以在同態(tài)加密和秘密分享之下進(jìn)行相應(yīng)轉(zhuǎn)換。第二比較高效,提供DSL的語(yǔ)言提高開(kāi)發(fā)效率,自動(dòng)進(jìn)行轉(zhuǎn)換,不需要關(guān)注在哪個(gè)協(xié)議進(jìn)行轉(zhuǎn)換,這樣算法開(kāi)發(fā)同學(xué)可以很好屏蔽密態(tài)計(jì)算特性。第三,給出算法分析和證明,有了這樣一個(gè)設(shè)計(jì)之后能夠很好支持各式各樣機(jī)器學(xué)習(xí)的算法。
?
?
介紹完共享智能技術(shù)架構(gòu)進(jìn)展后,下面來(lái)介紹一下共享智能在技術(shù)影響力方面的一些進(jìn)展。
?
首先是專利方面,今年5月份第三方機(jī)構(gòu)發(fā)布全球新興隱私技術(shù)發(fā)明專利數(shù)量,可以看到阿里巴巴加上支付寶有419個(gè)專利,共享智能團(tuán)隊(duì)貢獻(xiàn)了其中的165個(gè)。同時(shí),這兩年共享智能受到中國(guó)計(jì)算機(jī)協(xié)會(huì)、世界人工智能大會(huì)等專業(yè)機(jī)構(gòu)、權(quán)威學(xué)術(shù)團(tuán)隊(duì)和科研機(jī)構(gòu)的認(rèn)可,在國(guó)際標(biāo)準(zhǔn)和聯(lián)盟標(biāo)準(zhǔn),以及國(guó)家層面取得相關(guān)認(rèn)證,讓技術(shù)更好地在行業(yè)落地。
?
共享智能落地案例探討
在過(guò)去幾年,共享智能在多個(gè)實(shí)際項(xiàng)目中得到應(yīng)用。在共享智能業(yè)務(wù)落地的用戶關(guān)注點(diǎn)方面,比較TEE和MPC的訓(xùn)練和預(yù)測(cè)方案,可以看到它們各有優(yōu)劣。在用戶感受到的安全感方面,MPC方面數(shù)據(jù)不用出域,安全感更強(qiáng),但在成本、性能和功能方面,TEE方案的表現(xiàn)要比MPC方案更好。
?
在我們的實(shí)踐過(guò)程中發(fā)現(xiàn),TEE和MPC在同一個(gè)項(xiàng)目中可以做一些結(jié)合。比如用TEE訓(xùn)練接MPC預(yù)測(cè),可以降低前期評(píng)估成本;用TEE為MPC加速,可以提升MPC的性能;甚至我們還可以把MPC協(xié)議放到TEE里執(zhí)行,可以進(jìn)一步的提升安全等級(jí)。通過(guò)選擇不同方案,可以給用戶提供更安全,成本更低,性能跟效果更好的隱私計(jì)算方案。
?
?
在具體案例方面,首先介紹一下共享智能×中和農(nóng)信案例。中和農(nóng)信是中國(guó)農(nóng)村做普惠金融最大機(jī)構(gòu)之一,主要服務(wù)比較偏遠(yuǎn)山區(qū)的農(nóng)民,大部分農(nóng)民以前沒(méi)有享受過(guò)金融服務(wù),我們通過(guò)中和農(nóng)信希望能夠讓它服務(wù)更多偏遠(yuǎn)山區(qū)農(nóng)民。
?
原來(lái)傳統(tǒng)方法是讓信貸員通過(guò)線下信貸走訪方式,去收集信息,然后去判定這個(gè)用戶是不是應(yīng)該享受這個(gè)服務(wù),這種方式人力成本高、速度比較慢,一個(gè)用戶大概需要花一個(gè)多月時(shí)間才能看能不能得到服務(wù),同時(shí)可拓展范圍比較有限。
?
通過(guò)共享智能的技術(shù),能夠讓金融服務(wù)從原來(lái)一個(gè)月降到5分鐘,同時(shí)違約率大幅下降,使更多農(nóng)民在家里就能夠更好享受普惠金融農(nóng)村服務(wù)。
?
第二個(gè)案例,是江蘇銀行使用MPC共享智能聚合雙方信息,提供更好聯(lián)合模型改進(jìn)模型的性能,使得合作方能夠更精準(zhǔn)判定給予更好的決策結(jié)果。
?
?
第三個(gè)案例是聯(lián)合風(fēng)控,將螞蟻安全能力通過(guò)共享智能分享到外界,能夠?qū)L(fēng)控模型量化策略和實(shí)時(shí)計(jì)算能力通過(guò)跟外部機(jī)構(gòu)進(jìn)行共建模型、共建樞紐、共同決策的方式,提高風(fēng)險(xiǎn)管控的效率,在反欺詐、虛假交易、團(tuán)伙作案打擊上面提供更有效的方式,使得生態(tài)伙伴能夠有更強(qiáng)的能力。通過(guò)共享智能聯(lián)合風(fēng)控方式使得雙方平均交易額,每可以新增1500萬(wàn)以上,并且整個(gè)風(fēng)險(xiǎn)防控性能準(zhǔn)確率提升30%以上,月均資損率降低90%,通過(guò)這樣技術(shù)方案將螞蟻安全能力提供給全社會(huì)、整個(gè)行業(yè),讓整個(gè)行業(yè)更好利用螞蟻安全能力構(gòu)造更安全、更加好的服務(wù)。
?
共享智能未來(lái)展望
對(duì)于共享智能的未來(lái),我們的愿景是,讓共享智能成為未來(lái)數(shù)據(jù)共享的基礎(chǔ)設(shè)施。
?
?
我們希望能搭建出來(lái)一張數(shù)據(jù)或者信息網(wǎng)絡(luò),通過(guò)多方安全計(jì)算、差分隱私、可信執(zhí)行環(huán)境的技術(shù),能夠比較好將各式各樣數(shù)據(jù)商、保險(xiǎn)商、傳統(tǒng)金融機(jī)構(gòu)等,還有政府機(jī)構(gòu)等各式各樣的數(shù)據(jù)連通起來(lái),能夠更好保護(hù)隱私和數(shù)據(jù)安全,同時(shí)將數(shù)據(jù)聯(lián)合起來(lái)獲得更好的智能化效果。
?
有了數(shù)據(jù)網(wǎng)絡(luò)之后,在這基礎(chǔ)之上提供幾個(gè)大核心能力。一是共享分析BI能力,我們知道AI預(yù)測(cè)之前,需要做數(shù)據(jù)處理、數(shù)據(jù)分析、自動(dòng)建模等等相關(guān)操作,我們希望這樣操作能夠含在共享分析技術(shù)里面,通過(guò)安全版本生命周期,提供給數(shù)據(jù)分析方,讓他們?cè)诓桓兄容^復(fù)雜密態(tài)隱私技術(shù)情況下,能夠很好進(jìn)行共享分析。有了BI能力之后,能夠更好構(gòu)建模型,不怎么損失模型精度,同時(shí)能更進(jìn)一步提升模型速度。我們希望通過(guò)密碼學(xué)、工程系統(tǒng)的研究以及算法優(yōu)化,能夠使得整個(gè)過(guò)程中AI能力能夠更強(qiáng),更友好高效提供給外部合作方。同時(shí)在信息融合方面,我們希望能共建共享圖譜,將用戶積累下來(lái)經(jīng)驗(yàn)、知識(shí)沉淀下來(lái),產(chǎn)生更高效、更準(zhǔn)確、更能保護(hù)隱私的知識(shí)圖譜。
?
通過(guò)共享平臺(tái),我們可以更好服務(wù)業(yè)務(wù)。包括今天已經(jīng)在做的聯(lián)合風(fēng)控、聯(lián)合營(yíng)銷、聯(lián)合政務(wù)、聯(lián)合醫(yī)療等。能夠解決社會(huì)民生中的一些核心棘手問(wèn)題。
?
在技術(shù)側(cè),我們希望通過(guò)DSL+編譯器,能夠讓算法同學(xué)研發(fā)更加高效,讓很多AI算法通過(guò)DSL和編譯器直接轉(zhuǎn)成安全版本的AI技術(shù),使得開(kāi)發(fā)效率進(jìn)一步提升。在接入成本上面,我們希望通過(guò)更好產(chǎn)品化,統(tǒng)一化運(yùn)維部署,降低成本,讓整個(gè)產(chǎn)品迭代更快、運(yùn)維成本更低、一鍵部署能力更強(qiáng)。計(jì)算能力上面,希望在算法、工程、協(xié)議三者協(xié)同優(yōu)化,使系統(tǒng)的計(jì)算方面有進(jìn)一步的提升,使能力更完備,我們希望讓隱私計(jì)算AI能力跟明文計(jì)算AI能力一樣,甚至做得更好。
?
業(yè)務(wù)側(cè)我們希望跟更多機(jī)構(gòu)合作立下標(biāo)桿,并且建立共享智能技術(shù)聯(lián)盟,能夠更好的應(yīng)用和分享共享智能技術(shù),同時(shí)期望能夠收到更多反饋,形成正向循環(huán),從而推動(dòng)相應(yīng)標(biāo)準(zhǔn)的建設(shè)。同時(shí)在規(guī)模層面,和相關(guān)機(jī)構(gòu)進(jìn)一步合作,擴(kuò)大技術(shù)應(yīng)用規(guī)模,實(shí)現(xiàn)共享智能成為未來(lái)數(shù)據(jù)共享的基礎(chǔ)設(shè)施。
-?END?-
推薦閱讀
阿里巴巴閑魚(yú)架構(gòu)負(fù)責(zé)人王樹(shù)彬:萬(wàn)億交易規(guī)模技術(shù)架構(gòu)實(shí)踐2020-09-05
58轉(zhuǎn)轉(zhuǎn)技術(shù)總監(jiān)駱俊武:監(jiān)控系統(tǒng)選型?必讀本篇!2020-09-04
螞蟻集團(tuán)高級(jí)架構(gòu)師郭援非:分布式數(shù)據(jù)庫(kù)是金融機(jī)構(gòu)數(shù)字化轉(zhuǎn)型的最佳路徑2020-09-03
平安銀行吳建峰:RocketMQ 在銀行的應(yīng)用和實(shí)踐2020-09-01
阿里高級(jí)技術(shù)專家張建飛:應(yīng)用架構(gòu)分離業(yè)務(wù)邏輯和技術(shù)細(xì)節(jié)之道2020-08-31
知道創(chuàng)宇總監(jiān)姚昌林:敏捷開(kāi)發(fā)-如何打破研發(fā)交付過(guò)程中的“墻”2020-08-28
天弘基金首席架構(gòu)師李鑫:微服務(wù)接口限流的算法及架構(gòu)實(shí)現(xiàn)2020-08-25
阿里P9專家右軍:大話軟件質(zhì)量穩(wěn)定性2020-08-03
阿里高級(jí)技術(shù)專家邱小俠:微服務(wù)架構(gòu)的理論基礎(chǔ) - 康威定律2020-05-09
阿里技術(shù)專家三畫(huà):如何畫(huà)出一張合格的技術(shù)架構(gòu)圖?2020-03-16
阿里高級(jí)技術(shù)專家簫逸:如何畫(huà)好一張架構(gòu)圖? 2020-09-07
? ?END ? ?? #接力技術(shù),鏈接價(jià)值# 點(diǎn)分享點(diǎn)點(diǎn)贊點(diǎn)在看
總結(jié)
以上是生活随笔為你收集整理的蚂蚁资深算法专家周俊:从原理到落地,支付宝如何打造保护隐私的共享智能?...的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 图解 Kafka,看本篇就足够啦
- 下一篇: hdu - 4027 Can you a