MindArmour差分隐私
MindArmour差分隱私
總體設(shè)計(jì)
MindArmour的Differential-Privacy模塊,實(shí)現(xiàn)了差分隱私訓(xùn)練的能力。模型的訓(xùn)練主要由構(gòu)建訓(xùn)練數(shù)據(jù)集、計(jì)算損失、計(jì)算梯度以及更新模型參數(shù)等過程組成,目前MindArmour的差分隱私訓(xùn)練主要著力于計(jì)算梯度的過程,通過相應(yīng)的算法對(duì)梯度進(jìn)行裁剪、加噪等處理,從而保護(hù)用戶數(shù)據(jù)隱私。
圖1 差分隱私總體設(shè)計(jì)
圖1是差分隱私訓(xùn)練的總體設(shè)計(jì),主要由差分隱私噪聲機(jī)制(DP Mechanisms)、差分隱私優(yōu)化器(DP Optimizer)、差分隱私監(jiān)控器(Privacy Monitor)組成。
差分隱私優(yōu)化器
差分隱私優(yōu)化器繼承了MindSpore優(yōu)化器的能力,并使用差分隱私的噪聲機(jī)制,對(duì)梯度加擾保護(hù)。目前,MindArmour提供三類差分隱私優(yōu)化器:固定高斯優(yōu)化器、自適應(yīng)高斯優(yōu)化器、自適應(yīng)裁剪優(yōu)化器,每類差分隱私優(yōu)化器,從不同的角度為SGD、Momentum等常規(guī)優(yōu)化器,增加差分隱私保護(hù)的能力。
固定高斯優(yōu)化器,是一種非自適應(yīng)高斯噪聲的差分隱私優(yōu)化器。其優(yōu)勢(shì)在于可以嚴(yán)格控制差分隱私預(yù)算?,缺點(diǎn)是在模型訓(xùn)練過程中,每個(gè)Step添加的噪聲量固定,若迭代次數(shù)過大,訓(xùn)練后期的噪聲使得模型收斂困難,甚至導(dǎo)致性能大幅下跌,模型可用性差。
自適應(yīng)高斯優(yōu)化器,通過自適應(yīng)調(diào)整標(biāo)準(zhǔn)差,來調(diào)整高斯分布噪聲的大小,在模型訓(xùn)練初期,添加的噪聲量較大,隨著模型逐漸收斂,噪聲量逐漸減小,噪聲對(duì)于模型可用性的影響減小。自適應(yīng)高斯噪聲的缺點(diǎn)是不能嚴(yán)格控制差分隱私預(yù)算。
自適應(yīng)裁剪優(yōu)化器,是一種自適應(yīng)調(diào)整調(diào)整裁剪粒度的差分隱私優(yōu)化器,梯度裁剪是差分隱私訓(xùn)練的一個(gè)重要操作,自適應(yīng)裁剪優(yōu)化器能夠自適應(yīng)的控制梯度裁剪的的比例,在給定的范圍波動(dòng),控制迭代訓(xùn)練過程中梯度裁剪的粒度。
差分隱私的噪聲機(jī)制
噪聲機(jī)制是構(gòu)建差分隱私訓(xùn)練能力的基礎(chǔ),不同的噪聲機(jī)制滿足不同差分隱私優(yōu)化器的需求,包括固定高斯分布噪聲、自適應(yīng)高斯分布噪聲、自適應(yīng)裁剪高斯分布噪聲、拉普拉斯分布噪聲等多種機(jī)制。
Monitor
Monitor提供RDP、ZCDP等回調(diào)函數(shù),用于監(jiān)測(cè)模型的差分隱私預(yù)算。
ZCDP[2]
ZCDP,zero-concentrated differential privacy,是一種寬松的差分隱私定義,利用Rényi散度來度量隨機(jī)函數(shù)在相鄰數(shù)據(jù)集上的分布差異。
RDP[3]
RDP,Rényi Differential Privacy,是一種更通用的基于R’enyi散度的差分隱私定義,利用Rényi散度來度量?jī)蓚€(gè)相鄰數(shù)據(jù)集的分布差異。
相對(duì)于傳統(tǒng)差分隱私,ZCDP和RDP都能能夠提供更加嚴(yán)格的隱私預(yù)算上界保證。
代碼實(shí)現(xiàn)
mechanisms.py:這個(gè)文件實(shí)現(xiàn)了差分隱私訓(xùn)練所需的噪聲生成機(jī)制,包括簡(jiǎn)單高斯噪聲、自適應(yīng)高斯噪聲、自適應(yīng)裁剪高斯噪聲等。
optimizer.py:這個(gè)文件實(shí)現(xiàn)了使用噪聲生成機(jī)制在反向傳播時(shí)添加噪聲的根本邏輯。
monitor.py:實(shí)現(xiàn)了計(jì)算差分隱私預(yù)算的回調(diào)函數(shù),模型訓(xùn)練過程中,會(huì)反饋當(dāng)前的差分隱私預(yù)算。
model.py:這個(gè)文件實(shí)現(xiàn)了計(jì)算損失和梯度的邏輯,差分隱私訓(xùn)練的梯度截?cái)噙壿嬙诖宋募袑?shí)現(xiàn),且model.py是用戶使用差分隱私訓(xùn)練能力的入口。
參考文獻(xiàn)
[1] Dwork, Cynthia, and Jing Lei. “Differential privacy and robust statistics.” Proceedings of the forty-first annual ACM symposium on Theory of computing. 2009.
[2] Lee, Jaewoo, and Daniel Kifer. “Concentrated differentially private gradient descent with adaptive per-iteration privacy budget.” Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2018.
[3] Mironov, Ilya. “Rényi differential privacy.” 2017 IEEE 30th Computer Security Foundations Symposium (CSF). IEEE, 2017.
總結(jié)
以上是生活随笔為你收集整理的MindArmour差分隐私的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MindSpore静态图语法支持
- 下一篇: MindSpore图像分类模型支持(Li