當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

HGD处理对抗样本以防御对抗攻击

發布時間：2024/1/18 编程问答 50 豆豆

生活随笔收集整理的這篇文章主要介紹了 HGD处理对抗样本以防御对抗攻击小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

背景

對抗樣本通過向原始圖像添加噪聲來構造，使得輸入模型后分類錯誤。如果在對抗樣本輸入模型之前，進行去噪處理，將攻擊者千方百計添加到原始圖像上的輕微干擾去除，則可以得到與原始圖像近似的去噪后圖像，從而分類依舊正確。

之前提出像素導向去噪器PGD（pixel guided denoiser），令 $x$ 表示原始的干凈圖像， $x^*$ 表示對抗樣本， $x^{'}$ 表示去噪后的圖像。將損失函數定義為 $L = ∣ ∣ x ? x^{'} ∣ ∣$ ，表示去噪后的圖像與原始圖像之間的差異。其中， $∣ ∣ . ∣ ∣$ 表示 $L_1$ 范數。由于該損失函數是定義在圖像像素級別上的，因此命名為像素導向去噪器。

然而PGD有一個致命缺陷。去噪是相對性的，并不是絕對的，無論去噪過程多完善，總會存在殘余的噪聲在圖像上。而在DNN中，存在誤差放大效應。即殘余的對抗噪聲在一層層中會被放大，使得最后的輸出存在的噪聲仍足以使DNN分類錯誤。

因此，作者提出了HGD高級表示指導去噪器（High-Level Representation Guided Denoiser）。

HGD

原理

由于DNN存在誤差放大效應，故將損失函數定義在輸出層上。
令 $y$ 表示原始的干凈圖像通過DNN后的輸出， $y^*$ 表示對抗樣本的輸出， $y^{'}$ 表示去噪后的圖像的輸出。將損失函數定義為 $L = ∣ ∣ y ? y^{'} ∣ ∣$ ，表示去噪后的圖像與原始圖像的對應輸出之間的差異。HGD的目標是，追求損失函數的最小化。損失函數越小，說明去噪后圖像與原圖像的輸出差異越小，越接近初始圖像，去噪效果越好。