Open Set Domain Adaptation 开集领域适应
1. Motivation
2017年ICCV上發表了一篇題為OpenSetDomainAdaptationOpen Set Domain AdaptationOpenSetDomainAdaptation[1]的論文說:一般我們所講的領域適應(domain adaptation)是在一個閉集(close set)的前提條件下進行的,即源域和目標與擁有相同的標簽類別。但是在大多數的實際情況中,源域和目標域可能只共享了一部分相同類別。如圖1所示(圖片來源于文獻[1]),在Close set domain adaptation問題中,目標與中出現的標簽類別全在源域中出現了,而在Open set domain adaptation問題中,目標域中出現的摩托車、電視、飛機等均未在源域中出現;相反,源域中出現的鳥、筆記本、杯子也未在目標域中出現。
顯然domain adaptation in close set中的方法不能用于解決domain adaptation in open set問題,在進行特征對齊的時候只能對其已知的類別,不能對齊未知的類別。
隨后,在2018年ECCV上有一篇論文Open Set Domain Adaptation by Backpropagation,對Open-set domain adaptation進行了重新定義,
2. Method
為解決Open Set問題,作者提出了Open Set Domain Adaptation方法,步驟如下:
( a ) 源域中包含已知帶標簽的樣本(分別用紅、藍、綠以及不同形狀表示)和未知樣本(灰色表示),而目標域中不包含任何標簽信息;
( b ) 首先,我們為一些目標樣本分配類別標簽,留下未標記的異常樣本;
( c ) 通過減小標記為同一類別的源域和目標域數據之間的距離,我們可以學習到從源域到目標域的映射關系。將( b )和( c )反復迭代,直到源域與目標域之間的距離收斂到局部最小值;
( d ) 為了個目標域的樣本打上標簽(紅色,綠色,藍色和灰色(未知類別)),我們在已經映射到目標域的源域數據上學習分類器,并用它來分類目標域樣本。
####2.1 Unsupervised Domain Adaptation
源域數據:CCC個類別,其中∣C?1∣\left | C-1\right |∣C?1∣個已知,1個未知
目標域數據:T={T1,T2,...,TT}\mathcal{T}=\left \{T_1, T_2, ...,T_{\mathcal{T}}\right \}T={T1?,T2?,...,TT?}
目標:給目標域中的每一個數據T\mathcal{T}T打上標簽c∈Cc \in Cc∈C
損失函數:將目標域樣本TtT_tTt?標記為標簽ccc的損失函數記為:dct=∥Sc?Tt∥22d_{ct}=\left \| S_{c}-T_{t}\right \|_{2}^{2}dct?=∥Sc??Tt?∥22?,其中TtT_{t}Tt?是目標域樣本t的特征表達,ScS_{c}Sc?是源域中標簽為ccc的樣本的均值。這里采用的是樣本一階矩來度量兩個分布間差異,當然我們是希望dctd_{ct}dct?越小越好,表明給目標域數據TcT_{c}Tc?的標簽越接近真實標簽。
為了增加模型的魯棒性,這里并不會為目標域中的沒有一個樣本都分配一個標簽ccc,而是引入了異常值oto_{t}ot?,整個模型的優化目標如下:
其中xctx_{ct}xct?和oto_{t}ot?是兩個二值變量,他們要么是0要么是1。當xctx_{ct}xct?為0 ,oto_{t}ot?為1表明目標域中的該樣本為異常值,反之亦然。第二個約束條件確保至少有一個樣本被標記為了標簽ccc。所以最終的目標是確保目標域中所有樣本的dctd_{ct}dct?與oto_{t}ot?的和最小。
2.2 Semi-supervised Domain Adaptation
當目標域有一小部分標記數據之后無監督問題可以變成一個半監督問題。要處理semi-supervised情況,只需要在現有的unsupervised情況下,添加那些有label的target的約束信息。作者為了達到這個目的,引入了一個新的變量xc^tt=1,?(t,c^t)∈Lx_{\hat{c}_{t}t} = 1,\forall (t,\hat{c}_{t})\in \mathcal{L}xc^t?t?=1,?(t,c^t?)∈L,其中L\mathcal{L}L表示帶目標域帶標簽樣本集,c^t\hat{c}_{t}c^t?表示目標域樣本ttt的標簽。該項表示所有已有標簽的目標域樣本不改變其標簽。目標函數就變成了:
其中,dcc′=∥Sc?Sc′∥22d_{cc'}=\left \| S_{c}-S_{c'}\right \|_{2}^{2}dcc′?=∥Sc??Sc′?∥22?,它表示當樣本ttt的臨近點 中有臨近點NtN_{t}Nt?被分配到另一類的時候,額外加上一個類間的距離差作為損失。
2.3 Mapping
我們假設有一個線性變換,可以估計出源域到目標域的映射關系,用一個矩陣W∈RD×DW \in \mathbb{R}^{D \times D}W∈RD×D。損失函數如下:
對WWW求偏導可以求出使f(W)f(W)f(W)最小的WWW。
本文原載于我的簡書
References:
[1] Busto, P. P. , and J. Gall . “Open Set Domain Adaptation.” IEEE International Conference on Computer Vision IEEE, 2017.
[2] 《小王愛遷移》系列之九:開放集遷移學習(Open Set)
總結
以上是生活随笔為你收集整理的Open Set Domain Adaptation 开集领域适应的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 微步在线安全事件分析:全球数亿主机被Fi
- 下一篇: Learning Transferabl