1. 程式人生 > >Open Set Domain Adaptation 開放集域適應

Open Set Domain Adaptation 開放集域適應

論文地址:
http://openaccess.thecvf.com/content_ICCV_2017/papers/Busto_Open_Set_Domain_ICCV_2017_paper.pdf。

簡介

開放集域適應,何謂開放集?既然是Open Set,那麼也應該有個對應的Closed Set,是的。作者用下一幅圖解釋了這兩個概念:

Closed Set閉集的假設是目標域和源域包含了同一組物件類的影象。然後Open Set開放集則假設目標域與源域的物件類別可能並不都相同,同時,目標域中可能包含了與源域毫無相關的影象。在圖中,開放集部分使用了一個Unknown類別來包括所有除了car、chair、dog三類(與目標域對應)之外的影象。

就像作者所說的標準的域適應基準都是假設在閉集中進行,即源域和目標域的類別本身就是對齊的,然而,在現實應用中,這種情況往往是受到限制的,更多的則是開集的情況,那麼在文中是如何實現開集域適應的呢?

如上圖,是開集域適應方法的簡要框架,方法分為三步:b、c、d。

  • a中展示了資料情況:源域包含了帶標籤的資料,紅藍綠表示不同的類別,灰色表示Unknown類別,目標域中沒有標籤,但是它們的形狀代表了它們有可能屬於哪一類別,比如三角形、圓形、菱形、方形。
  • b:通過源域給目標域分配標籤,同時讓一些異常點沒有標籤。
  • c:將源域對映到目標域,最小化它們之間同類的距離,c中展示的是經過變換後的源域。
  • d:迭代b、c知道收斂到區域性最優,然後通過在被變換後的源域中學習到的分類器對目標域進行分類。

文中的開放集方法既可以用於無監督場景中,又可以用於半監督場景中,主要看目標域中是否包含有資料,下面詳細介紹。

通過源域給目標域分配標籤(無監督場景)

假設源域包含 C 1 \mathcal{C}-1

個類別,還有一個Unknown類別。然後這一步的目的是給目標域的資料 T \mathcal{T} 打上標籤,怎麼打呢?類似於聚類,這裡定義一個關於將目標域資料分類到源域類別c的損失:

d c t = S c T t 2 2 d_ct=||S_c-T_t||_2^2

其中 S c S_c 表示屬於類別c中所有資料的均值, T t T_t 則表示目標域樣本的特徵表示。很容易看出,這個損失就是用距離來衡量的。通過這樣就可以初步給目標域資料分配到一個類別,當然也可以沒有類別,就像上圖b中的一些異常點。然後通過一個損失函式,進行優化:

其中 x c t o t x_ct、o_t 為一個二值變數,其中 x c t x_ct 表示樣本t是否被標記為c, o t o_t 表示樣本t是否是一個異常點。然後下面有兩個約束,第一個表示,樣本t必須要被分配,要麼分配為類別c,要麼分配為異常點。第二個約束則表示至少有一個樣本t被分配到類別c中,即保證每個類別至少要有一個樣本。

通過源域給目標域分配標籤(半監督場景)

半監督場景與無監督場景的不同之處在於目標域中包含有一部分帶標籤資料,既然已經有標籤了,那就不需要給分配標籤了,所以在半監督場景中,只是在上面的損失函式中新加了一項:

同時新增了一個約束 x c t t = 1 x_{c_t't}=1 。表示強制所有已經有標籤的目標域資料都不改變其標籤。上述損失函式中第一項和上面一樣表示,樣本t由 d c t d_ct 給出所屬類別c,第二項 d c c = S c S c 2 2 d_{cc'}=||S_c-S_{c'}||_2^2 則表示當樣本t的臨近點 N t N_t 中有臨近點被分配到另一類的時候,額外加上一個類間的距離差作為損失。

將源域對映到目標域

f ( W ) = 1 2 t c x c t W S c T t 2 2 f(W) = \frac{1}{2} \sum_t \sum_c x_ct||WS_c-T_t||_2^2

上式為對映損失函式,其中W為對映函式,表示最小化經過對映後源域中類別c的資料與目標域中近似於類別c的距離。該優化過程可以通過求解偏導數獲得W。

對目標域分類

在目標域上的標籤分配問題和對映問題迭代優化收斂之後,就可以在經過變換後的源域資料上訓練SVMs來對目標域進行分類,在半監督問題中,使用第二個損失函式進行優化訓練。

總結

文章的重點主要在於給源域的標籤分配上,分配的思想類似於聚類,提出了一個Unknown以及Outlier異常類來容納開放集中不屬於源域的類別。方法在對映上使用的方法與以前的遷移學習方法差異不大。最後使用的分類方法也比較傳統。所以這篇文章的主要貢獻在於解決了閉集的場景問題,並用一個較為簡潔的辦法實現了開集的域適應。

參考

Busto P P, Gall J. Open Set Domain Adaptation[C]// IEEE International Conference on Computer Vision. IEEE Computer Society, 2017:754-763.

《小王愛遷移》系列之九:開放集遷移學習(Open Set) - 王晉東不在家的文章 - 知乎
https://zhuanlan.zhihu.com/p/31230331