Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

摘要

背景：影象到影象的遷移是計算機視覺中的一個很有意思的問題。目標是學習一個從輸入圖片到目標圖片的對映，在訓練中需要使用成對的訓練集。

問題：成對的訓練資料並不是那麼容易獲得的。

本文方法：學習一個從源域(source domain)到目標域(target domain)的對映 $G : X \to Y$ 來進行影象的遷移。使用一個對抗損失，使得來自於G(X)的圖片的分佈與分佈Y無法區分，即使得生成的圖片的分佈與目標域的圖片的分佈逼近。既然兩者的分佈是趨向於相同的，那麼可以想到，既然A與B無法區分，那麼也意味著B與A無法區分，即這個關係是相對的，所以我們就可以定義一個逆對映 $F : Y \to X$

F : Y \to X

，於是我們引入一個迴圈一致性損失(a cycle consistency loss)來使得

F (G (X)) \approx X

(反之亦然)，含義就是把源域的生成的圖片再映射回源域，其分佈依然是趨於相同的。

實驗:

定性分析：不使用成對的訓練集的遷移結果展示，包括collection style transfer，object transfiguration，season transfer，photo enhancement等；
定量分析：與一些其它的使用成對資料訓練的方法進行比較。

簡介:

這裡寫圖片描述

如圖-1左上為例，同一場景下，莫奈的畫作與照片的記錄展現出了兩種不同的情境，我們不禁暢想，給你一副莫奈的畫作，是不是可以自動的產生照片中真實的場景，抑或是給你一副真實的場景，是否可以自動的將其轉化為莫奈的風格。作者展示了其方法的魔力，不像其它的方法在訓練中需要一一對應排序好的訓練資料，只需要兩個無序的集合X(源域)和Y(目標域)，該演算法就可以自動地進行風格的遷移。

稍微回顧下影象到影象的遷移：給定一個場景的影象x，將其轉換到另一個場景的y，比如：將灰度圖轉化到彩色的圖，影象到語義標籤。目前也有很多研究工作，使用成對的資料 ${x, y}$ 進行風格的遷移。如圖-2左側所示。
這裡寫圖片描述

但是呢，這些成對出現的資料集並不是那麼容易獲得的。於是本文探究了一個演算法，不需要這些成對的資料，如圖-2中右側所示。這裡作者做了一個假設：在源域和目標域存在潛在的關係。其實就是兩者從分佈上而言，是存在相似性的。這裡留下一個問題：如果兩個域完全不同或者說差別非常大結果會怎麼樣呢？

給定源域的圖片集合X以及另一個域的圖片集合Y，我們使用對抗的思想學習一個對映 $G : X \to Y$

→Y，其輸出

\hat{y} = G (x), x \in X

，與

y \in Y

無法區分。

我們不禁想到這樣一個問題，這個不成對的訓練是怎麼進行的呢？如果仍然使用傳統的GAN的損失和訓練方式，使用這些不成對的資料集進行訓練，會出現什麼問題呢？作者發現:

無法保證對於一個輸入x，可以得到有意義的輸出y，因為使用了不成對的訓練集，但是可以學到無數種的對映G，而這些G都可以使生成的分佈 $\hat{y}$ 逼近與目標域。
單獨優化對抗損失非常困難，導致了一些不可名狀的問題，如model collapse(即生成的樣本的多樣性問題)。

如何解決呢？作者發現在遷移過程中有這樣一個特性——”迴圈一致性“。比如：我們將一個句子從英語翻譯到法語，再將其翻譯回英語，我們應該得到與原始的英文相同的句子(不禁想起了以前整理的的Dual Learning的文章，有興趣的可以看下)。用數學符號來表示下：我們有一個轉換器(對映): $G : X \to Y$ ，和另一個轉換器 $F : Y \to X$ 。那麼G和F應該是互逆的，即兩者是一個雙向對映。於是可以同時訓練G和F來確保這個性質，增加一個迴圈一致性損失，使得 $F (G (x)) \approx x$ 以及 $G (F (x)) \approx y$ 。組合該損失和對抗損失，就得到了我們整體的非正對的影象到影象遷移的優化目標。

公式

這裡寫圖片描述

給定訓練集樣本 ${x_{i}}_{i = 1}^{N} \in X$ 和 ${y_{j}}_{j = 1}^{M} \in Y$ 。如圖-3(a)所示，模型包含兩個對映： $G : X \to Y$ 和 $F : Y \to X$ 。此外，引入兩個對抗的判別器 $D_{X}$ 和 $D_{Y}$ ， $D_{X}$ 的作用是用來判別 ${x}$ 和 ${F (y)}$ ； $D_{Y}$ 的作用是用來判別 ${y}$ 和 ${G (x)}$ 。優化目標包含兩項：

對抗損失(adversarial loss)：促使生成影象分佈與目標域的影象分佈相逼近
迴圈一致性損失(cycle consistency loss)：使得 $F (G (x)) \approx x$ 以及 $G (F (x)) \approx y$ 。防止學習到的對映G和F互相矛盾。

對抗損失

將對抗損失應用到兩個對映上。對於對映函式 $G : X \to Y$ 和它的識別器 $D_{Y}$ ，目標函式為：

\begin{matrix} (1) & L_{G A N} (G, D_{Y}, X, Y) = E_{y \sim p_{d a t a} (y)} [l o g D_{Y} (y)] + E_{x \sim p_{d a t a} (x)} [l o g (1 - D_{Y} (G (x)))] \end{matrix}

CVPR：Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

摘要

簡介:

公式

對抗損失

CVPR：Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

GAN系列：Image-to-Image Translation with Conditional Adversarial Networks

Unsupervised Image-to-Image Translation Networks(NIPS 2017)

image-to-image translation with conditional adversarial networks文獻筆記

Image-to-Image Translation with Conditional Adversarial Networks

《Image-to-Image Translation with Conditional Adversarial Networks》論文筆記

深度學習論文翻譯解析（二）：An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition

Introduction to Image Caption Generation using the Avenger’s Infinity War Characters

LAPGAN：Deep Generative/Image Models using a Laplacian Pyramid of Adversarial Networks 使用拉普拉斯金字塔的GAN

論文筆記：An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application

ERROR： from PIL import Image ImportError: No module named PIL

Docker學習筆記三：Docker鏡像image

Access to Image at 'file:///Users canvas本地圖片跨域報錯解決方案

dom-to-image實現的網頁截圖

論文閱讀1《AttnGAN: Fine-Grained Text to Image Generation with Attentional Generative Adversarial Networ》

Python：Fatal error in launcher: Unable to create process using 問題排查

virtualenv使用報錯：Fatal error in launcher: Unable to create process using '"'

OpenLayers官方示例詳解二：Drag-and-Drop Image Vector

打開圖像文件失敗匯總：“Could not load image... ...0x## 0x##”錯誤

開啟影象檔案失敗彙總：“Could not load image... ...0x## 0x##”錯誤

CVPR：Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

摘要

簡介:

公式

對抗損失

相關推薦