生成對抗網路（GAN）是幹什麼用的？

什麼是生成對抗網路？生成式對抗網路（GAN, Generative Adversarial Networks ）是一種深度學習模型，是近年來複雜分佈上無監督學習最具前景的方法之一。模型通過框架中（至少）兩個模組：生成模型（Generative Model）和判別模型（Discriminative Model）的互相博弈學習產生相當好的輸出。原始 GAN 理論中，並不要求 G 和 D 都是神經網路，只需要是能擬合相應生成和判別的函式即可。但實用中一般均使用深度神經網路作為 G 和 D 。一個優秀的GAN應用需要有良好的訓練方法，否則可能由於神經網路模型的自由性而導致輸出不理想。

一個典型的生成對抗網路模型大概長這個樣子：

我們先來理解下GAN的兩個模型要做什麼。

首先判別模型，就是圖中右半部分的網路，直觀來看就是一個簡單的神經網路結構，輸入就是一副影象，輸出就是一個概率值，用於判斷真假使用（概率值大於0.5那就是真，小於0.5那就是假），真假也不過是人們定義的概率而已。

其次是生成模型，生成模型要做什麼呢，同樣也可以看成是一個神經網路模型，輸入是一組隨機數Z，輸出是一個影象，不再是一個數值而已。從圖中可以看到，會存在兩個資料集，一個是真實資料集，這好說，另一個是假的資料集，那這個資料集就是有生成網路造出來的資料集。好了根據這個圖我們再來理解一下GAN的目標是要幹什麼：

判別網路的目的：就是能判別出來屬於的一張圖它是來自真實樣本集還是假樣本集。假如輸入的是真樣本，網路輸出就接近

1，輸入的是假樣本，網路輸出接近0，那麼很完美，達到了很好判別的目的。

生成網路的目的：生成網路是造樣本的，它的目的就是使得自己造樣本的能力盡可能強，強到什麼程度呢，你判別網路沒法判斷我是真樣本還是假樣本。

因此辨別網路的作用就是對噪音生成的資料辨別他為假的，對真實的資料辨別他為真的。

而生成網路的損失函式就是使得對於噪音資料，經過辨別網路之後的辨別結果是真的，這樣就能達到生成真實影象的目的。

這裡會感覺比較饒，這也是生成對抗網路的難點所在，理解了這點，整個生成對抗網路模型也就理解了。

工作模式

一般的工作流程很簡單直接：

1. 取樣訓練樣本的一個 minibatch

，然後計算它們的鑑別器分數；

2. 得到一個生成樣本 minibatch，然後計算它們的鑑別器分數；

3. 使用這兩個步驟累積的梯度執行一次更新。

下一個訣竅是避免使用稀疏梯度，尤其是在生成器中。只需將特定的層換成它們對應的「平滑」的類似層就可以了，比如：

1.ReLU 換成 LeakyReLU

2. 最大池化換成平均池化、卷積+stride

3.Unpooling 換成去卷積

兩個主要網路模型，一個是生成器模型，一個是辨別器模型。

辨別器模型要辨別兩種資料來源，一種是真實資料，一種是生成器生成的資料。這裡可以分成兩個辨別器模型，設定reuse=True來共享模型引數。

2、程式碼

import numpy as np
import tensorflow as tf
import matplotlib.pyplot as plt
from tensorflow.examples.tutorials.mnist import input_data

# TODO：資料準備
mnist = input_data.read_data_sets('data')


# TODO:獲得輸入資料
def get_inputs(noise_dim, image_height, image_width, image_depth):
    # 真實資料
    inputs_real = tf.placeholder(tf.float32, [None, image_height, image_width, image_depth], name='inputs_real')
    # 噪聲資料
    inputs_noise = tf.placeholder(tf.float32, [None, noise_dim], name='inputs_noise')

    return inputs_real, inputs_noise


# TODO:生成器
def get_generator(noise_img, output_dim, is_train=True, alpha=0.01):
    with tf.variable_scope("generator", reuse=(not is_train)):
        # 100 x 1 to 4 x 4 x 512
        # 全連線層
        layer1 = tf.layers.dense(noise_img, 4 * 4 * 512)
        layer1 = tf.reshape(layer1, [-1, 4, 4, 512])
        # batch normalization
        layer1 = tf.layers.batch_normalization(layer1, training=is_train)
        # Leaky ReLU
        layer1 = tf.maximum(alpha * layer1, layer1)
        # dropout
        layer1 = tf.nn.dropout(layer1, keep_prob=0.8)

        # 4 x 4 x 512 to 7 x 7 x 256
        layer2 = tf.layers.conv2d_transpose(layer1, 256, 4, strides=1, padding='valid')
        layer2 = tf.layers.batch_normalization(layer2, training=is_train)
        layer2 = tf.maximum(alpha * layer2, layer2)
        layer2 = tf.nn.dropout(layer2, keep_prob=0.8)

        # 7 x 7 256 to 14 x 14 x 128
        layer3 = tf.layers.conv2d_transpose(layer2, 128, 3, strides=2, padding='same')
        layer3 = tf.layers.batch_normalization(layer3, training=is_train)
        layer3 = tf.maximum(alpha * layer3, layer3)
        layer3 = tf.nn.dropout(layer3, keep_prob=0.8)

        # 14 x 14 x 128 to 28 x 28 x 1
        logits = tf.layers.conv2d_transpose(layer3, output_dim, 3, strides=2, padding='same')
        # MNIST原始資料集的畫素範圍在0-1，這裡的生成圖片範圍為(-1,1)
        # 因此在訓練時，記住要把MNIST畫素範圍進行resize
        outputs = tf.tanh(logits)

        return outputs


# TODO:判別器
def get_discriminator(inputs_img, reuse=False, alpha=0.01):
    with tf.variable_scope("discriminator", reuse=reuse):
        # 28 x 28 x 1 to 14 x 14 x 128
        # 第一層不加入BN
        layer1 = tf.layers.conv2d(inputs_img, 128, 3, strides=2, padding='same')
        layer1 = tf.maximum(alpha * layer1, layer1)
        layer1 = tf.nn.dropout(layer1, keep_prob=0.8)

        # 14 x 14 x 128 to 7 x 7 x 256
        layer2 = tf.layers.conv2d(layer1, 256, 3, strides=2, padding='same')
        layer2 = tf.layers.batch_normalization(layer2, training=True)
        layer2 = tf.maximum(alpha * layer2, layer2)
        layer2 = tf.nn.dropout(layer2, keep_prob=0.8)

        # 7 x 7 x 256 to 4 x 4 x 512
        layer3 = tf.layers.conv2d(layer2, 512, 3, strides=2, padding='same')
        layer3 = tf.layers.batch_normalization(layer3, training=True)
        layer3 = tf.maximum(alpha * layer3, layer3)
        layer3 = tf.nn.dropout(layer3, keep_prob=0.8)

        # 4 x 4 x 512 to 4*4*512 x 1
        flatten = tf.reshape(layer3, (-1, 4 * 4 * 512))
        logits = tf.layers.dense(flatten, 1)
        outputs = tf.sigmoid(logits)

        return logits, outputs


# TODO: 目標函式
def get_loss(inputs_real, inputs_noise, image_depth, smooth=0.1):
    g_outputs = get_generator(inputs_noise, image_depth, is_train=True)
    d_logits_real, d_outputs_real = get_discriminator(inputs_real)
    d_logits_fake, d_outputs_fake = get_discriminator(g_outputs, reuse=True)

    # 計算Loss
    g_loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=d_logits_fake,labels=tf.ones_like(d_outputs_fake) * (1 - smooth)))

    d_loss_real = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=d_logits_real,labels=tf.ones_like(d_outputs_real) * (1 - smooth)))
    d_loss_fake = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=d_logits_fake,labels=tf.zeros_like(d_outputs_fake)))
    d_loss = tf.add(d_loss_real, d_loss_fake)

    return g_loss, d_loss


# TODO:優化器
def get_optimizer(g_loss, d_loss, learning_rate=0.001):
    train_vars = tf.trainable_variables()

    g_vars = [var for var in train_vars if var.name.startswith("generator")]
    d_vars = [var for var in train_vars if var.name.startswith("discriminator")]

    # Optimizer
    with tf.control_dependencies(tf.get_collection(tf.GraphKeys.UPDATE_OPS)):
        g_opt = tf.train.AdamOptimizer(learning_rate).minimize(g_loss, var_list=g_vars)
        d_opt = tf.train.AdamOptimizer(learning_rate).minimize(d_loss, var_list=d_vars)

    return g_opt, d_opt


# 顯示圖片
def plot_images(samples):
    fig, axes = plt.subplots(nrows=5, ncols=5, sharex=True, sharey=True, figsize=(7, 7))
    for img, ax in zip(samples, axes.flatten()):
        ax.imshow(img.reshape((28, 28)), cmap='Greys_r')
        ax.get_xaxis().set_visible(False)
        ax.get_yaxis().set_visible(False)
    fig.tight_layout(pad=0)
    plt.show()


def show_generator_output(sess, n_images, inputs_noise, output_dim):
    noise_shape = inputs_noise.get_shape().as_list()[-1]
    # 生成噪聲圖片
    examples_noise = np.random.uniform(-1, 1, size=[n_images, noise_shape])

    samples = sess.run(get_generator(inputs_noise, output_dim, False),
                       feed_dict={inputs_noise: examples_noise})

    result = np.squeeze(samples, -1)
    return result


# TODO:開始訓練
# 定義引數
batch_size = 64
noise_size = 100
epochs = 5
n_samples = 25
learning_rate = 0.001


def train(noise_size, data_shape, batch_size, n_samples):
    # 儲存loss
    losses = []
    steps = 0

    inputs_real, inputs_noise = get_inputs(noise_size, data_shape[1], data_shape[2], data_shape[3])
    g_loss, d_loss = get_loss(inputs_real, inputs_noise, data_shape[-1])
    print("FUNCTION READY!!")
    g_train_opt, d_train_opt = get_optimizer(g_loss, d_loss, learning_rate)
    print("TRAINING....")
    with tf.Session() as sess:
        sess.run(tf.global_variables_initializer())
        # 迭代epoch
        for e in range(epochs):
            for batch_i in range(mnist.train.num_examples // batch_size):
                steps += 1
                batch = mnist.train.next_batch(batch_size)

                batch_images = batch[0].reshape((batch_size, data_shape[1], data_shape[2], data_shape[3]))
                # scale to -1, 1
                batch_images = batch_images * 2 - 1

                # noise
                batch_noise = np.random.uniform(-1, 1, size=(batch_size, noise_size))

                # run optimizer
                sess.run(g_train_opt, feed_dict={inputs_real: batch_images,
                                                 inputs_noise: batch_noise})
                sess.run(d_train_opt, feed_dict={inputs_real: batch_images,
                                                 inputs_noise: batch_noise})

                if steps % 101 == 0:
                    train_loss_d = d_loss.eval({inputs_real: batch_images,
                                                inputs_noise: batch_noise})
                    train_loss_g = g_loss.eval({inputs_real: batch_images,
                                                inputs_noise: batch_noise})
                    losses.append((train_loss_d, train_loss_g))
                    print("Epoch {}/{}....".format(e + 1, epochs),
                          "Discriminator Loss: {:.4f}....".format(train_loss_d),
                          "Generator Loss: {:.4f}....".format(train_loss_g))

            if e % 1 == 0:
                # 顯示圖片
                samples = show_generator_output(sess, n_samples, inputs_noise, data_shape[-1])
                plot_images(samples)


with tf.Graph().as_default():
    train(noise_size, [-1, 28, 28, 1], batch_size, n_samples)
    print("OPTIMIZER END!!")
 
 
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    七個不容易被發現的生成對抗網路（GAN）用例
       
 
 
  
 像許多追隨AI發展的人一樣，我無法忽略生成建模的最新進展，尤其是影象生成中生成對抗網路（GAN）的巨大成功。看看下面這些樣本：它們與真實照片幾乎沒有區別！ 
  
   
 從2014年到2018年，面部生成的進展也非常顯著。 
 這些結果讓我感到興奮，但我內心總是懷疑它們是否真 

  
 

    

    
    生成對抗網路（GAN）是幹什麼用的？
      
                                        
                                                什麼是生成對抗網路？生成式對抗網路（GAN, Generative Adversarial Networks ）是一種深度學習模型 

  
 

    

    
    生成對抗網路（GAN）應用於影象分類
       
 
  
  
 　　近年來，深度學習技術被廣泛應用於各類資料處理任務中，比如影象、語音和文字。而生成對抗網路（GAN）和強化學習（RL）已經成為了深度學習框架中的兩顆“明珠”。強化學習主要用於決策問題，主要的應用就是遊戲，比如deepmind團隊的AlphaGo。因為我的研究方向是影象的有監督分類問題， 

  
 

    

    
    一篇讀懂生成對抗網路（GAN）原理+tensorflow程式碼實現
      
							
							
							作者：JASON
2017.10.15


  生成對抗網路GAN（Generative adversarial networks）是最近很火的深度學習方法，要理解它可以把它分成生成模型和判別模型兩個部分，簡單來說就是：兩個人比賽，看是 A 的矛厲害，還是 B  

  
 

    

    
    生成對抗網路（GAN）的前沿進展（論文、報告、框架和Github資源）彙總
      
                

生成模型（GenerativeModel）是一種可以通過學習訓練樣本來產生更多類似樣本的模型。在所有生成模型當中，最具潛力的是生成對抗網路（Generative
 Adversarial Networks, GANs）。GANs 是非監督機器學習的一種，它的運作方式可被看 

  
 

    

    
    生成對抗網路（GAN）簡單入門（33）---《深度學習》
      
							
							
							生成對抗網路與2014年被提出，一經提出便引發了深度學習的又一次小高潮，屬於無監督學習，本篇部落格主要介紹***GAN網路的結構以及訓練過程！***
對抗樣本即對抗網路的發展大家可以參考GANs學習系列(4):對抗樣本和對抗網路，有助於建立一個對對抗樣本的系統認 

  
 

    

    
    火熱的生成對抗網路（GAN），你究竟好在哪裡
      
							
							
							
  【線上直播】《TensorFlow實戰》作者、PPmoney大資料演算法總監黃文堅老師即將開課：《使用TensorFlow建立可自動玩遊戲的DQN模型》，本次課程集中講解Deep-Q Network及其TensorFlow的實現。點選報名
自2014年Ia 

  
 

    

    
    一文入門人工智慧的掌上明珠：生成對抗網路（GAN）
      一.簡介
在人工智慧領域內，GAN是目前最為潮流的技術之一，GAN能夠讓人工智慧具備和人類一樣的想象能力。只需要給定計算機一定的資料，它就可以自動聯想出相似的資料。我們學習和使用GAN的原因如下：
1.能夠用GAN進行無監督學習：深度學習需要大量資料的標註才能夠進行監督學習，而使用GAN則不需要使用大量標註的 

  
 

    

    
    解讀生成對抗網路（GAN） 之U-GAN-IT
      Unsupervised Generative Attentionnal Networks with Adapter Layer-In（U-GAN-IT）
從字面我們可以理解為無監督生成對抗網路和適配層的結合
 
論文實現：

論文實現了無監督影象的翻譯問題，當兩個影象之間兩個影象、紋理差別較大時的 

  
 

    

    
    生成式對抗網路（GAN）
       
 
 
  
  
    　　生成對抗網路（GAN），是深度學習模型之一，2014年lan Goodfellow的開篇之作Generative Adversarial Network， 
   GAN概述 
   　　GAN包括兩個模型，一個是生成模型（generative model），一個 

  
 

    

    
    在瀏覽器中進行深度學習：TensorFlow.js (八）生成對抗網路 （GAN
      Generative Adversarial Network 是深度學習中非常有趣的一種方法。GAN最早源自Ian Goodfellow的這篇論文。LeCun對GAN給出了極高的評價： 
“There are many interesting recent development in deep learni 

  
 

    

    
    生成式對抗網路（GAN）相關問題彙總（較全面）
      
                今年暑假在北京大學參加了一個月的人工智慧DeeCamp訓練營培訓，期間實踐課題是：基於文字的影象生成，用到了各種GAN網路對比試驗結果。當時只是想著實驗各種GAN看效果，對於每一個GAN都有什麼改進一知半解。接下來還要指導一篇基於GAN的水下影象生成本科生畢設，現在整理一下網 

  
 

    

    
    生成式對抗網路（GAN）如何快速理解？這裡有一篇最直觀的解讀
      
                    

                    

                    
                    
                    原文來源：freeCodeCamp作者：Thalles Silva「雷克世界」編譯：嗯~阿童木呀 

  
 

    

    
    生成對抗網路（CGAN）（37）---《深度學習》
      
							
							
							在前面我們簡單介紹了生成對抗網路（GAN）的基本結構和其訓練方式，然而這種方式是基於無監督學習的，沒有指定對應的標籤，使用一個分佈直接進行取樣，從而理論上達到可以完全逼近原始資料，因此生成網路G比較自由，而且當圖片的畫素較多的時候，這樣導致訓練好的生成網路G不可 

  
 

    

    
    卷積生成對抗網路（DCGAN）---生成手寫數字
      # 深度卷積生成對抗網路（DCGAN）
## ---- 生成 MNIST 手寫圖片
## 1、基本原理

生成對抗網路（GAN）由2個重要的部分構成：

- 生成器(Generator)：通過機器生成資料（大部分情況下是影象），目的是“騙過”判別器
- 判別器(Discriminator)：判斷這張影象是真實 

  
 

    

    
    GAN (生成式對抗網路) （一）： GAN 簡介
       
 
 
 自從 Ian Goodfellow 在 14 年發表了 論文 Generative Adversarial Nets 以來，生成式對抗網路 GAN 廣受關注，加上學界大牛 Yann Lecun 在 Quora 答題時曾說，他最激動的深度學習進展是生成式對抗網路，使得 GAN 成為近年來在機器學習 

  
 

    

    
    2018.11.14——對抗生成網路（GAN）
       
 
 用途：用生成對抗網路生成圖片 
 原理：兩位博弈方分別由生成式模型 （generative model）和判別模型充當 （discriminative model）。生成模型G捕捉樣本資料的分佈，用服從某一分佈（均勻分佈、高斯分佈）的噪聲Z生成一個類似真實訓練資料的樣本，追求效果是越像真實樣本越好； 

  
 

    

    
    不要慫，就是GAN (生成式對抗網路) （四）：訓練和測試 GAN
      
                
在 /home/your_name/TensorFlow/DCGAN/ 下新建檔案 train.py，同時新建資料夾 logs 和資料夾 samples，前者用來儲存訓練過程中的日誌和模型，後者用來儲存訓練過程中取樣器的取樣圖片，在 train.py 中輸入如下程式碼：

 

  
 

    

    
    不要慫，就是GAN (生成式對抗網路) （六）：Wasserstein GAN（WGAN） TensorFlow 程式碼
      
                

先來梳理一下我們之前所寫的程式碼，原始的生成對抗網路，所要優化的目標函式為：



 此目標函式可以分為兩部分來看：

①固定生成器 G，優化判別器 D， 則上式可以寫成如下形式： 

 

可以轉化為最小化形式： 



我們編寫的程式碼中，d_loss_real =  

  
 

    

    
    生成對抗網路（Generative Adversarial Networks，GAN）初探
      1. 從納什均衡（Nash equilibrium）說起


我們先來看看納什均衡的經濟學定義：
所謂納什均衡，指的是參與人的這樣一種策略組合，在該策略組合上，任何參與人單獨改變策略都不會得到好處。換句話說，如果在一個策略組合上，當所有其他人都不改變策略時，沒有人會改變自己的策略，則該策略組合就是一個

生成對抗網路（GAN）是幹什麼用的？

七個不容易被發現的生成對抗網路（GAN）用例

生成對抗網路（GAN）是幹什麼用的？

生成對抗網路（GAN）應用於影象分類

一篇讀懂生成對抗網路（GAN）原理+tensorflow程式碼實現

生成對抗網路（GAN）的前沿進展（論文、報告、框架和Github資源）彙總

生成對抗網路（GAN）簡單入門（33）---《深度學習》

火熱的生成對抗網路（GAN），你究竟好在哪裡

一文入門人工智慧的掌上明珠：生成對抗網路（GAN）

解讀生成對抗網路（GAN）之U-GAN-IT

生成式對抗網路（GAN）

在瀏覽器中進行深度學習：TensorFlow.js (八）生成對抗網路（GAN

生成式對抗網路（GAN）相關問題彙總（較全面）

生成式對抗網路（GAN）如何快速理解？這裡有一篇最直觀的解讀

生成對抗網路（CGAN）（37）---《深度學習》

卷積生成對抗網路（DCGAN）---生成手寫數字

GAN (生成式對抗網路) （一）： GAN 簡介

2018.11.14——對抗生成網路（GAN）

不要慫，就是GAN (生成式對抗網路) （四）：訓練和測試 GAN

不要慫，就是GAN (生成式對抗網路) （六）：Wasserstein GAN（WGAN） TensorFlow 程式碼

生成對抗網路（Generative Adversarial Networks，GAN）初探