GAN最新論文解讀

阿新 • • 發佈：2019-01-10

GAN Dissection: Visualizing and Understanding Generative Adversarial Networks

論文地址：

https://arxiv.org/pdf/1811.10597.pdf

GitHub code：https://github.com/CSAILVision/gandissect

首先要介紹的是第一篇，這篇文章的對於GAN的可解釋性研究有較大貢獻，我把它稱為可控GAN。主要看點在於，之前的GAN我們我們可以生成非常逼真的影象，雖然我們可以一定程度上選擇生成的多樣性，但是我們不能控制生成的物件裡面包括哪些，又包括哪些。因為我們不知道GAN裡面究竟是如何控制每個類別！

而這篇文章的方法不僅能夠控制是否包含某個類別，還能控制生成該類別的數量，如下圖所示：

從左到右，控制生成的樹的數量由多到少，直到一棵樹都沒有。這就是這篇文章的突破性的之處，這項研究向理解GAN邁出了非常重要的一步。

這是該文章的demo，大家可以自己體驗一下，它不僅可以控制生成什麼，不僅可以控制生成多少，還能控制生成的位置（我剛試時有點激動）：

http://gandissect.res.ibm.com/ganpaint.html?project=churchoutdoor&layer=layer4

從視訊中可以看到，他可以做到增加某些類別，去除某些類別，也就是GAN已經成為可控的。想想真的有些激動（感覺應用前景很大，比傳統的P圖快太多，而且更逼真）。

上面介紹這篇文章方法的強大之處，下面介紹它是如何實現的。

具體實現分為兩個步驟：解剖（Dissection）和干預（Intervention），為每個類別尋找一套“因果”單元。

首先是第一個階段：解剖

看著上面的圖來講更直觀，整個結構的目的是找出特徵圖中，具體哪些通道和生成的某個類別的關係，而想要達到控制這個類的生成效果，那麼這個關係可以稱為因果關係。

更具體地，我們要找出生成圖X和特徵圖r的哪些通道有關。SC（X）是X的語義分割結果只取一個類，即為一個二值圖；

取特徵圖r的某一個通道（文中稱為單元），先進行上取樣恢復到原始影象尺寸，然後對其進行閾值處理以確定哪個畫素被該特定單元“點亮”。閾值通過下面這個公式計算：

得到了右上角的圖和右下角的二值圖，我們就可以衡量該通道的特徵和該類別的空間一致性。判別指標採用IOU：

V代表或運算，另一個是與運算，r（u，p）的箭頭指上取樣操作。

經過，第一階段解剖過程，我們知道哪些通道的特徵和類別的對應關係，接下來就是如何去幹預這個特徵，從而通過控制這些特徵控制生成。

第二個階段：干預

GAN最新論文解讀

GAN Dissection: Visualizing and Understanding Generative Adversarial Networks 論文地址： https://arxiv.org/pdf/1811.10597.pdf GitHub code：https://git

Recsys2018 總結（推薦系統最新技術、應用和方向）32篇論文解讀

本文對10月2-7號在加拿大渥太華舉辦的Recsys的32篇論文做了整理和歸納，總結出了目前推薦系統最新技術應用和方向。並對每一篇文章做了粗略的講解。我打算從以下四個方面來講述這32篇論文。首先呢，我會概述一下大會論文反映的一些情況。然後分析一下

Blind Super-Resolution Kernel Estimation using an Internal-GAN 論文解讀

# 背景與思路來源 ## 目前 SR 模型中合成 LR 使用的模糊核問題目前大多數 SR 的 model 都是用的合成下采樣圖片來進行訓練的，而這些合成的圖片常常使用的是 MATLAB 裡面的 imresize 函式來進行實現的，這樣的做法也就是會使得 SR-kernel 是固定和理想。當然還有很多是用

概率生成模型在驗證碼上的成果論文解讀

研究輪廓一般來說分解作用 nsh 級別優秀框架摘要從少數樣本學習並泛化至截然不同的情況是人類視覺智能所擁有的能力，這種能力尚未被先進的機器學習模型所學習到。通過系統神經科學的啟示，我們引入了視覺的概率生成模型，其中基於消息傳送（message-passing）

歡迎訂閱AI科技導讀微信公眾號，獲取人工智能的最新技術解讀教程！

com 技術分享科技 jpg font div 教程 -s size 微信掃一掃關註，獲取最新AI技術教程！歡迎訂閱AI科技導讀微信公眾號，獲取人工智能的最新技術解讀教程！

《Playing hard exploration games by watching YouTube》論文解讀

cati 由於表示 [1] array 大小好的 log 循環論文鏈接油管鏈接一、摘要 ??當環境獎勵特別稀疏的時候，強化學習方法通常很難訓練(traditionally struggle)。一個有效的方式是通過人類示範者(human demonstrator

An Analysis of Scale Invariance in Object Detection – SNIP 論文解讀

記錄測試的 one zhang 不可策略 correct 抽象 alt 前言本來想按照慣例來一個overview的，結果看到一篇十分不錯而且詳細的介紹，因此copy過來，自己在前面大體總結一下論文，細節不做贅述，引用文章講得很詳細。論文概述引用文章以下內容來自：

手勢識別論文解讀

Learning to Estimate 3D Hand Pose from Single RGB Images20173 主要流程程式碼細節解讀訓練流程解讀 Two-Stream Convolutional Networks for

MultiPoseNet論文解讀及復現

MultiPoseNet: Fast Multi-Person Pose Estimation using Pose Residual Network. 原文連結 PRN網路論文思路大致解讀論文提出的網路結構大概分成三部分：首先第一部分是Backbone網路

CTPN論文解讀

CTPN論文解讀 https://zhuanlan.zhihu.com/p/31915483 http://slade-ruan.me/2017/10/22/text-detection-ctpn/ 1. 區別本文工作基於faster RCNN , 區別在於改進了rpn

MaskRCNN-ICCV2017 論文解讀

文章: MaskRCNN 作者: Kaiming He, Georgia Gkioxari, Piotr Dollar, Ross Girshick 備註: FAIR, ICCV best paper 核心亮點 1) 提出了一個簡單,靈活,通用的例項分割模型框架 MaskRCNN

Optical Flow Guided Feature A Fast and Robust Motion Representation for Video Action Recognition論文解讀

Optical Flow Guided Feature A Fast and Robust Motion Representation for Video Action Recognition論文解讀 1. Abstract 2. 論文解讀 3

Playing Atari with Deep Reinforcement Learning論文解讀

1.Abstract We present the first deep learning model to successfully learn control policies directly from high-dimensional sensory input using re

《2017-Dual Path Networks》論文解讀

解讀Dual Path Networks（DPN，原創）動機以前方法的不足 ResNet：側重於特徵的再利用，但不善於發掘新的特徵； DenseNet: 側重於新特徵的發掘，但又會產生很多冗餘；優點

論文解讀|【Densenet】密集連線的卷積網路（附Pytorch程式碼講解）

@[t oc] 1 簡單介紹論文題目：Densely Connected Convolutional Networks 發表機構：康奈爾大學，清華大學，Facebook AI 發表時間：2018年1月論文程式碼：https://github.com/Wang

MSCNN論文解讀-A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection

多尺度深度卷積神經網路進行快速目標檢測：兩階段目標檢測器，與faster-rcnn相似，分為an object proposal network and an accurate detection network. 文章主要解決的是目標大小不一致的問題，尤其是對小目標的檢測，通過多

discoGAN 論文解讀

一. Abstract task: discovering cross-domain relations(跨域關係) given unpaired data 使用發現的關係，作者成功提出從一個域到另一個域同時儲存關鍵屬性的網路傳輸方式，例如方向和臉部身份二. Introduction di

2018 CVPR GAN 相關論文調研（自己分了下類，附地址哦）

2018 CVPR GAN 相關論文調研風格遷移 1. PairedCycleGAN: Asymmetric Style Transfer for Applying and Removing Makeup （給人臉化妝的風格轉移） http://openaccess.thecvf.com/

論文解讀：記憶網路（Memory Network）

在瞭解vqa問題的論文時，發現有很多論文采用了記憶網路的思路，模擬推理過程，這篇文章主要總結關於記憶網路的三篇經典論文，目的是對記憶網路有個認識。分別是： MEMORY NETWORKS，End-To-End Memory Networks，Ask Me Anything: Dynami

GAN最新論文解讀

具體實現分為兩個步驟：解剖（Dissection）和干預（Intervention），為每個類別尋找一套“因果”單元。

相關推薦