[論文理解] Adversarial Examples Improve Image Recognition

阿新 • • 發佈：2021-10-02

Adversarial Examples Improve Image Recognition

這篇文章提出了auxiliary BN來對生成對OOD樣本做BN，乾淨對樣本用原始的BN，相當於是兩個BN處理。

為什麼非要給對抗樣本單獨一個BN？這樣做有什麼好處？解決什麼問題？
實際提升有多少？
具體是怎麼實現的？
對半監督是否有幫助呀？
既然BN會hurt不同domain同時訓練的結果，用非BN的layer實驗效果如何？
實驗表明，使用對抗訓練往往精度會下降，這種精度下降的原因，可能是生成的對抗樣本和原乾淨樣本屬於不同domain，也即分佈差異過大，而簡單使用同一套BN很難transfer，那如何證明這一套猜想呢？作者先訓練adv樣本，然後再在乾淨資料上finetune，最終得到的模型精度要更高，通過finetune的方法（一般遷移學習用finetune的方式實現源域到目標域的遷移，即源域是adv樣本域，遷移到乾淨樣本域實現泛化。）證明其猜想。但這樣但方式並不能實現端到端的訓練，一個簡單的問題是，最初的adv樣本怎麼來的？肯定得先訓練好一個神經網路，然後得到adv樣本，然後再以adv樣本作為樣本訓練，然後finetune到乾淨樣本。這樣相當於是在交替訓練，如果adv樣本和乾淨樣本分佈差異非常大，bn是很難學習到兩者都能遵守到分佈到。因此，一種解決方案是，對乾淨樣本用一種BN，對adv樣本單獨用另一種BN，在訓練乾淨樣本時更新普通BN，訓練adv樣本時更新adv BN，這樣adv樣本的分佈不會影響普通BN，但其他卷基層等由於adv BN把adv樣本scale到和使用普通BN的相同效果的分佈下去，繼而使得其他層得以訓練，所以提升的是其他層的能力。

普通adv訓練掉點，aux bn漲點。

class AuxBN(nn.Module):
    def __init__(self, channels):
        super().__init__()
        self.bn1 = nn.BatchNorm2d(channels)
        self.bn2 = nn.BatchNorm2d(channels)
    def forward(self,x, aux = False):
        if aux:
            rerurn self.bn2(x)
        else:
            return self.bn1(x)

做了實驗，提升很小。、。
去做了一下實驗，沒有BN而是用LN等這類任務基本訓練不了。。嘗試一下transformer？？嘗試一下無Normalization的工作？

[論文理解] Adversarial Examples Improve Image Recognition

Adversarial Examples Improve Image Recognition 這篇文章提出了auxiliary BN來對生成對OOD樣本做BN，乾淨對樣本用原始的BN，相當於是兩個BN處理。

閱讀CVPR論文“Local Relation Networks for Image Recognition”的小結

該論文的研究背景是：卷積層一直是計算機視覺中的主要特徵提取器。然而，卷積中的空間聚合大多應用固定過濾器，但這些過濾器在對具有不同空間分佈的視覺元素進行建模時效率低下。本文提出了一種新的影象特徵提取器，

閱讀論文：《An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale》

閱讀論文：《An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale》來源：ICLR 2021 https://arxiv.org/abs/2010.11929

A Micro Lie Theory 論文理解

找到一篇 2018 年的論文 [1]，是 Quaternion kinematics for the error-state Kalman filter[2] 的作者 Joan Solà 寫的。

General matrix representations for B-splines 論文理解

這篇論文 [1] 比較基礎，在很多與 B 樣條有關的論文中都能找到對它的引用。

Very Deep Convolutional Networks for Large-Scale Image Recognition-VGGNet解讀

作者：HYH 日期：2020-9-10 論文期刊：ICLR2015 標籤：VGG 論文：《Very Deep Convolutional Networks for Large-Scale Image Recognition》

Deep Residual Learning for Image Recognition 筆記

轉載於部落格 http://blog.csdn.net/cv_family_z/article/details/50328175 http://blog.csdn.net/u014114990/article/details/50505331

ICCV2019——Learning Semantic-Specific Graph Representation for Multi-Label Image Recognition

文章目錄 ICCV2019——Learning Semantic-Specific Graph Representation for Multi-Label Image Recognition（影象識別，圖神經網路）1. 背景介紹2. 總體路線2.1 語義解耦模組2.2 語義互動模組2.2.1 模組

殘差網路：《Deep Residual Learning for Image Recognition》

殘差網路：《Deep Residual Learning for Image Recognition》摘要：網路結構深度的表達對視覺識別任務而言至關重要，論文提出了一種殘差網路結構塊，使得網路的準確度能夠隨著深度的加深而升高。網路結構

論文 END-TO-END OPTIMIZED IMAGE COMPRESSION 原始碼解析與論文閱讀——預處理+分析變換

目錄0 前言1 預處理1.1 讀取1.2 維度變換2 分析變換2.1 初始化init()2.2 build()2.3 call()2.3.1 初始化2.3.2 零填充2.3.3 卷積計算2.3.4 加bias2.3.5 啟用函式 GDN(正向)

AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE

https://arxiv.org/pdf/2010.11929.pdf --------------------------------------------------------- 2021-08-30

[論文理解] 半監督論文總結（一）

Semi-supervised Papers Review CatGAN arxiv：https://arxiv.org/pdf/1511.06390.pdf 主要貢獻：修改原始GAN的目標函式為

[論文理解] Quantizing Deep Convolutional Networks For Efficient Inference A Whitepaper

Quantizing Deep Convolutional Networks For Efficient Inference A Whitepaper Question：到底加速在哪？

[論文理解] Mutual Information Neural Estimation

Mutual Information Neural Estimation 互資訊定義： \\(I(X;Z) = \\int_{X \\times Z} log\\frac{d\\mathbb{P}(XZ)}{d\\mathbb{P}(X) \\otimes \\mathbb{P}(Z)}d\\mathbb{P}(XZ)\\)

[論文理解] 人臉識別論文總結（一）

Face Recognition Papers Review Partial FC: Training 10 Million Identities on a Single Machine arxiv: https://arxiv.org/pdf/2010.05222v2.pdf

[論文理解] Bootstrap Your Own Latent A New Approach to Self-Supervised Learning

Bootstrap Your Own Latent A New Approach to Self-Supervised Learning Intro 文章提出一種不需要負樣本來做自監督學習的方法，提出交替更新假說解釋EMA方式更新target network防止collapse的原因，同時用梯度解釋

Detecting Overfitting via Adversarial Examples

發表時間：2019（NeurIPS 2019）文章要點：這篇文章的出發點是說，大家都在資料集上刷點，雖然都分了訓練集和測試集，但是刷到最後的結果肯定是在測試集上效果越來越好了，但是會不會出現在測試集上overfitting的

Improved Resolution from Subpixel Shifted Pictures 論文理解

references【前置知識】 Theoretical characterizations of images that can be totally refined using the transducer oscillation algorithm

PTYCHNET : CNN BASED FOURIER PTYCHOGRAPHY 論文理解

當重疊部分減小時，迭代演算法的效果變差，考慮用網路。文章【通過實驗】證明了如果沒有overlapping frequency band，網路能夠得到更好的效果；如果頻域有重疊，用網路能夠減少計算時間。【最後還說可以先用網路得到

Superresolution imaging via ptychography 論文理解

主要idea：當重疊大概是70%，目前的重建演算法不能很好地利用冗餘。通過把衍射影象往detector孔徑之外外推，我們更好地利用了冗餘並且提高了解析度。

[論文理解] Adversarial Examples Improve Image Recognition

Adversarial Examples Improve Image Recognition

相關推薦