BAG OF TRICKS FOR ADVERSARIAL TRAINING

阿新 • • 發佈：2020-10-13

對抗訓練是最有效的用於提升模型魯棒性的策略之一。

但是在AT上的許多改進不如簡單地提前停止訓練過程有效。

基礎引數設定的不同對模型的魯棒性有很大的影響。

本文對基礎訓練技巧和超引數的設定在對抗性訓練模型的影響提供了綜合性的評估。

十篇文章中的實現細節：

超引數設定非常不一致，不能直接對這些方法排序。

PGD-AT 在 CIFAR-10 上作為例子

預設設定：

PGD-AT框架

batchsize：128

SGD 優化器

初始學習率：0.1

weight decay 5*10^-4

ReLU

沒有label smoothing

訓練BN

所有模型訓練110epochs

學習率下降因子0.1 在100，105epoch下降

注意我們的經驗觀測和結論可能不能總是泛化至其他資料集或其他對抗訓練框架，但是我們強調了使用一致實現細節的重要性，能夠在不同的對抗訓練方法之間進行公平的比較。

1. 儘早停止early stopping和warmup熱身

early stop為預設設定

儘早停止對抗強度，在PGD-10可以提升，在AA相反

熱身學習率，影響非常的小

熱身對抗強度，影響也有限

2. 訓練超引數

batchsize 對於CIFAR-10 batchsize128表現最好

label smoothing 可以在PGD-10和AA下提升1%，但是過度的平滑標籤會下降

optimizer 優化器，大部分的AT方法使用SGD的動量方法。實驗表明基於SGD的方法有相似的表現，而adam表現的更差。

weight decay 權重衰減對魯棒性影響很大，對準確率影響不大。

BAG OF TRICKS FOR ADVERSARIAL TRAINING

對抗訓練是最有效的用於提升模型魯棒性的策略之一。但是在AT上的許多改進不如簡單地提前停止訓練過程有效。

OCR - 2 - PP-OCRv2: Bag of Tricks for Ultra Lightweight OCR System - 1 - 論文學習

PP-OCRv2: Bag of Tricks for Ultra Lightweight OCR System Abstract 光學字元識別（OCR）系統已廣泛應用於各種應用場合。設計OCR系統仍然是一項具有挑戰性的任務。在以前的工作中，我們提出了一個實用的

LTD: Low Temperature Distillation for Robust Adversarial Training

目錄概主要內容 Chen E. and Lee C. LTD: Low temperature distillation for robust adversarial training. arXiv preprint arXiv:2111.02331, 2021.

DropAttack: A Masked Weight Adversarial Training Method to Improve Generalization of Neural Networks

目錄概主要內容程式碼 Ni S., Li J. and Kao H. DropAttack: a masked weight adversarial training method to improve generalization of neural networks. In International Conference on Learning Repr

Towards the Memorization Effect of Neural Networks in Adversarial Training

目錄概主要內容 typcial 和 atypical 樣本 atypical 較差的泛化性 typcial 和 atypical 樣本在魯棒性上的衝突

【GAN論文-01】翻譯-Progressive growing of GANS for improved quality ，stability，and variation-論文

Published as a conference paper at ICLR 2018 Tero Karras、Timo Aila、Samuli Laine and Jaakko Lehtinen

Bag of mice

題目：這裡有w只白鼠和b只黑鼠，龍和王妃輪流從袋子裡抓鼠，每次抓一隻，抓到第一隻白鼠的人獲勝。當龍抓一隻鼠時，袋子裡會跑掉一隻鼠，跑掉的鼠是等概率的。問王妃獲勝的概率。

使用scikit-learn進行自然語言處理——文件特徵提取(基於詞袋模型bag-of-words) 計算tf-idf

首先python環境已經安裝了numpy, scipy, sklearn, jieba # coding=utf-8 \"\"\" @desc: \"\"\" from scipy import sparse

陣列遍歷forEach,for in,for of和for優缺點

forEach(value,index,a) 定義：用於呼叫陣列的每個元素，並將元素傳遞給回撥函式優點：便利的時候更加簡潔，效率和for迴圈相同，不用關心集合下標的問題，減少了出錯的效率

kaggle 入門比賽：使用隨機森林解Bag of Words Meets Bags of Popcorn解題報告

　　這個kaggle比賽就是使用word2Vec，將句子轉換為多個詞向量進行情感分析，判斷句子是好評還是差評。

CCS - Digital Transmission via Carrier Modulation - Probability of Error for QAM in an AWGN Channel

Probability of Error for QAM in an AWGN Channel Matlab Coding 1 % MATLAB script for Illustrative Problem 7.6.

0948. Bag of Tokens (M)

Bag of Tokens (M) 題目 You have an initial power of P, an initial score of 0, and a bag of tokens where tokens[i] is the value of the ith token (0-indexed).

java.lang. ArrayIndexDut0fBoundsException: Index 0 out of bounds for length 0

技術標籤：BUG人生我是在力扣提交答案出現的這個問題，百思不得其解答，最後看的力扣的評論區才發現的，原來力扣測試用的是一個空陣列，而我沒有排除這種情況導致陣列索引越界了。解決方法加上下面的程式碼，

【悟空雲課堂】第二十九期：通用異常捕獲宣告（CWE-396: Declaration of Catch for Generic Exception）

技術標籤：悟空雲課堂程式碼規範安全安全漏洞資訊保安java 關注公眾號“中科天齊軟體安全中心”（id：woocoom），一起漲知識！

[JS]for/of與for/in

for/of迴圈專門用於可迭代物件，可迭代物件有陣列、字串、集合和對映。for/of必須是可迭代物件，而for/in可以是任意物件。

for...of與for...in的區別

轉載：for...of與for...in的區別無論是for...in還是for...of語句都是迭代一些東西。它們之間的主要區別在於它們的迭代方式。

Appendix F. Tips and tricks for SSH/PuTTY

AppendixF.Tips and tricks for SSH/PuTTY 需要先去putty官網下載putty客戶端，TortoiseGit自帶的不行，自帶的，只能生成。

Understanding and Improving Fast Adversarial Training

目錄概主要內容Random Step的作用線性性質gradient alignment程式碼 Andriushchenko M. and Flammarion N. Understanding and improving fast adversarial training. In Advances in Neural Information Processin

5分鐘NLP：從 Bag of Words 到 Transformer 的時間年表總結

本文不是 NLP 研究的完整列表，因為太多了無法總結的這麼完整！但是本文對影響NLP研究的一些重要的模型進行總結，並儘量讓它簡約而不是簡單，如果你剛剛進入NLP領域，本文可以作為深入研究該領域的起點。

論文導讀：Universal Adversarial Training

在這篇論文中，作者提出了一種優化的方法來找到給定模型的通用對抗樣本（首先在 Moosavi-Desfooli 等人 [1] 中引入）。作者還提出了一種低成本演算法來增強模型對此類擾動的魯棒性。

BAG OF TRICKS FOR ADVERSARIAL TRAINING

預設設定：

相關推薦