1. 程式人生 > 其它 >[pytorch]資料集增強方法

[pytorch]資料集增強方法

資料增強的庫

pytorch自帶

imgaug

https://github.com/aleju/imgaug
資料增強(旋轉、翻轉、加噪聲、加對比度、亮度)
(更多操作,也可以加天氣效果,推薦)
它可以實現的效果包括新增噪音、仿射變換、裁剪、翻轉、旋轉等,其效果圖如下所示:

Augmentor

簡單操作

Albumentations

是 2018年的一篇論文《Albumentations: fast and flexible image augmentations》的實現程式碼
資料增強(新增下雨 下雪 霧效果)

速度比大部分的庫都要快;基於 numpy 和 OpenCV 兩個庫,並選擇最合適的一個介面簡單,靈活大量的多種的變換方法實現易於拓展應用到其他的任務或者庫支援的變換操作物件有影象、masks、關鍵點、邊界框支援 python 3.5-3.7 的版本可以和 PyTorch 結合使用已經被應用到很多深度學習的競賽中,包括 Kaggle、topcoder,CVPR,MICCAI作者是 Kaggle Masters

ImageEnhance

適用於opencv-python、PIL
同樣來自一篇論文《Biomedical image augmentation using Augmentor》

區分:

imgaug:操作更多(但相對opencv-python,程式碼簡潔),支援keypoint, bounding box同步處理 ******

Albumentations: 據說可以進行 加雨雪霧的效果

Augmentor:操作較少(但相對opencv-python,程式碼簡介)

ImageEnhance: 4種操作顏色增強

1、對比度:白色畫面(最亮時)下的亮度除以黑色畫面(最暗時)下的亮度;
2、色彩飽和度::彩度除以明度,指色彩的鮮豔程度,也稱色彩的純度;
3、色調:向負方向調節會顯現紅色,正方向調節則增加黃色。適合對膚色物件進行微調;
4、銳度:是反映影象平面清晰度和影象邊緣銳利程度的一個指標。

opencv-python:

1、隨機裁剪、旋轉、翻轉;
2、隨機顏色、明暗;
3、仿射變換;

資料增強的例子

資料增強的論文

Mixup
來自 ICLR 2018 的論文:《Mixup: BEYOND EMPIRICAL RISK MINIMIZATION》

Cutout
2017年的論文:《Improved Regularization of Convolutional Neural Networks with Cutout》

Cutmix
ICCV 2019 的論文:《CutMix:Regularization Strategy to Train Strong Classifiers with Localizable Features》

Augmix
ICLR 2020 的論文:《AUGMIX: A SIMPLE DATA PROCESSING METHOD TO IMPROVE ROBUSTNESS AND UNCERTAINTY》

fast-autoaugment
NeurlIPS 2019 的論文《 Fast AutoAugment》

AutoAugment
CVPR 2019 的論文 《AutoAugment:Learning Augmentation Strategies from Data》

RandAugment
ICLR 2020 的論文《RandAugment: Practical automated data augmentation with a reduced search space》

GridMask
2020年的論文題目《GridMask Data Augmentation》

imagecorruptions
2019 年的論文《Benchmarking Robustness in Object Detection:Autonomous Driving when Winter is Coming》

CycleGAN
ICCV 2017 年的一篇論文《Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networkss》,也是 GAN 領域非常有名的一篇論文

Small Object Augmentation
2019 年的論文《Augmentation for small object detection》