DL影象資料增廣

資料增廣

計算機視覺有七類分類問題：
不同的視角，不同的大小，物體的形變問題，物體的遮擋問題，光照條件，背景複雜的問題，每一類中有多種形態的問題。
而資料增廣的思路也就是解決這個問題。資料增廣如何增廣就要從實際的問題出發，比如醫學的圖片基本上拍攝的時候視角是固定的，所以就不需要不同視角的增廣。木紋檢測中視角是不固定的，就需要不同的視角，不同的大小的增廣，還需要應不同的光照條件對資料進行增廣。

在不改變影象類別的情況下，增加資料量，能提高模型的泛化能力

自然影象的資料增廣方式包括很多，如常用的水平翻轉（horizontally flipping），一定程度的位移或者裁剪和顏色抖動（color jittering）。此外還可以嘗試多種操作的組合，例如同時做旋轉和隨機尺度變換，此外還可以把每個patch中所有畫素在HSV顏色空間中的飽和度和明度提升0.25-4次冪方，乘以0.7-1.4之間的一個因子，再加一個-0.1-0.1之間的值。同樣你可以在色調通道（H）對每張圖片或patch的所有畫素增加一個-0.1-0.1之間的值。

資料增廣很重要，好的資料增廣可以提高2-3個百分點，但是要注意方式，比如在我服裝檢測問題上沒有必要對影象上下反轉。深度學習框架一般能夠提供的影象增廣方法很有限，需要使用額外的庫進行，推薦imgaug，神器

增廣程式碼_來自部落格：

def customizedImgAug(input_img):
    rarely = lambda aug: iaa.Sometimes(0.1, aug)
    sometimes = lambda aug: iaa.Sometimes(0.25, aug)
    often = lambda aug: iaa.Sometimes(0.5, aug)

    seq = iaa.Sequential([
        iaa.Fliplr(0.5 
),
often(iaa.Affine(
            scale={"x": (0.9, 1.1), "y": (0.9, 1.1)},
translate_percent={"x": (-0.1, 0.1), "y": (-0.12, 0)},
rotate=(-10, 10),
shear=(-8, 8),
order=[0, 1],
cval=(0, 255),
)),
iaa.SomeOf((0, 4), [
            rarely(
                iaa.Superpixels(
                    p_replace=(0, 0.3),
n_segments 
=(20, 200)
                )
            ),
iaa.OneOf([
                iaa.GaussianBlur((0, 2.0)),
iaa.AverageBlur(k=(2, 4)),
iaa.MedianBlur(k=(3, 5)),
]),
iaa.Sharpen(alpha=(0, 0.3), lightness=(0.75, 1.5)),
iaa.Emboss(alpha=(0, 1.0), strength=(0, 0.5)),
rarely(iaa.OneOf([
                iaa.EdgeDetect(alpha=(0, 0.3)),
iaa.DirectedEdgeDetect(
                    alpha=(0, 0.7), direction=(0.0, 1.0)
                ),
])),
iaa.AdditiveGaussianNoise(
                loc=0, scale=(0.0, 0.05 * 255), per_channel=0.5
),
iaa.OneOf([
                iaa.Dropout((0.0, 0.05), per_channel=0.5),
iaa.CoarseDropout(
                    (0.03, 0.05), size_percent=(0.01, 0.05),
per_channel=0.2
),
]),
rarely(iaa.Invert(0.05, per_channel=True)),
often(iaa.Add((-40, 40), per_channel=0.5)),
iaa.Multiply((0.7, 1.3), per_channel=0.5),
iaa.ContrastNormalization((0.5, 2.0), per_channel=0.5),
iaa.Grayscale(alpha=(0.0, 1.0)),
sometimes(iaa.PiecewiseAffine(scale=(0.01, 0.03))),
sometimes(
                iaa.ElasticTransformation(alpha=(0.5, 1.5), sigma=0.25)
            ),
], random_order=True),
iaa.Fliplr(0.5),
iaa.AddToHueAndSaturation(value=(-10, 10), per_channel=True)
    ], random_order=True)  # apply augmenters in random order
output_img = seq.augment_image(input_img)
    return output_img

還可做一些其他處理：

2、shuffle，打亂資料進行訓練是必須的，防止相鄰樣本有較強相關性。

3、影象標準化，計算資料集的std與mean，而不是直接使用imagenet的std與mean

4、增大影象的輸入尺寸可獲得客觀的提升，本例最終使用了480*480的輸入尺寸

4、選擇合適的遷移學習方式，本例進行全域性finetune比只訓練最後1層或幾層好很多

5、可以先用Adam快速收斂，後面階段用SGD慢慢調

6、模型融合，舉辦方在複賽限制最多隻能用兩個模型是明智的，初賽都有隊伍用接近10個模型進行融合，如此刷分就沒意義了

7、對測試集圖片進行增強，比如映象，旋轉，再預測並取平均。可以得到更魯棒的結果。這裡沒有用到tencrop，因為樣本有些特徵在頂部或者底部，tencrop會將特徵截走，導致成績降低。

參考樣例：

addpath('test');addpath('train');fid = fopen('C:\Users\Byte\Desktop\data.txt','wt')file_path = 'C:\Users\Byte\Desktop\test_label\'; %影象資料夾路徑save_path = 'C:\Users\Byte\Desktop\cc_test\'; %影象資料夾路徑% img_path_list = dir(strcat(file_path,'*.jpg')); %獲取資料夾中所有jpg格式影象img_path_list = dir(strcat(file_path,'*.png'));img_num = length(img_path_list); %獲取總數if img_num > 0for j = 1 : img_numimg_name = img_path_list(j).name;image = imread(strcat(file_path,img_name));img_name_core = img_name(1:end-4); %除去後綴名fprintf('%d %d %s\n',i,j,strcat(file_path,img_name));fprintf('%s\n',strcat(file_path,img_name(1:end-4)));%影象增廣%翻轉flipdimimg_u = flipdim(image,1);img_r = flipdim(image,2);img_ur = flipdim(img_r,1);imwrite(img_u,strcat(save_path,img_name_core,'_u.png'));imwrite(img_r,strcat(save_path,img_name_core,'_r.png'));imwrite(img_ur,strcat(save_path,img_name_core,'_ur.png')); %亮度調節%img_bright = imadjust(image,[0,1],[0,1],0.5);img_dark = imadjust(image,[0,1],[0,1],1.5);%imwrite(img_bright,strcat(save_path,img_name_core,'_b.jpg'));imwrite(img_dark,strcat(save_path,img_name_core,'_d.png'));%img_ub = imadjust(img_u,[0,1],[0,1],0.5);img_ud = imadjust(img_u,[0,1],[0,1],1.5);%imwrite(img_ub,strcat(save_path,img_name_core,'_ub.jpg'));imwrite(img_ud,strcat(save_path,img_name_core,'_ud.png'));%img_rb = imadjust(img_r,[0,1],[0,1],0.5);img_rd = imadjust(img_r,[0,1],[0,1],1.5);%imwrite(img_rb,strcat(save_path,img_name_core,'_rb.jpg'));imwrite(img_rd,strcat(save_path,img_name_core,'_rd.png'));%img_urb = imadjust(img_ur,[0,1],[0,1],0.5);img_urd = imadjust(img_ur,[0,1],[0,1],1.5);%imwrite(img_urb,strcat(save_path,img_name_core,'_urb.jpg'));imwrite(img_urd,strcat(save_path,img_name_core,'_urd.png'));%旋轉

DL影象資料增廣

[Tensorflow] 如何對兩幅影象做同樣的資料增廣操作

圖片資料增廣

訓練過程--正則化(regularization)技巧(包括L2正則化、dropout，資料增廣，早停)

深度學習中的資料增廣

深度學習訓練中關於資料處理方式--原始樣本採集以及資料增廣

深度學習資料增廣庫imgaug——Bounding Boxes變換

目標檢測訓練資料增廣--旋轉+尺度+顏色+裁剪

深度學習-MATLAB資料增廣

caffe資料層相關學習以及訓練線上資料增廣

深度學習之正則化系列（2）：資料集增強（資料增廣）

深度學習訓練資料python程式碼——資料增廣（二）

轉載+記錄資料增廣的八種常用方式

資料增廣領域知識

caffe資料層資料增廣

資料增廣 | 原圖和mask 同時增加——適用語義分割等

AutoML資料增廣

網絡流初步：<最大流>——核心（增廣路算法）

BZOJ.2668.[CQOI2012]交換棋子(費用流多路增廣)

騰訊AI Lab開源業內最大規模多標籤影象資料集（附下載地址）

DL影象資料增廣

相關推薦