1. 程式人生 > 實用技巧 >訓練技巧之資料增強(data augmentation)

訓練技巧之資料增強(data augmentation)

YouTube視訊
在這裡插入圖片描述
我們在訓練資料之前,需要先對輸入資料進行預處理,其中資料增強就是預處理過程中的一個手段,即通過這樣的方式能夠使得輸入資料成倍的增長。
為什麼要做資料增強
因為在深度學習領域,更多的資料能夠使得我們的模型更穩健,不太容易發生過擬合的現象,而有些時候我們並不能收集到足夠多的原始資料。
在這裡插入圖片描述
什麼是資料增強
對於圖片來說,資料增強的本質是要對輸入影象的畫素點的分佈、值的大小做一些根本性的變化,但是在變換的同時,需要保證影象的label值是不變的。
資料增強的方式
在這裡插入圖片描述
1、水平翻轉
是資料增強過程中的最常用的手段,因為對計算機來說,圖片的畫素值發生了根本性的變化;
在這裡插入圖片描述
2、隨機裁剪/縮放
crops的作用:一張圖片被裁剪成很多部分之後放進模型進行訓練,可以很好地訓練模型,增加模型的穩健性,因為我們在測試的時候會有光照、遮擋等問題的出現,如果沒有這些資料的訓練,可能模型無法對物體進行正確分類和識別等。

scale:將圖片進行放大和縮小。
在這裡插入圖片描述
3、translation:將某個物體進行平移;
4、rotation:進行角度變換;
5、stretch:拉伸;
6、shear:修剪
綜上,在實際應用中,這以上部分是一起進行的,讓計算機自己去進行一些隨機的操作。比如,給定translation的變換幅度在[-10,10],rotation的變換幅度在[-15°,15°]等,讓計算機自己在這些範圍內隨機組合。