1. 程式人生 > >CNN筆記(1)---資料擴充與資料預處理

CNN筆記(1)---資料擴充與資料預處理

1.Data Augmentation

1.1 簡單的資料擴充

影象水平翻轉
隨機扣取
尺度變換和旋轉
色彩抖動:在RGB顏色空間對原有RGB色彩分佈進行輕微擾動
          也可以在HSV空間隨機改變影象原有的飽和度和明度
          (改變S和V通道的值)
          或對色調進行微調(小範圍改變H的值)

1.2 特殊的資料擴充方式

1.2.1 Fancy PCA

  • 對所有訓練資料的R,G,B畫素值進行PCA,得到對應特徵向量pi和特徵值λi(i=1,2,3)
  • 根據特徵向量和特徵值計算一組隨機值[p1,p2,p3],[α1λ1,α2λ2,α3λ3]T
  • 將其作為擾動加到原畫素值,其中αi為取自以0為均值,標準差為0.1的高斯分佈的隨機值
  • 每經過一輪訓練(1個epoch),αi重新隨機選取,重複上述操作進行擾動

5.2.2 監督式資料擴充

適用於高層語義影象分類任務

  • 先訓練一個初始分類模型
  • 生成對應特徵圖/熱力圖:指示影象區域與場景標記間的相關概率。
  • 可根據此概率映射回原圖選擇較強相關的影象區域進行影象扣取

6.資料預處理

中心式歸一化(mean normalization)

CNN 中,計算訓練集影象畫素均值,在處理訓練集,驗證集和測試集影象時分別減去該均值。

原理:預設自然影象是一類平穩的資料分佈,每個樣本上減去資料的統計平均值(逐樣本計算),移除共同部分