1. 程式人生 > >《深度學習網路訓練--第一講》資料採集與資料預處理

《深度學習網路訓練--第一講》資料採集與資料預處理

經過專案的實踐,我感受到要想訓練出一個性能優良的模型網路,資料採集與預處理是多麼的艱難與重要。

  • 資料的採集

資料的採集是一個費時費力的過程。對於人臉資料來說,針對產品的應用場景,需要採集不同環境變數的人臉影象。對於我的經驗來說,公司想要做一個人臉識別的AI產品,採集人臉的時候,往往採用發動全公司員工積極配合採集人臉,但是這樣的人臉資料往往多樣性比較差,也就是說人頭個數沒有多少,但是一個人可以採集多張不同角度和不同光照條件下的人臉影象。如果採用深度學習的方法來做,這樣的資料集往往是不合格的,多樣性不夠,人臉圖片數量也不夠多。為了能夠應用深度學習演算法,可以有兩種方法擴充資料集: 1) 摻入公開資料集 2) 資料增強。也就是對每一張人臉圖片進行旋轉,白化等操作。

.

  • 訓練之前的資料預處理