1. 程式人生 > >overfitting過擬合

overfitting過擬合

過擬合:指模型在訓練集上表現很好,但是在測試集上表現很差。

造成過擬合的原因:

1. 訓練集過小,模型無法cover所有可能的情況(泛化能力差);

2. 模型過於複雜,過於貼合訓練資料;

解決方法:

1. 增加訓練資料(增加訓練資料多樣性,提升模型泛化能力),e.g. CNN資料增強

2. 降低模型複雜度,使用簡單網路結構,淺層網路,簡單卷積核...,決策樹剪枝,GBDT的shrinkage;

3. Dropout;

4. Early stopping, 用於神經網路,指當在驗證集上的效能不再提升時停止訓練;

5. 正則化(L1可以起到特徵選擇的作用並減少噪聲,L2可以使權值更加平滑);

6. batch normalization

7. CNN中使用relu啟用函式,使得負區域為0;

 

未完待續...