在訓練過程中加入Dropout

阿新 • • 發佈：2018-11-27

Dropout是在訓練過程中，隨機地忽略部分神經元——也就是說，在正向傳播的過程中，這些被忽略的神經元對下游神經元的貢獻效果暫時消失，在反向傳播中，這些神經元也不會有任何權值的更新。

Dropout的思想的出現，主要是為了解決過擬合的問題。雖然說採用組合方法，也就是訓練多個模型，能夠在一定程度上解決過擬合的問題，但是會帶來非常大的時間開銷，而Dropout可以很好的解決這個問題。

在Keras的每個權重更新週期中，按照給定概率（比如說20%），隨機選擇要丟棄的節點，以實現Dropout。Dropout只能在模型訓練過程中使用，在評估模型時不能使用。

Dropout的使用分為兩種：

（一）在輸入層使用Dropout：

這裡在輸入層之後新增一個新的Dropout層，Dropout率設為20%——即每個更新週期中20%的輸入將被隨機排除。

"""
為了提高泛化能力，解決過擬合問題，引入Dropout
"""
#這裡是在輸入層使用Dropout
from sklearn import datasets
import numpy as np
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import Dropout
from keras.optimizers import SGD
from keras.wrappers.scikit_learn import KerasClassifier
from sklearn.model_selection import cross_val_score
from sklearn.model_selection import KFold

#匯入資料
dataset = datasets.load_iris()
x=dataset.data
Y=dataset.target
#隨機種子
seed=7
np.random.seed(seed)

#構建模型函式
def create_model(init='glorot_uniform'):
    #構建模型
    model = Sequential()
    model.add(Dropout(rate=0.2, input_shape=(4,)))
    model.add(Dense(units=4, activation='relu', kernel_initializer=init))
    model.add(Dense(units=6, activation='relu', kernel_initializer=init))
    model.add(Dense(units=3, activation='softmax', kernel_initializer=init))

    #定義Dropout
    sgd = SGD(lr=0.01, momentum=0.8, decay=0.0, nesterov=False)
    #編譯模型
    model.compile(loss='categorical_crossentropy', optimizer=sgd, metrics=['accuracy'])

    return model

model = KerasClassifier(build_fn=create_model, epochs=200, batch_size=5, verbose=0)
kfold = KFold(n_splits=10,shuffle=True, random_state=seed)
results = cross_val_score(model, x, Y, cv=kfold)
print('accuracy: %.2f%% (%.2f)' % (results.mean()*100, results.std()))

這裡結果顯示Accuracy為：

accuracy: 84.00% (0.11)

（二）在隱藏層使用Dropout：

Dropout同樣可以應用於神經網路模型中的隱藏層神經元。這裡將在兩個隱藏層之間，以及最後一個隱藏層和輸出層之間使用Dropout。這裡也將Dropout率設定為20%，並對權重進行約束，使其最大限度不超過3。

"""
為了提高泛化能力，解決過擬合問題，引入Dropout
"""
#這裡是在隱藏層之間層使用Dropout
from sklearn import datasets
import numpy as np
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import Dropout
from keras.optimizers import SGD
from keras.wrappers.scikit_learn import KerasClassifier
from sklearn.model_selection import cross_val_score
from sklearn.model_selection import KFold

#新引入限制權值的引數
from keras.constraints import max_norm

#匯入資料
dataset = datasets.load_iris()
x=dataset.data
Y=dataset.target
#隨機種子
seed=7
np.random.seed(seed)

#構建模型函式
def create_model(init='glorot_uniform'):
    #構建模型
    model = Sequential()
    model.add(Dense(units=4, activation='relu', input_dim=4, kernel_initializer=init, kernel_constraint=max_norm(3)))
    model.add(Dropout(rate=0.2))
    model.add(Dense(units=6, activation='relu', kernel_initializer=init, kernel_constraint=max_norm(3)))
    model.add(Dropout(rate=0.2))
    model.add(Dense(units=3, activation='softmax', kernel_initializer=init))

    #定義Dropout
    sgd = SGD(lr=0.01, momentum=0.8, decay=0.0, nesterov=False)
    #編譯模型
    model.compile(loss='categorical_crossentropy', optimizer=sgd, metrics=['accuracy'])

    return model

model = KerasClassifier(build_fn=create_model, epochs=200, batch_size=5, verbose=0)
kfold = KFold(n_splits=10,shuffle=True, random_state=seed)
results = cross_val_score(model, x, Y, cv=kfold)
print('accuracy: %.2f%% (%.2f)' % (results.mean()*100, results.std()))

這裡結果：

accuracy: 86.00% (0.14)

在訓練過程中加入Dropout

Dropout是在訓練過程中，隨機地忽略部分神經元——也就是說，在正向傳播的過程中，這些被忽略的神經元對下游神經元的貢獻效果暫時消失，在反向傳播中，這些神經元也不會有任何權值的更新。 Dropout的思想的出現，主要是為了解決過擬合的問題。雖然說採用組合方法，也就是訓練多個模型，能夠在一定程度上

TensorFlow之tf.nn.dropout()：防止模型訓練過程中的過擬合問題

AC -- 輸出 array 全連接 spa () 激活 odin 一：適用範圍：　　tf.nn.dropout是TensorFlow裏面為了防止或減輕過擬合而使用的函數，它一般用在全連接層二：原理：　　dropout就是在不同的訓練過程中隨機扔掉一部分神經元。也就是

DeepLearning tutorial（2）機器學習演算法在訓練過程中儲存引數

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

訓練過程中使用學習率衰減

隨機梯度下降演算法的效能與學習率有著直接的關係，這是因為學習率決定了引數移動到最優值時的速度。如果學習率過大很可能會越過最優值，如果學習率過小，優化的效率可能過低，收斂時間極長。那麼一個很好的解決方案就是學習率衰減——即學習率隨著訓練的進行逐漸衰減。在訓練過程開始時，使用較大的學習率，這樣就能

SSD訓練過程中出現問題總結

Check failed: 0 == bottom[0]->count() % explicit_count (0 vs. 60) bottom count (209472) must be divisible by the product of the spe

tensorflow在訓練過程中逐步減少學習率

# 宣告學習率為不可訓練 learning_rate = tf.Variable(float(learning_rate), trainable=False, dtype=tf.float32) #

caffe訓練過程中的視覺化

import matplotlib.pyplot as plt import caffe caffe.set_device(0) caffe.set_mode_gpu() # 使用SGDSolver，即隨機梯度下降演算法 solver = caffe

caffe訓練過程中，訓練中斷之後，如何接著訓練？

zxw.sh /home/tyn/Downloads/center_loss_caffe/build/tools/caffe train -solver face_solver.prototxt --snapshot=center_loss_model_iter_9000

機器學習torch程式碼訓練過程中常見bug解決經驗

1.out of memory THCudaCheck FAIL file=/tmp/luarocks_cutorch-scm-1-3726/cutorch/lib/THC/generic/THCStorage.cu line=66 error=2 : out of

Tensorflow GPU訓練過程中遇到的問題總結

錯誤型別：CUDA_ERROE_OUT_OF_MEMORYGPU的全部memory資源不能全部都申請，可以通過修改引數來解決：在session定義前增加config = tf.ConfigProto(allow_soft_placement=True)#最多佔gpu資源的70

解決Caffe訓練過程中loss不變問題

1.loss等於87.33不變 loss等於87.33這個問題是在對Inception-V3網路不管是fine-tuning還是train的時候遇到的，無論網路迭代多少次，網路的loss一直保持恆定。查閱相關資料以後發現是由於loss的最大值由FL

YOLO訓練視覺化訓練過程中的中間引數-解析

等待訓練結束後（有時還沒等結束模型就開始發散了），因此需要檢測各項指標（如loss）是否達到了我們期望的數值，如果沒有，要分析為什麼。視覺化訓練過程的中間引數可以幫助我們分析問題。視覺化中間引數需要用到訓練時儲存的log檔案： ./darknet detec

理解YOLOv2訓練過程中輸出引數含義

最近有人問起在YOLOv2訓練過程中輸出在終端的不同的引數分別代表什麼含義，如何去理解這些引數？本篇文章中我將嘗試著去回答這個有趣的問題。剛好現在我正在訓練一個YOLOv2模型，拿這個真實的例子來討論再合適不過了，下邊是我訓練中使用的 .cfg 檔案（你可以在cfg資料夾下找

caffe訓練過程中出現的錯誤

前兩天又在伺服器上裝了一遍caffe系統，遇到的錯誤。。。。真的想噴幾口老血決定將之後遇到的caffe訓練過程中的錯誤記錄下來，防止一遍一遍又一遍的百度， 1、 Check failed: top_shape[j] == bottom[i]->sha

寫給程式設計師的機器學習入門 (四) - 訓練過程中常用的技巧

這篇將會著重介紹使用 pytorch 進行機器學習訓練過程中的一些常見技巧，掌握它們可以讓你事半功倍。使用的程式碼大部分會基於上一篇最後一個例子，即根據碼農條件預測工資

在訓練的過程中降低學習率

moni 常常 itl monitor steps 形式 spa AC 結果隨著學習的進行，深度學習的學習速率逐步下降為什麽比固定的學習速率得到的結果更加準確？如上圖所示，曲線代表損失值，小球一開始位於(1)處，假設學習速率設置為 △ v，那麽根據梯度下降，損失

訓練過程--正則化(regularization)技巧(包括L2正則化、dropout，資料增廣，早停)

正則化（regularization）正則化是解決高方差問題的重要方案之一，也是Reducing Overfiltering（克服過擬合）的方法。過擬合一直是DeepLearning的大敵，它會導致訓練集的error rate非常小，而測試集的error rate大部分時候很

yolo的訓練和測試過程中踩過的坑

1.執行main.py,報錯：SyntaxError: Missing parentheses in call to 'print' 錯誤原因：因為安裝的是python3的版本但是這個程式是2.

用自己的資料集訓練Mask-RCNN實現過程中的坑

本文僅僅是自己實現過程的筆記記錄，僅僅用來交流的。在網上大量蒐集資料後，實現Mask-RCNN，但是過程中還是出現了很多很多的問題，所以將過程記錄如下，方便日後學習。一、實驗前準備 1. COCO資料集 COCO的全稱是Common Objects in COn

caffe：如何儲存訓練模型過程中的日誌？

訓練時，輸入以下命令即可 $ sudo GLOG_logtostderr=0 GLOG_log_dir='xxx/xxx/xxx/' build/tools/caffe train -solver e

在訓練過程中加入Dropout

相關推薦