mnist各種網路研究1 實驗記錄

阿新 • • 發佈：2018-12-05

這次主要看看修改網路結構後，acc、引數個數、運算量之間的關係。
模型均用keras編寫，sgd或者adam優化，4顯示卡並行訓練，batch_size=2000（效能會降低，但是訓練速度快）
下面先列舉訓練的各種網路
Net1：直接softmax分為10類
test accuracy 0.9169
在這裡插入圖片描述
Net2：2層全連線層
test accuracy 0.9843

Net3：標準卷積網路（本網路訓練adam比sgd結果要好）
test accuracy 0.9921

Net4 標準網路去掉maxpool，採用stride=(2,2)方式
test accuracy 0.9881

Net5 使用可分離卷積
test accuracy 0.9877

with tf.device('/cpu:0'):
    input_image = Input(shape=(28,28,1))
    cnn = SeparableConv2D(32, (3,3),strides=(2,2),padding='same',activation='relu')(input_image)
    cnn = SeparableConv2D(64, (3,3),strides=(2,2),padding='same',activation='relu')(cnn)
    cnn = Flatten()(cnn)
    feature = Dense(1024,activation='relu')(cnn)
    feature = Dropout(0.5)(feature)
    predict = Dense(num_classes,activation='softmax',name='softmax')(feature) 
    model = Model(inputs=input_image, outputs=predict)
adam = Adam(lr=1e-4)
model.compile(optimizer=adam,loss='sparse_categorical_crossentropy',metrics=['accuracy'])

在這裡插入圖片描述
Net6 Net5，使用可分離卷積卷積到1024
test accuracy 0.9715

with tf.device('/cpu:0'):
    input_image = Input(shape=(28,28,1))
    cnn = SeparableConv2D(32, (3,3),strides=(2,2),padding='same',activation='relu')(input_image)
    cnn = SeparableConv2D(64, (3,3),strides=(2,2),padding='same',activation='relu')(cnn)
    cnn = SeparableConv2D(1024, (7,7),padding='valid',activation='relu')(cnn)    
    cnn = Flatten()(cnn)
    feature = Dropout(0.5)(cnn)
    predict = Dense(num_classes,activation='softmax',name='softmax')(feature) 
    model = Model(inputs=input_image, outputs=predict)

adam = Adam(lr=1e-4)
model.compile(optimizer=adam,loss='sparse_categorical_crossentropy',metrics=['accuracy'])

在這裡插入圖片描述
Net7 Net6使用改變學習率的sgd
test accuracy 0.9748

sgd = optimizers.SGD(lr=.1, momentum=0.9, nesterov=True)
model.compile(optimizer=sgd,loss='sparse_categorical_crossentropy',metrics=['accuracy'])
model_p = multi_gpu_model(model,4)
model_p.compile(optimizer=sgd,loss='sparse_categorical_crossentropy',metrics=['accuracy'])

def scheduler_200_81_122(epoch):
    if epoch < 121:
        return 0.01
    if epoch < 162:
        return 0.001
    return 0.0001

cb_lr = LearningRateScheduler(scheduler_200_81_122)
cbks = [cb_lr]

model_p.fit(x_train,y_train,batch_size=2000,epochs=200,
    callbacks=cbks,
    validation_data=(x_test, y_test))

在這裡插入圖片描述
Net8 Net7修改卷積核5*5
test accuracy 0.9788

with tf.device('/cpu:0'):
    input_image = Input(shape=(28,28,1))
    cnn = SeparableConv2D(32, (5,5),strides=(2,2),padding='same',activation='relu')(input_image)
    cnn = SeparableConv2D(64, (5,5),strides=(2,2),padding='same',activation='relu')(cnn)
    cnn = SeparableConv2D(1024, (7,7),padding='valid',activation='relu')(cnn)    
    cnn = Flatten()(cnn)
    feature = Dropout(0.5)(cnn)
    predict = Dense(num_classes,activation='softmax',name='softmax')(feature) 
    model = Model(inputs=input_image, outputs=predict)

在這裡插入圖片描述
Net9 Net8通道全部減小到50%
test accuracy 0.9735

with tf.device('/cpu:0'):
    input_image = Input(shape=(28,28,1))
    cnn = SeparableConv2D(16, (5,5),strides=(2,2),padding='same',activation='relu')(input_image)
    cnn = SeparableConv2D(32, (5,5),strides=(2,2),padding='same',activation='relu')(cnn)
    cnn = SeparableConv2D(512, (7,7),padding='valid',activation='relu')(cnn)    
    cnn = Flatten()(cnn)
    feature = Dropout(0.5)(cnn)
    predict = Dense(num_classes,activation='softmax',name='softmax')(feature) 
    model = Model(inputs=input_image, outputs=predict)

在這裡插入圖片描述
Net10 Net9通道全部減小到50%
test accuracy 0.9687

with tf.device('/cpu:0'):
    input_image = Input(shape=(28,28,1))
    cnn = SeparableConv2D(8, (5,5),strides=(2,2),padding='same',activation='relu')(input_image)
    cnn = SeparableConv2D(16, (5,5),strides=(2,2),padding='same',activation='relu')(cnn)
    cnn = SeparableConv2D(256, (7,7),padding='valid',activation='relu')(cnn)    
    cnn = Flatten()(cnn)
    feature = Dropout(0.5)(cnn)
    predict = Dense(num_classes,activation='softmax',name='softmax')(feature) 
    model = Model(inputs=input_image, outputs=predict)

在這裡插入圖片描述
Net11 2個Net10合併
test accuracy 0.9716

with tf.device('/cpu:0'):
    input_image = Input(shape=(28,28,1))
    
    cnn = SeparableConv2D(8, (5,5),strides=(2,2),padding='same',activation='relu')(input_image)
    cnn = SeparableConv2D(16, (5,5),strides=(2,2),padding='same',activation='relu')(cnn)
    cnn = SeparableConv2D(256, (7,7),padding='valid',activation='relu')(cnn)  
    cnn = Flatten()(cnn)
    
    cnn2 = SeparableConv2D(8, (5,5),strides=(2,2),padding='same',activation='relu')(input_image)
    cnn2 = SeparableConv2D(16, (5,5),strides=(2,2),padding='same',activation='relu')(cnn2)
    cnn2 = SeparableConv2D(256, (7,7),padding='valid',activation='relu')(cnn2)
    cnn2 = Flatten()(cnn2)
    
    cnn = concatenate([cnn,cnn2],axis=1)
    feature = Dropout(0.5)(cnn)
    predict = Dense(num_classes,activation='softmax',name='softmax')(cnn) 
    model = Model(inputs=input_image, outputs=predict)

在這裡插入圖片描述
Net12 Net10和Net1修改版合併
test accuracy 0.9675

with tf.device('/cpu:0'):
    input_image = Input(shape=(28,28,1))
    
    cnn = SeparableConv2D(8, (5,5),strides=(2,2),padding='same',activation='relu')(input_image)
    cnn = SeparableConv2D(16, (5,5),strides=(2,2),padding='same',activation='relu')(cnn)
    cnn = SeparableConv2D(256, (7,7),padding='valid',activation='relu')(cnn)  
    cnn = Flatten()(cnn)
    
    F2 = Flatten()(input_image)
    F2 = Dense(256,activation='relu')(F2)
    
    cnn = concatenate([cnn,F2],axis=1)
    feature = Dropout(0.5)(cnn)
    predict = Dense(num_classes,activation='softmax',name='softmax')(cnn) 
    model = Model(inputs=input_image, outputs=predict)

在這裡插入圖片描述
Net13 2個不同引數的Net10合併
test accuracy 0.9661

with tf.device('/cpu:0'):
    input_image = Input(shape=(28,28,1))
    
    cnn = SeparableConv2D(8, (5,5),strides=(2,2),padding='same',activation='relu')(input_image)
    cnn = SeparableConv2D(16, (5,5),strides=(2,2),padding='same',activation='relu')(cnn)
    cnn = SeparableConv2D(256, (7,7),padding='valid',activation='relu')(cnn)  
    cnn = Flatten()(cnn)
    
    cnn2 = SeparableConv2D(8, (3,3),strides=(2,2),padding='same',activation='relu')(input_image)
    cnn2 = SeparableConv2D(16, (3,3),strides=(2,2),padding='same',activation='relu')(cnn2)
    cnn2 = SeparableConv2D(256, (7,7),padding='valid',activation='relu')(cnn2)
    cnn2 = Flatten()(cnn2)
    
    cnn = concatenate([cnn,cnn2],axis=1)
    feature = Dropout(0.5)(cnn)
    predict = Dense(num_classes,activation='softmax',name='softmax')(cnn) 
    model = Model(inputs=input_image, outputs=predict)

在這裡插入圖片描述
Net14 Net10修改為77卷積
test accuracy 0.9723

Net15 Net14上修改第二層卷積為11 33 55合併
test accuracy 0.9759

with tf.device('/cpu:0'):
    input_image = Input(shape=(28,28,1))
    cnn = SeparableConv2D(8, (7,7),strides=(2,2),padding='same',activation='relu')(input_image)
    cnn1 = Conv2D(16, (1,1),strides=(2,2),padding='same',activation='relu')(cnn)
    cnn2 = SeparableConv2D(16, (5,5),strides=(2,2),padding='same',activation='relu')(cnn)
    cnn3 = SeparableConv2D(16, (3,3),strides=(2,2),padding='same',activation='relu')(cnn)

    cnn = concatenate([cnn1,cnn2,cnn3],axis=3)
    cnn = SeparableConv2D(256, (7,7),padding='valid',activation='relu')(cnn)
    cnn = Flatten()(cnn)

    feature = Dropout(0.5)(cnn)
    predict = Dense(num_classes,activation='softmax',name='softmax')(feature) 
    model = Model(inputs=input_image, outputs=predict)

在這裡插入圖片描述
Net16 Net14上修改最後為標準卷積方式
test accuracy 0.982

with tf.device('/cpu:0'):
    input_image = Input(shape=(28,28,1))
    
    cnn = SeparableConv2D(8, (7,7),strides=(2,2),padding='same',activation='relu')(input_image)
    cnn = SeparableConv2D(16, (7,7),strides=(2,2),padding='same',activation='relu')(cnn)
    cnn = Conv2D(256, (7,7),padding='valid',activation='relu')(cnn)  
    cnn = Flatten()(cnn)

    feature = Dropout(0.5)(cnn)
    predict = Dense(num_classes,activation='softmax',name='softmax')(cnn) 
    model = Model(inputs=input_image, outputs=predict)

在這裡插入圖片描述

mnist各種網路研究1 實驗記錄

mnist各種網路研究1 實驗記錄

mnist各種網路研究3 網路組合

mnist各種網路研究2 結果統計

【實習日誌】TSN 網路學習與實驗記錄/Constructor returned NULL && protobuf import error

sqli-labs 1-20實驗記錄

壓縮神經網路實驗記錄（剪枝 + rebirth + mobilenet）

# [cs231n （八）神經網路總結：最小網路案例研究 ][1]

python 評分卡建模記錄---使用到的各種函式（1）

unity3d研究1-點擊選中物體

spring源碼研究1

Android Handler研究(1)

Centos 7 安裝OCSInventory NG 2.3.1全記錄

fcn+caffe+siftflow實驗記錄

Appium react@~15.3.1 編輯記錄

20162304 2017-2018-1 實驗四-圖的實現與應用

12.redis的AOF持久化深入講解各種操作和相關實驗

有人在貼吧問phpmyadmin如何設置插入的時候默認插入1條記錄

網路對抗技術實驗四

中國人民公安大學網路對抗技術實驗報告一

網路對抗技術實驗六綜合滲透學號

mnist各種網路研究1 實驗記錄

相關推薦