Keras上實現卷積神經網路CNN——一個例子程式

阿新 • • 發佈：2019-01-07

一、概述及完整程式碼

本例的程式碼主要來自keras自帶的example裡的 mnist_cnn 模組，主要用到keras.layers中的Dense, Dropout, Activation, Flatten模組和keras.layers中的Convolution2D,MaxPooling2D。構建一個兩層卷積層兩層全連線層的簡單卷積神經網路，12次迴圈後可以達到99.25%的準確率，可見CNN的預測準確率已經相當高了。

import numpy as np
np.random.seed(1337)  # for reproducibility
from keras.datasets import 
 mnist
from keras.models import Sequential
from keras.layers import Dense, Dropout, Activation, Flatten
from keras.layers import Convolution2D, MaxPooling2D
from keras.utils import np_utils
from keras import backend as K

# 全域性變數
batch_size = 128
nb_classes = 10
epochs = 12
# input image dimensions
img_rows, img_cols = 28 
, 28
# number of convolutional filters to use
nb_filters = 32
# size of pooling area for max pooling
pool_size = (2, 2)
# convolution kernel size
kernel_size = (3, 3)

# the data, shuffled and split between train and test sets
(X_train, y_train), (X_test, y_test) = mnist.load_data()

# 根據不同的backend定下不同的格式 

if K.image_dim_ordering() == 'th':
    X_train = X_train.reshape(X_train.shape[0], 1, img_rows, img_cols)
    X_test = X_test.reshape(X_test.shape[0], 1, img_rows, img_cols)
    input_shape = (1, img_rows, img_cols)
else:
    X_train = X_train.reshape(X_train.shape[0], img_rows, img_cols, 1)
    X_test = X_test.reshape(X_test.shape[0], img_rows, img_cols, 1)
    input_shape = (img_rows, img_cols, 1)

X_train = X_train.astype('float32')
X_test = X_test.astype('float32')
X_train /= 255
X_test /= 255
print('X_train shape:', X_train.shape)
print(X_train.shape[0], 'train samples')
print(X_test.shape[0], 'test samples')

# 轉換為one_hot型別
Y_train = np_utils.to_categorical(y_train, nb_classes)
Y_test = np_utils.to_categorical(y_test, nb_classes)

#構建模型
model = Sequential()
"""
model.add(Convolution2D(nb_filters, kernel_size[0], kernel_size[1],
                        border_mode='same',
                        input_shape=input_shape))
"""
model.add(Convolution2D(nb_filters, (kernel_size[0], kernel_size[1]),
                        padding='same',
                        input_shape=input_shape)) # 卷積層1
model.add(Activation('relu')) #啟用層
model.add(Convolution2D(nb_filters, (kernel_size[0], kernel_size[1]))) #卷積層2
model.add(Activation('relu')) #啟用層
model.add(MaxPooling2D(pool_size=pool_size)) #池化層
model.add(Dropout(0.25)) #神經元隨機失活
model.add(Flatten()) #拉成一維資料
model.add(Dense(128)) #全連線層1
model.add(Activation('relu')) #啟用層
model.add(Dropout(0.5)) #隨機失活
model.add(Dense(nb_classes)) #全連線層2
model.add(Activation('softmax')) #Softmax評分

#編譯模型
model.compile(loss='categorical_crossentropy',
              optimizer='adadelta',
              metrics=['accuracy'])
#訓練模型
model.fit(X_train, Y_train, batch_size=batch_size, epochs=epochs,
          verbose=1, validation_data=(X_test, Y_test))
#評估模型
score = model.evaluate(X_test, Y_test, verbose=0)
print('Test score:', score[0])
print('Test accuracy:', score[1])

二、知識點詳解

1. 關於Keras可能會使用不同的backend

該選擇結構可以靈活對theano和tensorflow兩種backend生成對應格式的訓練資料格式。
舉例說明：’th’模式，即Theano模式會把100張RGB三通道的16×32（高為16寬為32）彩色圖表示為下面這種形式（100,3,16,32），Caffe採取的也是這種方式。第0個維度是樣本維，代表樣本的數目，第1個維度是通道維，代表顏色通道數。後面兩個就是高和寬了。
而TensorFlow，即’tf’模式的表達形式是（100,16,32,3），即把通道維放在了最後。
這兩個表達方法本質上沒有什麼區別。

# 根據不同的backend定下不同的格式
if K.image_dim_ordering() == 'th':
    X_train = X_train.reshape(X_train.shape[0], 1, img_rows, img_cols)
    X_test = X_test.reshape(X_test.shape[0], 1, img_rows, img_cols)
    input_shape = (1, img_rows, img_cols)
else:
    X_train = X_train.reshape(X_train.shape[0], img_rows, img_cols, 1)
    X_test = X_test.reshape(X_test.shape[0], img_rows, img_cols, 1)
    input_shape = (img_rows, img_cols, 1)

2. 二維卷積層Conv2D

keras.layers.convolutional.Conv2D(
filters, kernel_size, strides=(1,1), padding=’valid’, data_format=None, dilation_rate=(1,1), activation=None, use_bias=True, kernel_initializer=’glorot_uniform’, bias_initializer=’zeros’, kernel_regularizer=None, bias_regularizer=None, activity_regularizer=None, kernel_constraint=None, bias_constraint=None)
二維卷積層對二維輸入進行滑動窗卷積，當使用該層作為第一層時，應提供 input_shape 引數。

filters：卷積核的數目；
kernel_size：卷積核的尺寸；
strides：卷積核移動的步長，分為行方向和列方向；
padding：邊界模式，有“valid”，“same”或“full”，full需要以theano為後端；
其他引數請參看Keras官方文件。

3. 二維池化層MaxPooling2D

keras.layers.pooling.MaxPooling2D(pool_size=(2,2), strides=None, padding=’valid’, data_format=None)

對空域訊號進行最大值池化。

pool_size：池化核尺寸；
strides：池化核移動步長；
padding：邊界模式，有“valid”，“same”或“full”，full需要以theano為後端；
其他引數請參看Keras官方文件。

4. Activation層

keras.layers.core.Activation(activation)

啟用層對一個層的輸出施加啟用函式。

預定義啟用函式：
softmax，softplus，softsign，relu，tanh，sigmoid，hard_sigmoid，linear等。

5. Dropout層

keras.layers.core.Dropout(p)

為輸入資料施加Dropout。Dropout將在訓練過程中每次更新引數時隨機斷開一定百分比（p）的輸入神經元連線，Dropout層用於防止過擬合。

Flatten層

keras.layers.core.Flatten()

Flatten層用來將輸入“壓平”，即把多維的輸入一維化，常用在從卷積層到全連線層的過渡。Flatten不影響batch的大小。

例子：

model =Sequential()
model.add(Convolution2D(64,3, 3, border_mode='same', input_shape=(3, 32, 32)))
# now:model.output_shape == (None, 64, 32, 32)
model.add(Flatten())
# now:model.output_shape == (None, 65536)

7.Dense層全連線層

keras.layers.core.Dense(units,activation=None, use_bias=True, kernel_initializer=’glorot_uniform’,bias_initializer=’zeros’, kernel_regularizer=None, bias_regularizer=None,activity_regularizer=None, kernel_constraint=None, bias_constraint=None)

units：輸出單元的數量，即全連線層神經元的數量，作為第一層的Dense層必須指定input_shape。

8. Sequential模型compile方法

compile(self,optimizer, loss, metrics=[], sample_weight_mode=None)

編譯用來配置模型的學習過程，其引數有：

optimizer：字串（預定義優化器名）或優化器物件；
loss：字串（預定義損失函式名）或目標函式；
metrics：列表，包含評估模型在訓練和測試時的網路效能的指標，典型用法是metrics=[‘accuracy’]；

9. Sequential模型fit方法

fit(self,x, y, batch_size=32, epochs=10, verbose=1, callbacks=None,validation_split=0.0, validation_data=None, shuffle=True, class_weight=None,sample_weight=None, initial_epoch=0)

verbose：日誌顯示，0為不在標準輸出流輸出日誌資訊，1為輸出進度條記錄，2為每個epoch輸出一行記錄；
validation_split：0~1之間的浮點數，用來指定訓練集的一定比例資料作為驗證集。驗證集將不參與訓練，並在每個epoch結束後測試的模型的指標，如損失函式、精確度等；
validation_data：形式為（X，y）的tuple，是指定的驗證集。此引數將覆蓋validation_spilt。

10. Sequential模型evaluate方法

evaluate(self,x, y, batch_size=32, verbose=1, sample_weight=None)
相關引數可參考其他方法的同名引數說明。

Keras上實現卷積神經網路CNN——一個例子程式

一、概述及完整程式碼

二、知識點詳解

1. 關於Keras可能會使用不同的backend

2. 二維卷積層Conv2D

3. 二維池化層MaxPooling2D

4. Activation層

5. Dropout層

7.Dense層全連線層

8. Sequential模型compile方法

9. Sequential模型fit方法

10. Sequential模型evaluate方法

Keras上實現卷積神經網路CNN——一個例子程式

Keras上實現卷積神經網路CNN

PyTorch上實現卷積神經網路CNN

Pytorch實現卷積神經網路CNN

字元型圖片驗證碼，使用tensorflow實現卷積神經網路，進行驗證碼識別CNN

TensorFlow之卷積神經網路(CNN)實現MNIST資料集分類

深度學習：Keras入門(二)之卷積神經網路(CNN)

卷積神經網路CNN原理——結合例項matlab實現

深度學習之卷積神經網路CNN及tensorflow程式碼實現示例詳細介紹

深度學習之卷積神經網路CNN及tensorflow程式碼實現示例

卷積神經網路(CNN)在句子建模上的應用

卷積神經網路CNN:Tensorflow實現(以及對卷積特徵的視覺化)

深入理解卷積神經網路(CNN)——從原理到實現

卷積神經網路（三）：卷積神經網路CNN的簡單實現（部分Python原始碼）

Keras實現卷積神經網路

卷積神經網路 CNN 的細節問題濾波器的大小選擇

Matlab程式設計之——卷積神經網路CNN程式碼解析

卷積神經網路CNN知識彙總

深度學習方法（五）：卷積神經網路CNN經典模型整理Lenet，Alexnet，Googlenet，VGG，Deep Residual Learning

淺談卷積神經網路CNN原理

Keras上實現卷積神經網路CNN——一個例子程式

一、概述及完整程式碼

二、知識點詳解

1. 關於Keras可能會使用不同的backend

2. 二維卷積層Conv2D

3. 二維池化層MaxPooling2D

4. Activation層

5. Dropout層

7.Dense層全連線層

8. Sequential模型compile方法

9. Sequential模型fit方法

10. Sequential模型evaluate方法

相關推薦