【機器學習筆記22】神經網路(卷積神經網路)

阿新 • • 發佈：2018-12-12

【參考資料】【1】《面向機器智慧的tensorflow實踐》【2】Keras/example – mnist_cnn.py 【3】Keras中文文件

常用層

卷積層

卷積理解就是之前影象處理裡用作檢測邊緣、檢測角點的運算元，例如: 輸入: $\begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix}$ 核: $\begin{bmatrix} 2 \end{bmatrix}$

卷積: $\begin{bmatrix} 1*2 & 2*2 \\ 3*2 & 4*2 \end{bmatrix}$

[1 * 2 3 * 2 2 * 2 4 * 2]

輸出:

\begin{bmatrix} 2 &amp; 4 \\ 6 &amp; 8 \end{bmatrix}

卷積處理時需要考慮(在tensorflow引數中)

跨度: 即不是每個影象區域都要進行卷積，可以跨過一些畫素
邊界填充:當卷積核（例如3*3的sobel卷積核）滑動到邊界時，考慮用0填充

*備註: 卷積作為整個網路的核心，理解是模擬生物學中的特徵，即我們的視覺神經只是做最簡單的邊緣檢測，然後在一層層的對接後，將簡單的邊界線抽象出複雜的形狀等資訊。 *

# 32 為輸出維度
# kernel_size為卷積核的大小，此時核的定義由
# kernel_initializer初始化，預設是glorot_uniform，一種基於均勻分佈的隨機取值
# activation 為該卷積輸出的啟用函式
model.add(Conv2D(32, kernel_size=(3, 3),
                 activation='relu',
                 input_shape=input_shape))

池化層

池化層層通過對輸入進行採用，比如在3*3的區域內取最大值，目的在於減少輸入尺寸、降低過擬合等。

#(2,2)表示在x、y軸上都使得輸出變為原圖的一半，進行最大值池化
model.add(MaxPooling2D(pool_size=(2, 2)))

Dropout層

為輸入資料施加Dropout。Dropout將在訓練過程中每次更新引數時按一定概率（rate）隨機斷開輸入神經元，Dropout層用於防止過擬合。

# 0.25是要斷開的神經元比例
model.add(Dropout(0.25))

Flatten層

Flatten層用來將輸入“壓平”，即把多維的輸入一維化，常用在從卷積層到全連線層的過渡。Flatten不影響batch的大小。

Dense層(全連線層)

# 128 表示該層的輸出維度
model.add(Dense(128, activation='relu'))

備註：理解在全連線層之前的卷積和池化層可以理解為特徵的選取，即從原始空間對映到一個新的特徵空間，但這個特徵真正意義上的分類是在全連線做的。

卷積神經網路程式（keras/mnist_cnn.py）

mnist是手寫數字識別庫

from __future__ import print_function
import keras
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense, Dropout, Flatten
from keras.layers import Conv2D, MaxPooling2D
from keras import backend as K

batch_size = 128
num_classes = 10
epochs = 12

# input image dimensions
img_rows, img_cols = 28, 28

# the data, split between train and test sets
(x_train, y_train), (x_test, y_test) = mnist.load_data()

if K.image_data_format() == 'channels_first':
    x_train = x_train.reshape(x_train.shape[0], 1, img_rows, img_cols)
    x_test = x_test.reshape(x_test.shape[0], 1, img_rows, img_cols)
    input_shape = (1, img_rows, img_cols)
else:
    x_train = x_train.reshape(x_train.shape[0], img_rows, img_cols, 1)
    x_test = x_test.reshape(x_test.shape[0], img_rows, img_cols, 1)
    input_shape = (img_rows, img_cols, 1)

x_train = x_train.astype('float32')
x_test = x_test.astype('float32')
x_train /= 255
x_test /= 255
print('x_train shape:', x_train.shape)
print(x_train.shape[0], 'train samples')
print(x_test.shape[0], 'test samples')

# convert class vectors to binary class matrices
y_train = keras.utils.to_categorical(y_train, num_classes)
y_test = keras.utils.to_categorical(y_test, num_classes)

model = Sequential()
model.add(Conv2D(32, kernel_size=(3, 3),
                 activation='relu',
                 input_shape=input_shape))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.25))
model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(num_classes, activation='softmax'))

model.compile(loss=keras.losses.categorical_crossentropy,
              optimizer=keras.optimizers.Adadelta(),
              metrics=['accuracy'])

model.fit(x_train, y_train,
          batch_size=batch_size,
          epochs=epochs,
          verbose=1,
          validation_data=(x_test, y_test))
score = model.evaluate(x_test, y_test, verbose=0)
print('Test loss:', score[0])
print('Test accuracy:', score[1])

在這裡插入圖片描述

【機器學習筆記22】神經網路(卷積神經網路)

【參考資料】【1】《面向機器智慧的tensorflow實踐》【2】Keras/example – mnist_cnn.py 【3】Keras中文文件常用層卷積層卷積理解就是之前影象處理裡用作檢測邊緣、檢測角點的運算元，例如: 輸入: [1234] \

【機器學習筆記20】神經網路（鏈式求導和反向傳播)

【參考文獻】【1】《面向機器智慧的TensorFlow實踐》4.7 假設存在網路結果如下各個層輸出定義 L1=sigmoid(w1⋅x)L_1 = sigmoid(w_1 \cdot x)L1=sigmoid(w1⋅x) L2=sigmoid(w2⋅L

【機器學習筆記21】神經網路（多層感知機)

【參考資料】【1】《深度學習》花書 6.1 亦或問題由於單層感知機相當於在一個空間增加了一個超平面進行分類，那麼對於像亦或問題這樣的情況則無法完成。因此在多層感知機中增加了一個隱藏層，即一個啟用函式。現代神經網路最常用的啟用函式是整流線性單元，ReL

【機器學習筆記19】神經網路（單層感知機）

【參考資料】【1】《人工神經網路教程》【2】《matlab 2015b 神經網路技術》基本概念單層感知器可以看成一個線性累加器和一個二值化閾值元器件，通常會在累加一個偏移量。由公式表達為:oj=sgn(∑i=1nwijxi+b)o_j= sgn(\s

【機器學習筆記23】神經網路（RNN)

基礎迴圈神經網路迴圈神經網路（RNN）是一個由神經元和權值構成的有向圖，它的當前狀態與前一時刻的狀態和當前輸入決定，因此當前狀態也被稱為工作記憶。迴圈神經網路在時間序列上展開後如上圖所示，用於解決序列化的問題，諸如語音識別、語音合成、文字生成。例子:利

【機器學習筆記24】神經網路(LSTM)

梯度消失原因 TBD 模型定義 LSTM 長短期記憶網路是一種特殊的RNN，為解決梯度爆炸和梯度消失的問題，LSTM將RNN中普通的神經元替換成了擁有少量記憶的LSTM單元。第一步: 決定丟棄資訊第二步: 確定更新資訊第三步: 更新狀態第四

【機器學習筆記35】蟻群演算法

【參考資料】【1】《蟻群演算法原理及其應用》【2】測試資料: https://comopt.ifi.uni-heidelberg.de/software/TSPLIB95/tsp/att48.tsp.gz 演算法原理（以TSP問題為例）（1）引數初始化。令時間t=0和迴圈次數

【機器學習筆記02】最小二乘法（多元線性迴歸模型）

數學基礎 1.轉置矩陣定義：將矩陣A同序數的行換成列成為轉置矩陣ATA^TAT，舉例： A=(1203−11)A=\begin{pmatrix} 1 & 2 & 0 \\ 3 & -1 &

【機器學習筆記01】最小二乘法（一元線性迴歸模型）

【參考資料】【1】《概率論與數理統計》【2】 http://scikit-learn.org /stable/auto_examples/ linear_model/ plot_ols.html # sphx-glr-auto-examples-

【機器學習筆記04】隨機梯度下降

梯度下降梯度下降是一個尋找函式機值的方式，屬於最優化裡的基礎演算法，在低維度的情況下非常容易理解。例如存在函式y=x2y=x^2y=x2存在導數dy=2x，若當前點在x=1點，設dx的步長為0.1。此時我們通過負梯度計算下一個x點xt+1=xt−2∗0.

【機器學習筆記05】Jacobian矩陣&Hessian矩陣

Jacobian矩陣 Jacobian矩陣是函式對向量求導，其結果是一階偏導陣列成的矩陣。假設:F:Rn→RmF:R_n \to R_mF:Rn→Rm也就是一個n維歐式空間向m維歐式空間的一個對映。舉例：由球座標系轉換到直角座標系，存在對映形式化表

【機器學習筆記08】分類器（softmax迴歸)

基本定義首先給出softmax的數學定義，如下: hθ(x(i))=[p(y(i)=1∣x(i);θ)p(y(i)=2∣x(i);θ)⋮p(y(i)=k∣x(i);θ)]=1∑j=1keθjTx(i)[eθ1Tx(i)eθ2Tx(i)⋮eθkTx(i)]

【機器學習筆記18】隱馬爾可夫模型

【參考資料】【1】《統計學習方法》隱馬爾可夫模型（HMM）定義隱馬爾可夫模型: 隱馬爾可夫模型是關於時序的模型，描述一個由隱藏的馬爾可夫鏈生成的不可觀測的狀態序列，再由各個狀態生成的觀測值所構成的一個觀測序列。形式化定義HMM為λ=(A,B,π)\la

【機器學習筆記14】奇異值分解(SVD)

奇異值分解定義: 假設A是一個m×nm \times nm×n的矩陣，則存在如下一種分解: Am×n=Um×m∑m×nVn×nTA_{m \times n}=U_{m \times m} \sum_{m \times n} V_{n \times n}^T

【機器學習筆記17】支援向量機

【參考資料】【1】《統計學習方法》基本概念當訓練資料線性可分時，通過硬間隔最大化，學習一個線性的分類器，即線性可分支援向量機，又稱硬間隔支援向量機；當訓練資料近似線性可分時，通過軟間隔（增加一個鬆弛因子）後學習一個線性的分類器，即軟間隔支援向量機；

【機器學習筆記12】聚類（k-means)

K-means 演算法演算法流程如下：（1）在樣本中選擇兩個點（也可以是若干個）作為種子點；（2）計算其餘各個樣本離該種子點的距離，並將其分為兩類；（3）將種子點移到（2）所分為的兩類的中間；（4）重複（2）(3)直到種子不再移動； K-means

【機器學習筆記15】主成分分析(PCA)

PCA演算法去平均值，即每一位特徵減去各自的平均值計算新矩陣的協方差矩陣設$X=(X_1, X_2…X_N)^T $，在鳶尾花例子裡N=4,會生成一個4*4的協方差矩陣稱矩陣 C=(cij)n×n=(c11c12⋯c1nc21c22⋯c2n⋯⋯⋯⋯

【機器學習筆記16】拉格朗日乘子法

【參考資料】【1】《統計學習方法》【2】《凸優化》【3】小象學院《凸優化》凸集直線和線段的表達設x1≠x2x_1 \ne x_2x1̸=x2是RnR^nRn空間上的兩個點，具有存在下列定義的點： y=θx1+(1−θ)x2y = \thet

【機器學習筆記13】聚類（高斯混合聚類）

【參考資料】【1】《統計學習方法》【2】《概率論與數理統計》【3】小象學院 EM演算法高斯分佈定義: 如果隨機變數X的概率密度為f(x)=12πσe−(x−u)22σ2f(x)= \dfrac{1}{\sqrt{2\pi}\sigma}e^{-\df

【機器學習筆記26】基於VGG16的影象風格遷移

Note: 本文主要是對論文及參考文獻【1】中程式碼的理解概述該演算法的本質是利用深度卷積網路對影象輸入的抽象，主要是三部分：將風格影象輸入卷積神經網路，將某些層輸出作為風格特徵（做一次）；將內容影象輸入卷積神經網路，將某些層輸出作為內容特徵（做一

【機器學習筆記22】神經網路(卷積神經網路)

常用層

卷積層

池化層

Dropout層

Flatten層

Dense層(全連線層)

卷積神經網路程式（keras/mnist_cnn.py）

相關推薦