VGG16預訓練學習筆記

阿新 • • 發佈：2019-02-04

1.遷移學習

2.預訓練模型

3.使用預訓練模型

4.運用預訓練模型

? 提取特徵(extractfeatures)

? 優化模型(finetune the model)

5.優化模型的方式

6.在數字識別中使用預訓練模型

? 只針對輸出密集層(outputdense layer)的重新訓練

? 凍結初始幾層網路的權重因子

1什麼是遷移學習？

我們知道，神經網路需要用資料來訓練，它從資料中獲得資訊，進而把它們轉換成相應的權重。這些權重能夠被提取出來，遷移到其他的神經網路中，我們“遷移”了這些學來的特徵，就不需要從零開始訓練一個神經網路了。

現在，讓我們從自身進化的角度來討論這種遷移學習的重要性。這是Tim Urban最近在waitbutwhy.com上的一篇文章中提出的觀點。

2. 什麼是預訓練模型？

簡單來說，預訓練模型(pre-trained model)是前人為了解決類似問題所創造出來的模型。你在解決問題的時候，不用從零開始訓練一個新模型，可以從在類似問題中訓練過的模型入手。

比如說，如果你想做一輛自動駕駛汽車，可以花數年時間從零開始構建一個性能優良的影象識別演算法，也可以從Google在ImageNet資料集上訓練得到的inception model(一個預訓練模型)起步，來識別影象。

一個預訓練模型可能對於你的應用中並不是100%

的準確對口，但是它可以為你節省大量功夫。

接下來，我會舉個例子來說明。

3. 為什麼我們要用預訓練模型？

上週我一直在嘗試解決Crowdanalytix platform上的一個問題：從手機圖片中分辨場景。

這是一個影象分類的問題，訓練資料集中有4591張圖片，測試集中有1200張圖片。我們的任務是將圖片相應地分到16個類別中。在對圖片進行一些預處理後，我首先採用一個簡單的MLP(Multi-laterPerceptron)模型，結構如下圖所示：

在對輸入圖片(224*224*3)平整化後，為了簡化上述結構，我用了三個各含有500個神經元的隱藏層。在輸出層中，共有16個神經元對應著十六個類別。

我只能將訓練的準確率控制在6.8%

，這是個很不理想的結果。我嘗試對隱藏層、隱層中神經元的數量以及drop out速率進行調整，但準確度都沒有太大的提升。而如果增加隱藏層和其中神經元的數量，每個週期的執行時間則會增加20s以上。(我的開發環境是12GBVRAM，Titan X GPU)

下面是我用上文所述結構的MLP模型訓練輸出的結果。

可以看出，除非指數級地增加訓練時長，MLP模型無法提供給我更好的結果。因此，我轉而採用CNN(卷積神經網路)，看看他們在這個資料集上的表現，以及是否能夠提高訓練的準確度。

CNN的結構如下：

我使用了3個卷積的模組，每個模組由以下部分組成：

· 32個5*5的filter

· 線性整流函式(ReLU)作為啟用函式

· 4*4的最大值池化層

最後一個卷積模組輸出的結果經過平整化後會被傳遞到一個擁有64的神經元的隱藏層上，隨後通過一個drop out rate = 0.5處理後傳遞到輸出層。

最終訓練的結果記錄如下：

準確率15.75%，儘管與MLP模型相比有所提升，但每個週期的執行時間也增加了。

而更重要的是，資料集中最大類別所含圖片數量約佔總數17.6%左右。

只要把所有的圖片都歸到最大的類別，我們就能夠得到比MLP、CNN訓練出來的模型更好的結果(ノへ￣、)。

此外，增加更多的卷積模組也會大大增加訓練時長。

於是，我轉而去採用預訓練模型，這樣我不需要重新訓練我的整個結構，只需要針對其中的幾層進行訓練即可。

因此，我採用了在ImageNet資料集上預先訓練好的VGG16模型，這個模型可以在Keras庫中找到。

模型的結構如下所示：

在VGG16結構的基礎上，我只將softmax層的1000個輸出改為16個，從而適應我們這個問題的情景，隨後重新訓練了dense layer。

匯入必要的庫

from keras.modelsimport Sequential

from keras.layers.coreimport Flatten, Dense, Dropout

from keras.layers.convolutionalimport Convolution2D, MaxPooling2D, ZeroPadding2D

from keras.optimizersimport SGD

import cv2, numpyas np

· 1

· 2

· 3

· 4

· 5

UsingTheano backend.

D:\Anaconda\lib\site-packages\theano-0.8.0.dev0-py2.7.egg\theano\tensor\signal\downsample.py:5:UserWarning: downsample module has been moved to the pool module.

warnings.warn("downsample module hasbeen moved to the pool module.")

使用keras建立vgg16模型

def VGG_16(weights_path=None):

model = Sequential()

model.add(ZeroPadding2D((1,1),input_shape=(3,224,224)))

model.add(Convolution2D(64,3, 3, activation='relu'))