Keras：在預訓練的網路上fine-tune

阿新 • • 發佈：2019-01-05

準備

fine-tune的三個步驟:

搭建vgg-16並載入權重;
將之前定義的全連線網路載入到模型頂部,並載入權重;
凍結vgg16網路的一部分引數.

在之前的Keras：自建資料集影象分類的模型訓練、儲存與恢復裡製作了實驗用的資料集並初步進行了訓練.然後在Keras：使用預訓練網路的bottleneck特徵中定義並訓練了要使用全連線網路,並將網路權重儲存到了bottleneck_fc_model.h5檔案中.

fine-tune過程

根據keras中…/keras/applications/vgg16.py的VGG16模型形式,構造VGG16模型的卷積部分,並載入權重(vgg16_weights_tf_dim_ordering_tf_kernels_notop.h5).然後新增預訓練好的模型.訓練時凍結最後一個卷積塊前的卷基層引數.

示例:

#!/usr/bin/python
# coding:utf8

from keras.models import Sequential
from keras import optimizers
from keras.preprocessing.image import ImageDataGenerator
from keras.layers import Flatten, Dense, Dropout, Conv2D, MaxPooling2D
from keras import backend as K
K.set_image_dim_ordering('th')


# 構造VGG16模型 

model = Sequential()

# Block 1
model.add(Conv2D(64, (3, 3), activation='relu', padding='same', name='block1_conv1', input_shape=(3, 150, 150)))
model.add(Conv2D(64, (3, 3), activation='relu', padding='same', name='block1_conv2'))
model.add(MaxPooling2D((2, 2), strides=(2, 2), name='block1_pool'))

# Block 2 

model.add(Conv2D(128, (3, 3), activation='relu', padding='same', name='block2_conv1'))
model.add(Conv2D(128, (3, 3), activation='relu', padding='same', name='block2_conv2'))
model.add(MaxPooling2D((2, 2), strides=(2, 2), name='block2_pool'))

# Block 3
model.add(Conv2D(256, (3, 3), activation='relu', padding='same', name='block3_conv1'))
model.add(Conv2D(256, (3, 3), activation='relu', padding='same', name='block3_conv2'))
model.add(Conv2D(256, (3, 3), activation='relu', padding='same', name='block3_conv3'))
model.add(MaxPooling2D((2, 2), strides=(2, 2), name='block3_pool'))

# Block 4
model.add(Conv2D(512, (3, 3), activation='relu', padding='same', name='block4_conv1'))
model.add(Conv2D(512, (3, 3), activation='relu', padding='same', name='block4_conv2'))
model.add(Conv2D(512, (3, 3), activation='relu', padding='same', name='block4_conv3'))
model.add(MaxPooling2D((2, 2), strides=(2, 2), name='block4_pool'))

# Block 5
model.add(Conv2D(512, (3, 3), activation='relu', padding='same', name='block5_conv1'))
model.add(Conv2D(512, (3, 3), activation='relu', padding='same', name='block5_conv2'))
model.add(MaxPooling2D((2, 2), strides=(2, 2), name='block5_pool'))

model.load_weights('vgg16_weights_tf_dim_ordering_tf_kernels_notop.h5',by_name=True)
model.summary()

# 在初始化好的VGG網路上新增預訓練好的模型
top_model = Sequential()
top_model.add(Flatten(input_shape=model.output_shape[1:])) #  (4,4,512)
top_model.add(Dense(256, activation='relu'))
top_model.add(Dropout(0.5))
top_model.add(Dense(1, activation='sigmoid'))

top_model.load_weights('bottleneck_fc_model.h5',by_name=True)
model.add(top_model)

# 將最後一個卷積塊前的卷基層引數凍結,把隨後卷積塊前的權重設定為不可訓練（權重不會更新）
for layer in model.layers[:25]:
    layer.trainable = False

model.compile(loss='binary_crossentropy',
              optimizer=optimizers.SGD(lr=1e-4, momentum=0.9),
              metrics=['accuracy'])

# 以低學習率進行訓練
train_datagen = ImageDataGenerator(rescale=1./255,
                                   shear_range=0.2,
                                   zoom_range=0.2,
                                   horizontal_flip=True)

test_datagen = ImageDataGenerator(rescale=1./255)
train_generator = train_datagen.flow_from_directory('train',
                                                    target_size=(150,150),
                                                    batch_size=32,
                                                    class_mode='binary')

validation_generator = test_datagen.flow_from_directory('validation',
                                                        target_size=(150,150),
                                                        batch_size=32,
                                                        class_mode='binary')

model.fit_generator(train_generator,
                    steps_per_epoch=10,
                    epochs=50,
                    validation_data=validation_generator,
                    validation_steps=10)

輸出:

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
block1_conv1 (Conv2D)        (None, 64, 150, 150)      1792      
_________________________________________________________________
block1_conv2 (Conv2D)        (None, 64, 150, 150)      36928     
_________________________________________________________________
block1_pool (MaxPooling2D)   (None, 64, 75, 75)        0         
_________________________________________________________________
block2_conv1 (Conv2D)        (None, 128, 75, 75)       73856     
_________________________________________________________________
block2_conv2 (Conv2D)        (None, 128, 75, 75)       147584    
_________________________________________________________________
block2_pool (MaxPooling2D)   (None, 128, 37, 37)       0         
_________________________________________________________________
block3_conv1 (Conv2D)        (None, 256, 37, 37)       295168    
_________________________________________________________________
block3_conv2 (Conv2D)        (None, 256, 37, 37)       590080    
_________________________________________________________________
block3_conv3 (Conv2D)        (None, 256, 37, 37)       590080    
_________________________________________________________________
block3_pool (MaxPooling2D)   (None, 256, 18, 18)       0         
_________________________________________________________________
block4_conv1 (Conv2D)        (None, 512, 18, 18)       1180160   
_________________________________________________________________
block4_conv2 (Conv2D)        (None, 512, 18, 18)       2359808   
_________________________________________________________________
block4_conv3 (Conv2D)        (None, 512, 18, 18)       2359808   
_________________________________________________________________
block4_pool (MaxPooling2D)   (None, 512, 9, 9)         0         
_________________________________________________________________
block5_conv1 (Conv2D)        (None, 512, 9, 9)         2359808   
_________________________________________________________________
block5_conv2 (Conv2D)        (None, 512, 9, 9)         2359808   
_________________________________________________________________
block5_pool (MaxPooling2D)   (None, 512, 4, 4)         0         
=================================================================
Total params: 12,354,880
Trainable params: 12,354,880
Non-trainable params: 0
_________________________________________________________________
Found 60 images belonging to 2 classes.
Found 60 images belonging to 2 classes.
Epoch 1/50

 1/10 [==>...........................] - ETA: 6:57 - loss: 0.7880 - acc: 0.3929
 2/10 [=====>........................] - ETA: 6:23 - loss: 0.7920 - acc: 0.4152
 3/10 [========>.....................] - ETA: 5:25 - loss: 0.8292 - acc: 0.3839
 4/10 [===========>..................] - ETA: 4:47 - loss: 0.8184 - acc: 0.3895
 5/10 [==============>...............] - ETA: 3:59 - loss: 0.8159 - acc: 0.3929
 6/10 [=================>............] - ETA: 3:08 - loss: 0.8001 - acc: 0.4048
 7/10 [====================>.........] - ETA: 2:18 - loss: 0.8094 - acc: 0.4184
 8/10 [=======================>......] - ETA: 1:32 - loss: 0.8031 - acc: 0.4247
 9/10 [==========================>...] - ETA: 46s - loss: 0.8041 - acc: 0.4296 
10/10 [==============================] - 899s 90s/step - loss: 0.8125 - acc: 0.4260 - val_loss: 0.8145 - val_acc: 0.4000
Epoch 2/50

 1/10 [==>...........................] - ETA: 6:55 - loss: 0.8487 - acc: 0.4062
 2/10 [=====>........................] - ETA: 5:50 - loss: 0.8443 - acc: 0.4353
 3/10 [========>.....................] - ETA: 5:08 - loss: 0.8430 - acc: 0.4256
 4/10 [===========>..................] - ETA: 4:18 - loss: 0.8258 - acc: 0.4263
 5/10 [==============>...............] - ETA: 3:32 - loss: 0.8310 - acc: 0.4339
 6/10 [=================>............] - ETA: 2:53 - loss: 0.8266 - acc: 0.4397
 7/10 [====================>.........] - ETA: 2:11 - loss: 0.8270 - acc: 0.4305
 8/10 [=======================>......] - ETA: 1:26 - loss: 0.8220 - acc: 0.4347
  9/10 [==========================>...] - ETA: 43s - loss: 0.8311 - acc: 0.4340 

 ......
 ......

Keras：在預訓練的網路上fine-tune

準備 fine-tune的三個步驟: 搭建vgg-16並載入權重; 將之前定義的全連線網路載入到模型頂部,並載入權重; 凍結vgg16網路的一部分引數. 在之前的Keras：自建資料集影象分類的模型訓練、儲存與恢復裡製作了實驗用的資料集並初步進

tensorflow利用預訓練模型進行目標檢測（一）：預訓練模型的使用

err sync numpy sna sta porting trac git int32 一、運行樣例官網鏈接：https://github.com/tensorflow/models/blob/master/research/object_detection/obje

深度學習：預訓練

遷移學習：可以使我們在他人訓練過的模型基礎上進行小改動便可投入使用。 1. 什麼是遷移學習？神經網路需要用資料來訓練，它從資料中獲得資訊，進而把它們轉換成相應的權重。這些權重能夠被提取出來，遷移到其他的神經網路中，我們“遷移”了這些學來的特徵，就不需要從零開始訓練一

#####好好好＃＃＃＃keras之預訓練模型Application

Application應用 Kera的應用模組Application提供了帶有預訓練權重的Keras模型，這些模型可以用來進行預測、特徵提取和finetune 模型的預訓練權重將下載到~/.keras/models/並在載入模型時自動載入可用的模型所有的這些模型(除了

SiameseFC-TensorFlow 程式碼詳細註解（一）：預訓練模型下載轉換測試以及結果視覺化(轉載)

這篇部落格主要的目的就是簡單地跑一下實驗，讓下載的程式碼能用預訓練的模型去測試單個視訊，並對結果視覺化，從視覺上感受一下這個跟蹤演算法的效果，至於如果要自己訓練自己的模型該如何準備訓練資料，如何設計自己的模型，如何訓練自己的模型，以及如何評估自己的模型等，這些問題都將在後面的

keras的預訓練權重檔案模型的下載和本地存放目錄（anaconda on linux/windows）

VGG16等keras預訓練權重檔案的下載：https://github.com/fchollet/deep-learning-models/releases/ 本地存放目錄： Linux下是放在“~/.keras/models/”中 Win下則放在

使用Keras和預訓練的詞向量訓練新聞文字分類模型

from __future__ import print_function import os import sys import numpy as np from keras.preprocessing.text import Tokenizer from keras.p

pytorch學習筆記（十一）：fine-tune 預訓練的模型

torchvision 中包含了很多預訓練好的模型，這樣就使得 fine-tune 非常容易。本文主要介紹如何 fine-tune torchvision 中預訓練好的模型。安裝 pip install torchvision 如何 fine

《錯誤手記-01》 facenet使用預訓練模型fine-tune重新訓練自己資料集報錯

環境資訊：windows10+python3.5+tensorflow1.6.0 問題描述：在自己的訓練集上跑train_softmax.py. 引數： --logs_base_dir F:/work/runspace/log/ --models_base_

pytorch fine-tune 預訓練的模型

之一: torchvision 中包含了很多預訓練好的模型，這樣就使得 fine-tune 非常容易。本文主要介紹如何 fine-tune torchvision 中預訓練好的模型。安裝 pip install torchvision 如何 fine-tune 以

如何使用預訓練模型對新資料做fine-tune

http://mxnet.io/how_to/finetune.html 使用fine-tune.py檔案對預訓練模型做fine-tune，將最後一層的fc層替換成所需的類別數量和初始化隨機值。例子:從 data/caltech256.sh 下載 caltech256資料集

Caffe：如何fine tune一個現有的網路（VGG16）——將資料預處理並儲存為h5格式

在訓練神經網路的過程中，常常需要fine tune一個現有的網路，首先是需要對輸入資料進行預處理，包括有：對尺寸大小進行處理將正負例和測試的data&label儲存為h5檔案將h5檔案中data&label對應的書序打亂實現程式碼

【MXNet Gluon】使用預訓練好的模型fine-tune

finetune關鍵程式碼 prenet=ResNet(466) net=ResNet(3400) ctx = [mx.gpu(i) for i in range(3)] if finetune ==1: prenet.load_params('p

[ Keras ] ——基本使用：(2) fine-tune+凍結層+抽取模型某一層輸出

一、凍結層 (即固定某層引數在訓練的時候不變) 1.1方法： x = Dense(100,activation='relu',name='dense_100',trainable=False)(inputs) 或者 model.trainable = False

keras調用預訓練模型分類

dict 拓展 span 類別就是 num pan 維度上下在網上看到一篇博客，地址https://www.pyimagesearch.com/2017/03/20/imagenet-vggnet-resnet-inception-xception-keras/，是關

keras中使用預訓練模型進行圖片分類

shape puts output 代碼 ESS str closed weight list keras中含有多個網絡的預訓練模型，可以很方便的拿來進行使用。安裝及使用主要參考官方教程：https://keras.io/zh/applications/ https:

谷歌官宣：全面超越人類的最強NLP預訓練模型BERT開源了！

來源 | Google Research GitHub 編譯 | 無明、Natalie 編輯 | Natalie AI 前線導讀：近日，谷歌 AI 的一篇 NLP 論文引起了社群極大的關注與討論，被認為是 NLP 領域的極大突破。谷歌大腦研究科學家 Thang Luong Twitter 表示，這項

BERT 現已開源：最先進的 NLP 預訓練技術，支援中文和更多語言

文 / Jacob Devlin 和 Ming-Wei Chang, Research Scientists, Google AI Language 缺少訓練資料是自然語言處理（Natural Language Processing, NLP）面臨的最大挑戰之一。由

『計算機視覺』Mask-RCNN_訓練網絡其三：model準備

exce att ace exc 創建 wrap png ipy The 一、模型初始化 1、創建模型並載入預訓練參數準備了數據集後，我們開始構建model，training網絡結構上一節已經介紹完了，現在我們看一看訓練時如何調用training結構的網絡。如

BERT總結：最先進的NLP預訓練技術

BERT(Bidirectional Encoder Representations from Transformers)是谷歌AI研究人員最近發表的一篇論文：BERT: Pre-training of Deep Bidirectional Transformers for Language Understa

Keras：在預訓練的網路上fine-tune

準備

fine-tune過程

相關推薦