如何為Keras中的深度學習模型建立Checkpoint

阿新 • • 發佈：2022-05-02

深度學習模式可能需要幾個小時，幾天甚至幾周的時間來訓練。

如果執行意外停止，你可能就白乾了。

在這篇文章中，你將會發現在使用Keras庫的Python訓練過程中，如何檢查你的深度學習模型。

讓我們開始吧。

2017/03/07更新：更新了Keras 2.0.2，TensorFlow 1.0.1和Theano 0.9.0的示例。

Checkpoint神經網路模型

應用程式Checkpoint是為長時間執行程序準備的容錯技術。

這是一種在系統故障的情況下拍攝系統狀態快照的方法。一旦出現問題不會讓進度全部丟失。Checkpoint可以直接使用，也可以作為從它停止的地方重新執行的起點。

訓練深度學習模型時，Checkpoint是模型的權重。他們可以用來作預測，或作持續訓練的基礎。

Keras庫通過回撥API提供Checkpoint功能。

ModelCheckpoint回撥類允許你定義檢查模型權重的位置在何處，檔案應如何命名，以及在什麼情況下建立模型的Checkpoint。

API允許你指定要監視的指標，例如訓練或驗證資料集的丟失或準確性。你可以指定是否尋求最大化或最小化分數的改進。最後，用於儲存權重的檔名可以包括諸如訓練次數的編號或標準的變數。

當模型上呼叫fit（）函式時，可以將ModelCheckpoint傳遞給訓練過程。

注意，你可能需要安裝h5py庫以HDF5格式輸出網路權重。

Checkpoint神經網路模型改進

應用Checkpoint時，應在每次訓練中觀察到改進時輸出模型權重。

下面的示例建立一個小型神經網路Pima印第安人發生糖尿病的二元分類問題。你可以在UCI機器學習庫下載這個資料集。本示例使用33%的資料進行驗證。

Checkpoint設定成當驗證資料集的分類精度提高時儲存網路權重(monitor=’val_acc’ and mode=’max’)。權重儲存在一個包含評價的檔案中(weights-improvement – { val_acc = .2f } .hdf5)。

# Checkpoint the weights when validation accuracy improves
from keras.modelsimport Sequential
from keras.layersimport Dense
from keras.callbacksimport ModelCheckpoint
import matplotlib.pyplot as plt
import numpy
# fix random seed for reproducibility
seed= 7
numpy.random.seed(seed)
# load pima indians dataset
dataset= numpy.loadtxt("pima-indians-diabetes.csv", delimiter=",")
# split into input (X) and output (Y) variables
X= dataset[:,0:8]
Y= dataset[:,8]
# create model
model= Sequential()
model.add(Dense(12, input_dim=8, kernel_initializer='uniform', activation='relu'))
model.add(Dense(8, kernel_initializer='uniform', activation='relu'))
model.add(Dense(1, kernel_initializer='uniform', activation='sigmoid'))
# Compile model
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
# checkpoint
filepath="weights-improvement-{epoch:02d}-{val_acc:.2f}.hdf5"
checkpoint= ModelCheckpoint(filepath, monitor='val_acc', verbose=1, save_best_only=True, mode='max')
callbacks_list= [checkpoint]
# Fit the model
model.fit(X, Y, validation_split=0.33, epochs=150, batch_size=10, callbacks=callbacks_list, verbose=0)

執行示例會生成以下輸出（有刪節）：

...
Epoch00134: val_acc didnot improve
Epoch00135: val_acc didnot improve
Epoch00136: val_acc didnot improve
Epoch00137: val_acc didnot improve
Epoch00138: val_acc didnot improve
Epoch00139: val_acc didnot improve
Epoch00140: val_acc improvedfrom 0.83465 to0.83858, saving model to weights-improvement-140-0.84.hdf5
Epoch00141: val_acc didnot improve
Epoch00142: val_acc didnot improve
Epoch00143: val_acc didnot improve
Epoch00144: val_acc didnot improve
Epoch00145: val_acc didnot improve
Epoch00146: val_acc improvedfrom 0.83858 to0.84252, saving model to weights-improvement-146-0.84.hdf5
Epoch00147: val_acc didnot improve
Epoch00148: val_acc improvedfrom 0.84252 to0.84252, saving model to weights-improvement-148-0.84.hdf5
Epoch00149: val_acc didnot improve

你將在工作目錄中看到包含多個HDF5格式的網路權重檔案。例如：

...
weights-improvement-53-0.76.hdf5
weights-improvement-71-0.76.hdf5
weights-improvement-77-0.78.hdf5
weights-improvement-99-0.78.hdf5

這是一個非常簡單的Checkpoint策略。如果驗證精度在訓練週期上下波動，則可能會建立大量不必要的Checkpoint檔案。然而，它將確保你具有在執行期間發現的最佳模型的快照。

Checkpoint最佳神經網路模型

如果驗證精度提高的話，一個更簡單的Checkpoint策略是將模型權重儲存到相同的檔案中。

這可以使用上述相同的程式碼輕鬆完成，並將輸出檔名更改為固定（不包括評價或次數的資訊）。

在這種情況下，只有當驗證資料集上的模型的分類精度提高到到目前為止最好的時候，才會將模型權重寫入檔案“weights.best.hdf5”。

# Checkpoint the weights for best model on validation accuracy
from keras.modelsimport Sequential
from keras.layersimport Dense
from keras.callbacksimport ModelCheckpoint
import matplotlib.pyplot as plt
import numpy
# fix random seed for reproducibility
seed= 7
numpy.random.seed(seed)
# load pima indians dataset
dataset= numpy.loadtxt("pima-indians-diabetes.csv", delimiter=",")
# split into input (X) and output (Y) variables
X= dataset[:,0:8]
Y= dataset[:,8]
# create model
model= Sequential()
model.add(Dense(12, input_dim=8, kernel_initializer='uniform', activation='relu'))
model.add(Dense(8, kernel_initializer='uniform', activation='relu'))
model.add(Dense(1, kernel_initializer='uniform', activation='sigmoid'))
# Compile model
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
# checkpoint
filepath="weights.best.hdf5"
checkpoint= ModelCheckpoint(filepath, monitor='val_acc', verbose=1, save_best_only=True, mode='max')
callbacks_list= [checkpoint]
# Fit the model
model.fit(X, Y, validation_split=0.33, epochs=150, batch_size=10, callbacks=callbacks_list, verbose=0)

執行示例會生成以下輸出（有刪節）：

...
Epoch00139: val_acc improvedfrom 0.79134 to0.79134, saving model to weights.best.hdf5
Epoch00140: val_acc didnot improve
Epoch00141: val_acc didnot improve
Epoch00142: val_acc didnot improve
Epoch00143: val_acc didnot improve
Epoch00144: val_acc improvedfrom 0.79134 to0.79528, saving model to weights.best.hdf5
Epoch00145: val_acc improvedfrom 0.79528 to0.79528, saving model to weights.best.hdf5
Epoch00146: val_acc didnot improve
Epoch00147: val_acc didnot improve
Epoch00148: val_acc didnot improve
Epoch00149: val_acc didnot improve

你應該在本地目錄中看到權重檔案：

weights.best.hdf5

這是一個在你的實驗中需要經常用到的方便的Checkpoint策略。它將確保你的最佳模型被儲存，以便稍後使用。它避免了輸入程式碼來手動跟蹤，並在訓練時序列化最佳模型。

載入Checkpoint神經網路模型

現在你已經瞭解瞭如何在訓練期間檢查深度學習模型，你需要回顧一下如何載入和使用一個Checkpoint模型。

Checkpoint只包括模型權重。它假定你瞭解網路結構。這也可以序列化成JSON或YAML格式。

在下面的示例中，模型結構是已知的，並且最好的權重從先前的實驗中載入，然後儲存在weights.best.hdf5檔案的工作目錄中。

那麼將該模型用於對整個資料集進行預測。

# How to load and use weights from a checkpoint
from keras.modelsimport Sequential
from keras.layersimport Dense
from keras.callbacksimport ModelCheckpoint
import matplotlib.pyplot as plt
import numpy
# fix random seed for reproducibility
seed= 7
numpy.random.seed(seed)
# create model
model= Sequential()
model.add(Dense(12, input_dim=8, kernel_initializer='uniform', activation='relu'))
model.add(Dense(8, kernel_initializer='uniform', activation='relu'))
model.add(Dense(1, kernel_initializer='uniform', activation='sigmoid'))
# load weights
model.load_weights("weights.best.hdf5")
# Compile model (required to make predictions)
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
print("Created model and loaded weights from file")
# load pima indians dataset
dataset= numpy.loadtxt("pima-indians-diabetes.csv", delimiter=",")
# split into input (X) and output (Y) variables
X= dataset[:,0:8]
Y= dataset[:,8]
# estimate accuracy on whole dataset using loaded weights
scores= model.evaluate(X, Y, verbose=0)
print("%s: %.2f%%" % (model.metrics_names[1], scores[1]*100))
執行示例生成以下輸出：
Created modeland loaded weightsfrom file
acc:77.73%

總結

在這篇文章中，你已經發現Checkpoint對深度學習模型長期訓練的重要性。

你學習了兩種可用於你下一個深入Checkpoint學習專案的Checkpoint策略：

Checkpoint模型改進。
Checkpoint的最佳模型。

你還學習瞭如何載入Checkpoint模型並做出預測。

原文：http://machinelearningmastery.com/check-point-deep-learning-models-keras/

深度學習模式可能需要幾個小時，幾天甚至幾周的時間來訓練。

如果執行意外停止，你可能就白乾了。

在這篇文章中，你將會發現在使用Keras庫的Python訓練過程中，如何檢查你的深度學習模型。

讓我們開始吧。

2017/03/07更新：更新了Keras 2.0.2，TensorFlow 1.0.1和Theano 0.9.0的示例。

Checkpoint神經網路模型

應用程式Checkpoint是為長時間執行程序準備的容錯技術。

訓練深度學習模型時，Checkpoint是模型的權重。他們可以用來作預測，或作持續訓練的基礎。

Keras庫通過回撥API提供Checkpoint功能。

ModelCheckpoint回撥類允許你定義檢查模型權重的位置在何處，檔案應如何命名，以及在什麼情況下建立模型的Checkpoint。

當模型上呼叫fit（）函式時，可以將ModelCheckpoint傳遞給訓練過程。

注意，你可能需要安裝h5py庫以HDF5格式輸出網路權重。

Checkpoint神經網路模型改進

應用Checkpoint時，應在每次訓練中觀察到改進時輸出模型權重。

下面的示例建立一個小型神經網路Pima印第安人發生糖尿病的二元分類問題。你可以在UCI機器學習庫下載這個資料集。本示例使用33%的資料進行驗證。

# Checkpoint the weights when validation accuracy improves
from keras.modelsimport Sequential
from keras.layersimport Dense
from keras.callbacksimport ModelCheckpoint
import matplotlib.pyplot as plt
import numpy
# fix random seed for reproducibility
seed= 7
numpy.random.seed(seed)
# load pima indians dataset
dataset= numpy.loadtxt("pima-indians-diabetes.csv", delimiter=",")
# split into input (X) and output (Y) variables
X= dataset[:,0:8]
Y= dataset[:,8]
# create model
model= Sequential()
model.add(Dense(12, input_dim=8, kernel_initializer='uniform', activation='relu'))
model.add(Dense(8, kernel_initializer='uniform', activation='relu'))
model.add(Dense(1, kernel_initializer='uniform', activation='sigmoid'))
# Compile model
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
# checkpoint
filepath="weights-improvement-{epoch:02d}-{val_acc:.2f}.hdf5"
checkpoint= ModelCheckpoint(filepath, monitor='val_acc', verbose=1, save_best_only=True, mode='max')
callbacks_list= [checkpoint]
# Fit the model
model.fit(X, Y, validation_split=0.33, epochs=150, batch_size=10, callbacks=callbacks_list, verbose=0)

執行示例會生成以下輸出（有刪節）：

...
Epoch00134: val_acc didnot improve
Epoch00135: val_acc didnot improve
Epoch00136: val_acc didnot improve
Epoch00137: val_acc didnot improve
Epoch00138: val_acc didnot improve
Epoch00139: val_acc didnot improve
Epoch00140: val_acc improvedfrom 0.83465 to0.83858, saving model to weights-improvement-140-0.84.hdf5
Epoch00141: val_acc didnot improve
Epoch00142: val_acc didnot improve
Epoch00143: val_acc didnot improve
Epoch00144: val_acc didnot improve
Epoch00145: val_acc didnot improve
Epoch00146: val_acc improvedfrom 0.83858 to0.84252, saving model to weights-improvement-146-0.84.hdf5
Epoch00147: val_acc didnot improve
Epoch00148: val_acc improvedfrom 0.84252 to0.84252, saving model to weights-improvement-148-0.84.hdf5
Epoch00149: val_acc didnot improve

你將在工作目錄中看到包含多個HDF5格式的網路權重檔案。例如：

...
weights-improvement-53-0.76.hdf5
weights-improvement-71-0.76.hdf5
weights-improvement-77-0.78.hdf5
weights-improvement-99-0.78.hdf5

Checkpoint最佳神經網路模型

如果驗證精度提高的話，一個更簡單的Checkpoint策略是將模型權重儲存到相同的檔案中。

這可以使用上述相同的程式碼輕鬆完成，並將輸出檔名更改為固定（不包括評價或次數的資訊）。

在這種情況下，只有當驗證資料集上的模型的分類精度提高到到目前為止最好的時候，才會將模型權重寫入檔案“weights.best.hdf5”。

# Checkpoint the weights for best model on validation accuracy
from keras.modelsimport Sequential
from keras.layersimport Dense
from keras.callbacksimport ModelCheckpoint
import matplotlib.pyplot as plt
import numpy
# fix random seed for reproducibility
seed= 7
numpy.random.seed(seed)
# load pima indians dataset
dataset= numpy.loadtxt("pima-indians-diabetes.csv", delimiter=",")
# split into input (X) and output (Y) variables
X= dataset[:,0:8]
Y= dataset[:,8]
# create model
model= Sequential()
model.add(Dense(12, input_dim=8, kernel_initializer='uniform', activation='relu'))
model.add(Dense(8, kernel_initializer='uniform', activation='relu'))
model.add(Dense(1, kernel_initializer='uniform', activation='sigmoid'))
# Compile model
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
# checkpoint
filepath="weights.best.hdf5"
checkpoint= ModelCheckpoint(filepath, monitor='val_acc', verbose=1, save_best_only=True, mode='max')
callbacks_list= [checkpoint]
# Fit the model
model.fit(X, Y, validation_split=0.33, epochs=150, batch_size=10, callbacks=callbacks_list, verbose=0)
執行示例會生成以下輸出（有刪節）：
...
Epoch00139: val_acc improvedfrom 0.79134 to0.79134, saving model to weights.best.hdf5
Epoch00140: val_acc didnot improve
Epoch00141: val_acc didnot improve
Epoch00142: val_acc didnot improve
Epoch00143: val_acc didnot improve
Epoch00144: val_acc improvedfrom 0.79134 to0.79528, saving model to weights.best.hdf5
Epoch00145: val_acc improvedfrom 0.79528 to0.79528, saving model to weights.best.hdf5
Epoch00146: val_acc didnot improve
Epoch00147: val_acc didnot improve
Epoch00148: val_acc didnot improve
Epoch00149: val_acc didnot improve

你應該在本地目錄中看到權重檔案：

weights.best.hdf5

載入Checkpoint神經網路模型

現在你已經瞭解瞭如何在訓練期間檢查深度學習模型，你需要回顧一下如何載入和使用一個Checkpoint模型。

Checkpoint只包括模型權重。它假定你瞭解網路結構。這也可以序列化成JSON或YAML格式。

在下面的示例中，模型結構是已知的，並且最好的權重從先前的實驗中載入，然後儲存在weights.best.hdf5檔案的工作目錄中。

那麼將該模型用於對整個資料集進行預測。

# How to load and use weights from a checkpoint
from keras.modelsimport Sequential
from keras.layersimport Dense
from keras.callbacksimport ModelCheckpoint
import matplotlib.pyplot as plt
import numpy
# fix random seed for reproducibility
seed= 7
numpy.random.seed(seed)
# create model
model= Sequential()
model.add(Dense(12, input_dim=8, kernel_initializer='uniform', activation='relu'))
model.add(Dense(8, kernel_initializer='uniform', activation='relu'))
model.add(Dense(1, kernel_initializer='uniform', activation='sigmoid'))
# load weights
model.load_weights("weights.best.hdf5")
# Compile model (required to make predictions)
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
print("Created model and loaded weights from file")
# load pima indians dataset
dataset= numpy.loadtxt("pima-indians-diabetes.csv", delimiter=",")
# split into input (X) and output (Y) variables
X= dataset[:,0:8]
Y= dataset[:,8]
# estimate accuracy on whole dataset using loaded weights
scores= model.evaluate(X, Y, verbose=0)
print("%s: %.2f%%" % (model.metrics_names[1], scores[1]*100))

執行示例生成以下輸出：

Created modeland loaded weightsfrom file

acc:77.73%

總結

在這篇文章中，你已經發現Checkpoint對深度學習模型長期訓練的重要性。

你學習了兩種可用於你下一個深入Checkpoint學習專案的Checkpoint策略：1. Checkpoint模型改進。

2. Checkpoint的最佳模型。

你還學習瞭如何載入Checkpoint模型並做出預測。

原文：http://machinelearningmastery.com/check-point-deep-learning-models-keras/

如何為Keras中的深度學習模型建立Checkpoint

深度學習模式可能需要幾個小時，幾天甚至幾周的時間來訓練。如果執行意外停止，你可能就白乾了。

Python安裝TensorFlow 2、tf.keras和深度學習模型的定義

原文連結：http://tecdat.cn/?p=15826 深度學習的預測建模是現代開發人員需要了解的一項技能。

利用TensorFlow2.0為膽固醇、血脂、血壓資料構建時序深度學習模型(python完整原始碼)

背景資料描述膽固醇、高血脂、高血壓是壓在廣大中年男性頭上的三座大山，如何有效的監控他們，做到早發現、早預防、早治療尤為關鍵，趁著這個假期我就利用TF2.0構建了一套時序預測模型，一來是可以幫我預

為深度學習模型載入自定義影象資料集：第1部分

作者|Renu Khandelwal 編譯|VK 來源|Towards Data Science 在本文中，你將學習如何載入自定義資料和建立影象序列和測試資料集，作為深度學習模型的輸入。

python打包深度學習模型為exe可執行檔案

技術標籤：深度學習神經網路tensorflow （轉發的（原文連結https://blog.csdn.net/qq_35756383/article/details/110850920），自己試過了，這個方法可以用，這個打包之前弄了好久總是出問題。）

基於Keras/Python的深度學習模型Dropout正則項

dropout技術是神經網路和深度學習模型的一種簡單而有效的正則化方式。本文將向你介紹dropout正則化技術，並且教你如何在Keras中用Python將其應用於你的模型。

儲存並載入您的Keras深度學習模型

Keras是一個用於深度學習的簡單而強大的Python庫。鑑於深度學習模式可能需要數小時、數天甚至數週的時間來培訓，瞭解如何儲存並將其從磁碟中載入是很重要的。在本文中，您將發現如何將Keras模型儲存到檔案中，並再次

使用Keras的Python深度學習模型的學習率方案

訓練神經網路或大型深度學習模型是一項很難的優化任務。傳統的訓練神經網路的演算法稱為隨機梯度下降。你可以通過在訓練中改變學習率來提高效能和提高訓練速度。

評估Keras深度學習模型的效能

Keras是Python中一個的強大而易用的庫，主要用於深度學習。在設計和配置你的深度學習模型時，需要做很多決策。大多數決定必須通過反覆試錯的方法來解決，並在真實的資料上進行評估。因此，有一個可靠的方法來評估神經

【ENVI深度學習】使用ENVI工具快速為深度學習模組建立標籤影象

Jason Wolfe Monday, April 22, 2019 隨著ENVI深度學習模組的釋出，遙感使用者從影象中提取特徵變得更加簡單。這種簡單性的一部分原因是：ENVI的預處理和光譜工具提供了建立標記資料集的能力。當我們可以半自動化的

深度學習模型調優方法（Deep Learning學習記錄）

深度學習模型的調優，首先需要對各方面進行評估，主要包括定義函式、模型在訓練集和測試集擬合效果、交叉驗證、啟用函式和優化演算法的選擇等。

常見深度學習模型總結

lenet Lenet 是最早的卷積神經網路之一,並且推動了深度學習領域的發展，最初是為手寫數字識別建立的網路。

thrift原始碼解析——深度學習模型的伺服器端工程化落地方案

來源 | 極鏈AI雲（價效比最高的共享GPU算力平臺，雙十活動進行中 10.9-10.11，充值就送！最多可送2500元現金券！免費試用地址：https://cloud.videojj.com/）

想快速開發和部署深度學習模型？推薦一個硬核工具

在數字化浪潮下，人工智慧成為企業實現降本增效的有效途徑。例如，工業生產製造企業中產品的質檢工作通常依賴人力完成，作為商品出廠前的最後一道工序，要求質檢人員具備高度的專業性與專注度。

2020-10-15【AI不惑境】網路深度對深度學習模型效能有什麼影響？

【AI不惑境】網路深度對深度學習模型效能有什麼影響？本文轉自：https://zhuanlan.zhihu.com/p/63560913

用 Java 訓練深度學習模型，原來可以這麼簡單！

本文適合有 Java 基礎的人群作者：DJL-Keerthan&Lanking HelloGitHub 推出的《講解開源專案》系列。這一期是由亞馬遜工程師：Keerthan Vasist，為我們講解 DJL（完全由 Java 構建的深度學習平臺）系列的第

深度學習模型部署

　　摘要：主要介紹下完成了模型訓練、評估之後的部署環節。　　前言：之前輿情情感分析那一篇文章已經講了如何使用ernie以及paddlehub來進行模型的訓練和優化以及評估環節，所以接下來會講下如何進行部署，進行實際

深度學習模型檔案mnn量化實踐

技術標籤：深度學習mnnquant 轉化成mnn模型雖然可以進行推理不過模型檔案可能較大或者執行較慢的情況

深度學習模型元件 ------ 深度可分離卷積、瓶頸層Bottleneck、CSP瓶頸層BottleneckCSP、ResNet模組、SPP空間金字塔池化模組

YOLOv5 元件作者：elfin 資料來源：yolov5 目錄1、標準卷積: Conv + BN + activate2、DWConv深度可分離卷積3、Bottleneck瓶頸層4、BottleneckCSP-CSP瓶頸層5、ResNet模組6、SPP空間金字塔池化模組

圖片 flask json_想要部署深度學習模型？試試 FLASK 構建 REST API 部署

技術標籤：圖片 flask json 想必大家都訓練出過比較好玩的模型，但是是不是想要向別人提供下介面或者自己試著玩下，這時候就需要涉及到部署模型了，這裡，我們將使用 Flask 部署 PyTorch 模型，並構建用於模型

如何為Keras中的深度學習模型建立Checkpoint

Checkpoint神經網路模型

Checkpoint神經網路模型改進

Checkpoint最佳神經網路模型

載入Checkpoint神經網路模型

總結

Checkpoint神經網路模型

Checkpoint神經網路模型改進

Checkpoint最佳神經網路模型

載入Checkpoint神經網路模型

總結

相關推薦