Tensorflow學習筆記No.9

阿新 • • 發佈：2020-10-28

模型的儲存與恢復

介紹一些常見的模型儲存與恢復方法，以及如何使用回撥函式儲存模型。

1.儲存完整模型

model.save()方法可以儲存完整的模型，包括模型的架構、模型的權重以及優化器。

model.save()的引數為儲存路徑以及檔名。

首先我們構建一個簡單的Sequential模型，使用fishion_mnist資料集進行訓練，得到一個訓練後的模型。

 1 import tensorflow as tf
 2 import numpy as np
 3 
 4 (train_image, train_label), (test_image, test_label) = tf.keras.datasets.fashion_mnist.load_data()
 
 5 
 6 train_image = np.expand_dims(train_image, -1)
 7 test_image = np.expand_dims(test_image, -1)
 8 
 9 model = tf.keras.Sequential()
10 model.add(tf.keras.layers.Conv2D(32, [3, 3], input_shape = (28, 28, 1), activation = 'relu'))
11 model.add(tf.keras.layers.Conv2D(64, [3, 3], activation = 'relu' 
))
12 model.add(tf.keras.layers.GlobalAveragePooling2D())
13 model.add(tf.keras.layers.Dense(64, activation = 'relu'))
14 model.add(tf.keras.layers.Dense(10, activation = 'softmax'))
15 
16 model.compile(optimizer = 'adam',
17               loss = 'sparse_categorical_crossentropy',
18               metrics = [' 
acc'])
19 
20 history = model.fit(train_image, train_label,
21                     epochs = 10,
22                     validation_data = (test_image, test_label))

使用model.summary()檢視當前模型結構：

1 model.summary()

訓練完成後我們使用model.evaluate()方法對測試集進行評估。

1 model.evaluate(test_image, test_label)

正確率如下圖所示：

然後我們使用model.save()方法儲存完整模型。

1 model.save('model_1.h5')

儲存後我們會得到一個名為model_1.h5的檔案，這個檔案就是儲存好的模型。

儲存好的模型會放到指定位置。

我們可以使用tf.keras.models.load_model()方法來匯入我們儲存好的模型，引數為已儲存模型的儲存位置以及檔名。

1 new_model = tf.keras.models.load_model('model_1.h5')

我們使用.summary()方法檢視一下模型結構是否與之前相同。

1 new_model.summary()

可以發現模型結構是完全一致的。

然後我們使用.evaluate()方法對測試集進行評估，看一下模型權重是否被儲存。

1 new_model.evaluate(test_image, test_label)

可以發現，loss值與之前完全相同。

注意：這裡acc值發生了很嚴重的變化，目前不知道我還是什麼原因導致的，但這不代表我們儲存的模型或者是權重出現了問題，使用.predict()方法依然可以正常對資料進行分類預測，這是我使用.predict()方法預測後與原資料一一比對後確認過的，可能是出現了一個小bug，知道原因的小夥伴可以評論區回覆我。

重申：模型是已經正常儲存了的，是可以正常使用的，大家無需擔心，loss值足夠證明我們的模型是正常儲存的。

2.僅儲存模型結構

有時候我們可能不需要儲存模型的權重，而只想儲存模型的架構。

這時可以使用model.to_jison()來獲取模型架構。

1 json = model.to_json()

json中儲存了模型架構的完整資訊。

我們可以使用python的檔案操作方法將它寫入到磁碟上，使用時再從磁碟上讀入即可，這裡不詳細說明了，大家自行百度即可。

使用tf.keras.models.model_from_jsom()來恢復模型，引數為我們之前儲存模型資訊的變數json。

1 new_model = tf.keras.models.model_from_json(json)

同樣，我們檢視模型結構並對模型進行評估。

1 new_model.summary()

1 new_model.compile(optimizer = 'adam',
2               loss = 'sparse_categorical_crossentropy',
3               metrics = ['acc'])
4 
5 new_model.evaluate(test_image, test_label)

注意，由於我們沒有儲存優化器，所以要先對模型新增一個優化器再進行評估。

可以發現loss值非常的大，也就說明的模型沒有被訓練過，模型中的引數都是隨機產生的。

3.僅儲存模型權重

同樣的，我們也可以僅儲存模型權重。

權重的儲存有兩種方法，可以像上面儲存模型結構一樣使用model.get_weights()把模型結構讀入到變數中再進行儲存，也可以使用keras提供的方法直接儲存到磁碟上。

這裡主要介紹第二種(主要是第一種用處不大)。

使用model.save_weights()方法進行儲存，引數為儲存路徑以及檔名。

1 model.save_weights('weights_1.h5')

同樣，我們會得到一個對應的檔案。

然後使用.load_weigths()方法可以載入權重，引數為路徑及檔名。

1 new_model.load_weights('weights_1.h5')

對測試集進行評估檢視是否被正常載入。

1 new_model.evaluate(test_image, test_label)

loss值與之前相同，說明權重被正常載入了。

注意，儲存權重也不會儲存優化器，這裡不用重定義優化器是因為上面已經給new_model這個物件定義過優化器了。

4.使用回撥函式儲存模型

我覺得這是最實用也是最好的模型儲存方法。

首先定義一個回撥函式監測訓練過程並儲存模型。

使用tf.keras.callbacks.ModelCheckpoint()來定義這樣一個回撥函式。

它的主要引數為:

　　filepath:儲存位置。

　　moinitor = 'val_loss':監視的變數。

　　verboss = 0:是否顯示詳細資訊。

　　save_best_only = False:為True則會儲存loss最低的或者acc最高的。

　　save_weihts_only = False:是否只儲存權重，為False會儲存整個模型。

1 checkpoint = tf.keras.callbacks.ModelCheckpoint('modelcp', 
2                                                 save_weights_only = True,
3                                                 save_best_only = True,
4                                                 verbose = 1)

然後我們構建模型訓練一下試試。

 1 new_model = tf.keras.models.model_from_json(json)
 2 
 3 new_model.compile(optimizer = 'adam',
 4               loss = 'sparse_categorical_crossentropy',
 5               metrics = ['acc'])
 6 
 7 history = new_model.fit(train_image, train_label,
 8                     epochs = 5,
 9                     validation_data = (test_image, test_label),
10                     callbacks = [checkpoint])

要在.fit()中加入callbacks引數呼叫回撥函式。

可以發現我們的模型資訊被儲存了，同時多出來三個儲存好的檔案。

同樣使用.load_weights()來載入權重，並進行評估。

1 new_model = tf.keras.models.model_from_json(json)
2 
3 new_model.compile(optimizer = 'adam',
4               loss = 'sparse_categorical_crossentropy',
5               metrics = ['acc'])
6 
7 new_model.load_weights('modelcp')
8 
9 new_model.evaluate(test_image, test_label)

得到結果：

與訓練時最後儲存的結果相同。

關於模型的儲存方法就介紹到這裡了，後續會更新更多內容哦！o(*￣▽￣*)o

Tensorflow學習筆記No.9

模型的儲存與恢復介紹一些常見的模型儲存與恢復方法，以及如何使用回撥函式儲存模型。

Tensorflow學習筆記No.1

使用tf.keras.Sequential()建立網路模型整個過程可分為五步：1建立Sequential模型，2新增所需要的神經層，3使用.compile方法確定模型訓練結構，4使用.fit方法

Tensorflow學習筆記No.2

使用函式式API構建神經網路函式式API相比於keras.Sequential()具有更加靈活多變的特點。

TensorFlow學習筆記之--[compute_gradients和apply_gradients原理淺析]

I optimizer.minimize(loss, var_list) 我們都知道，TensorFlow為我們提供了豐富的優化函式，例如GradientDescentOptimizer。這個方法會自動根據loss計算對應variable的導數。示例如下：

TensorFlow學習筆記之--[tf.clip_by_global_norm,tf.clip_by_value,tf.clip_by_norm等的區別]

以下這些函式可以用於解決梯度消失或梯度爆炸問題上。 1. tf.clip_by_value tf.clip_by_value(

【夢溪筆談】7.TensorFlow學習筆記

#matmul:將矩陣 a 乘以矩陣 b,生成a * b #pow（x,y）=x^y #subtract：返回x-y 的元素 #multiply 對應元素相乘，不是矩陣相乘，而是相同維度的兩個向量（或者矩陣）對應的元素相乘，結果還是原向量的維度一致的向量

tensorflow學習筆記——DenseNet

完整程式碼及其資料，請移步小編的GitHub地址　　傳送門：請點選我　　如果點選有誤：https://github.com/LeBron-Jian/DeepLearningNote

tensorflow學習筆記1

tensorflow處理的是圖形影象，圖形圖形都是二維平面，所以資料都用矩陣來表示。

Java全棧大資料學習筆記NO.3

技術標籤：JAVA全棧大資料java Java語言提升一、迴圈與判斷二、Java中的方法三、陣列定義陣列預設值

程式設計實踐筆記No.9

技術標籤：程式設計實踐程式設計實踐筆記No.9 題目一088 合併兩個有序陣列程式碼

Java全棧大資料學習筆記NO.4（CSS基礎）

技術標籤：JAVA全棧大資料css CSS基礎一、CSS簡介二、使用CSS的原因三、CSS優點四、CSS位置五、CSS種類六、CSS註釋七、樣式表優先順序八、CSS語句結構九、選擇器的種類

python學習筆記--NO.1輸入輸出

NO.1 輸入輸出一、input( )函式1. 語法2. 常用方法2.1 常用輸入2.2 去除輸入的非法字元2.3 多資料輸入2.4 強制轉換輸入(含字母大小寫方法)2.5 對輸入資料驗證

『Linux學習筆記』9. 程序

現代的作業系統都支援多工, 這意味著作業系統需要在多個程式之間不停快速切換以造成多個程式在同時執行的假象. Linux核心也是如此, 它通過\"程序\"實現不同程式間的排程, \"程序\"就是Linux 組織安排正在等待使用 CP

CSS學習筆記(一)-9.CSS三大特性

CSS三大特性：層疊性,繼承性，優先順序。一、層疊性。相同的選擇器設定同屬性的樣式，值不同。即發生樣式層疊衝突。

python學習筆記第9章：資料庫操作

9.1Mongodb 1.連線 from pymongo import MongoClient def conMon(collection): client = MongoClient( \'mongodb://使用者名稱:passwd@ip:port,172.20.1.7:27017,10.176.2.2:27017/admin\')

java學習筆記 2021.9.21

增強型陣列（二層迴圈）例如：陣列名為array array.for//第一層迴圈 ints.for//第二層迴圈

大一C語言學習筆記（9）---指標篇--從”記憶體的使用“和“流程控制”的角度來理解“指標變數的使用‘

總結：在指標變數沒有初始化的時候，使用“ * 指標變數 ”是錯誤的，這就和其他型別變數沒有初始化是一個型別的問題；對於指標變數來說，有沒有初始化不取決於它指向的記憶體中有沒有儲存資料，而取決於它有沒有儲

TensorFlow學習筆記--Mnist全連線模型實踐

import os from tensorflow.keras.datasets import mnist import tensorflow as tf from tensorflow.python.keras import Model

Tensorflow Summary用法學習筆記

最近在研究tensorflow自帶的例程speech_command,順便學習tensorflow的一些基本用法。

Locust學習筆記9——分散式壓測

　　引言　　我們知道Jmeter單機併發數並不高，一般配置也就支援1000左右。那麼就引出了分散式壓測的概念，Jmeter通過排程機(Master)與執行機(Slave)來實現。而Locust也支援分散式壓測，類似Jmeter一樣，當一臺機器

Tensorflow學習筆記No.9

模型的儲存與恢復

1.儲存完整模型

2.僅儲存模型結構

3.僅儲存模型權重

4.使用回撥函式儲存模型

相關推薦