1. 程式人生 > 程式設計 >keras自定義回撥函式檢視訓練的loss和accuracy方式

keras自定義回撥函式檢視訓練的loss和accuracy方式

前言:

keras是一個十分便捷的開發框架,為了更好的追蹤網路訓練過程中的損失函式loss和準確率accuracy,我們有幾種處理方式,第一種是直接通過 history=model.fit(),來返回一個history物件,通過這個物件可以訪問到訓練過程訓練集的loss和accuracy以及驗證集的loss和accuracy。

第二種方式就是通過自定義一個回撥函式Call backs,來實現這一功能,本文主要講解第二種方式。

一、如何構建回撥函式Callbacks

本文所針對的例子是卷積神經網路Lenet-5,資料集是mnist資料集。

1.1 什麼是回撥函式

回撥函式是一個函式的合集,會在訓練的階段中所使用。你可以使用回撥函式來檢視訓練模型的內在狀態和統計。你可以傳遞一個列表的回撥函式(作為 callbacks 關鍵字引數)到 Sequential 或 Model 型別的 .fit() 方法。在訓練時,相應的回撥函式的方法就會被在各自的階段被呼叫。

這裡有兩個關鍵的點:

(1)狀態和統計:其實就是我們希望模型在訓練過程中需要從過程中獲取什麼資訊,比如我的損失loss,準確率accuracy等資訊就是訓練過程中的狀態與統計資訊;再比如我希望每一個epoch結束之後列印一些相應的自定義提示資訊,這也是狀態資訊。

(2)各自的階段:模型的訓練一般是分為多少個epoch,然後每一個epoch又分為多少個batch,所以這個階段可以是在每一個epoch之後執行回撥函式,也可以是在每一個batch之後執行回撥函式。

1.2 回撥函式的本質

其實回撥函式只是一個很形象的說法,它的本質是一個類,我們直接通過 history=model.fit()返回的history物件就是一個回撥函式History類的物件,而History類又繼承自Callback類。

回撥函式的基類——Call back,他的定義如下:

class Callback(object): # 用來組建新的回撥函式的抽象基類
 
 def __init__(self):
  self.validation_data = None
  self.model = None
 
 def set_params(self,params):
  self.params = params
 
 def set_model(self,model):
  self.model = model
 
 def on_epoch_begin(self,epoch,logs=None):
  pass
 
 def on_epoch_end(self,logs=None):
  pass
 
 def on_batch_begin(self,batch,logs=None):
  pass
 
 def on_batch_end(self,logs=None):
  pass
 
 def on_train_begin(self,logs=None):
  pass
 
 def on_train_end(self,logs=None):
  pass

屬性

params: 它是一個字典型別。訓練引數, (例如,verbosity,batch size,number of epochs...)。

model: keras.models.Model 的例項。 指代被訓練模型。

被回撥函式作為引數的 logs 字典,它會含有於當前批量或訓練輪相關資料的鍵。

特別需要注意的是,上面的每一個函式裡面均有一個logs引數,這個引數也是記錄訓練資訊的關鍵,需要注意以下幾個點:

(1)logs是一個字典物件directory;

(2)在不同的方法中這個logs有不同的鍵值;分別如下:

on_epoch_end: 包括 acc 和 loss 的日誌, 也可以選擇性的包括 val_loss(如果在 fit 中啟用驗證),和 val_acc(如果啟用驗證和監測精確值)。這個用的是最多的。

on_batch_begin: 包括 size 的日誌,在當前批量內的樣本數量。

on_batch_end: 包括 loss 的日誌,也可以選擇性的包括 acc

1.3 系統預定義的回撥函式

BaseLogger
TerminateOnNaN
ProgbarLogger
History
ModelCheckpoint
EarlyStopping
RemoteMonitor
LearningRateScheduler
TensorBoard
ReduceLROnPlateau
CSVLogger
LambdaCallback

二、keras實現自定義History回撥函式記錄loss和accuracy

2.1 回撥函式的定義

# 寫一個LossHistory類,儲存訓練集的loss和acc
# 當然我也可以完全不這麼做,可以直接使用model.fit()方法返回的 history物件去做
'''Callback有6個常用的方法,這裡實現其中的四個
 def on_epoch_begin(self,logs=None):
 def on_epoch_end(self,logs=None):
 def on_batch_begin(self,logs=None):
 def on_batch_end(self,logs=None):
 def on_train_begin(self,logs=None):
 def on_train_end(self,logs=None):
'''
class LossHistory(Callback): # 繼承自Callback類
 
 '''
 在模型開始的時候定義四個屬性,每一個屬性都是字典型別,儲存相對應的值和epoch
 '''
 def on_train_begin(self,logs={}):
  self.losses = {'batch':[],'epoch':[]}
  self.accuracy = {'batch':[],'epoch':[]}
  self.val_loss = {'batch':[],'epoch':[]}
  self.val_acc = {'batch':[],'epoch':[]}
 
 # 在每一個batch結束後記錄相應的值
 def on_batch_end(self,logs={}):
  self.losses['batch'].append(logs.get('loss'))
  self.accuracy['batch'].append(logs.get('acc'))
  self.val_loss['batch'].append(logs.get('val_loss'))
  self.val_acc['batch'].append(logs.get('val_acc'))
 
 # 在每一個epoch之後記錄相應的值
 def on_epoch_end(self,logs={}):
  self.losses['epoch'].append(logs.get('loss'))
  self.accuracy['epoch'].append(logs.get('acc'))
  self.val_loss['epoch'].append(logs.get('val_loss'))
  self.val_acc['epoch'].append(logs.get('val_acc'))
 
 def loss_plot(self,loss_type):
  '''
  loss_type:指的是 'epoch'或者是'batch',分別表示是一個batch之後記錄還是一個epoch之後記錄
  '''
  iters = range(len(self.losses[loss_type]))
  plt.figure()
  # acc
  plt.plot(iters,self.accuracy[loss_type],'r',label='train acc')
  # loss
  plt.plot(iters,self.losses[loss_type],'g',label='train loss')
  if loss_type == 'epoch':
   # val_acc
   plt.plot(iters,self.val_acc[loss_type],'b',label='val acc')
   # val_loss
   plt.plot(iters,self.val_loss[loss_type],'k',label='val loss')
  plt.grid(True)
  plt.xlabel(loss_type)
  plt.ylabel('acc-loss')
  plt.legend(loc="upper right")
  plt.savefig("mnist_keras.png")
  plt.show()

2.2 模型的搭建以及訓練

mnist資料準備

# 訓練引數
learning_rate = 0.001
epochs = 10
batch_size = 128
n_classes = 10
 
# 定義影象維度reshape
img_rows,img_cols = 28,28
 
# 載入keras中的mnist資料集 分為60,000個訓練集,10,000個測試集
(x_train,y_train),(x_test,y_test) = mnist.load_data()
 
# 將圖片轉化為(samples,width,height,channels)的格式
x_train = x_train.reshape(x_train.shape[0],img_rows,img_cols,1)
x_test = x_test.reshape(x_test.shape[0],1)
 
# 將X_train,X_test的資料格式轉為float32
x_train = x_train.astype('float32')
x_test = x_test.astype('float32')
# 將X_train,X_test歸一化0-1
x_train /= 255
x_test /= 255
 
# 輸出0-9轉換為ont-hot形式
y_train = np_utils.to_categorical(y_train,n_classes)
y_test = np_utils.to_categorical(y_test,n_classes)

模型的搭建以及訓練

# 建立模型
model = Sequential()
 
# lenet-5
model.add(Convolution2D(filters=6,kernel_size=(5,5),padding='valid',input_shape=(img_rows,1),activation='tanh'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Convolution2D(filters=16,2)))
model.add(Flatten())
model.add(Dense(120,activation='tanh'))
model.add(Dense(84,activation='tanh'))
model.add(Dense(n_classes,activation='softmax'))
 
#列印模型# verbose=1顯示進度條
model.summary()
 
# 編譯模型
model.compile(optimizer=Adam(lr=learning_rate),loss='categorical_crossentropy',metrics=['accuracy'])
 
history = LossHistory() # 這裡是使用自定義的Callback回撥函式,當然本身fit函式也會返回一個history可供使用
model.fit(x_train,y_train,batch_size=batch_size,epochs=epochs,verbose=1,validation_data=(x_test,y_test),callbacks=[history])
model.save('./models/lenet5_weight.h5')

繪製訓練過程loss和acc曲線

#繪製訓練的acc-loss曲線

history.loss_plot('epoch') # 每一個epoch展示一次

最終的執行結果如下:

Epoch 1/10
2019-06-23 08:44:32.930737: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1432] Found device 0 with properties:
name: GeForce GTX 950 major: 5 minor: 2 memoryClockRate(GHz): 1.2155
pciBusID: 0000:01:00.0
totalMemory: 2.00GiB freeMemory: 1.64GiB
2019-06-23 08:44:32.937390: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1511] Adding visible gpu devices: 0
2019-06-23 08:44:37.003650: I tensorflow/core/common_runtime/gpu/gpu_device.cc:982] Device interconnect StreamExecutor with strength 1 edge matrix:
2019-06-23 08:44:37.006358: I tensorflow/core/common_runtime/gpu/gpu_device.cc:988]  0
2019-06-23 08:44:37.008076: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1001] 0: N
2019-06-23 08:44:37.012620: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1115] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:0 with 1388 MB memory) -> physical GPU (device: 0,name: GeForce GTX 950,pci bus id: 0000:01:00.0,compute capability: 5.2)
60000/60000 [==============================] - 18s 302us/step - loss: 0.2979 - acc: 0.9151 - val_loss: 0.0863 - val_acc: 0.9730
Epoch 2/10
60000/60000 [==============================] - 4s 61us/step - loss: 0.0810 - acc: 0.9753 - val_loss: 0.0611 - val_acc: 0.9808
Epoch 3/10
60000/60000 [==============================] - 4s 59us/step - loss: 0.0575 - acc: 0.9826 - val_loss: 0.0518 - val_acc: 0.9849
Epoch 4/10
60000/60000 [==============================] - 4s 59us/step - loss: 0.0451 - acc: 0.9857 - val_loss: 0.0480 - val_acc: 0.9848
Epoch 5/10
60000/60000 [==============================] - 4s 59us/step - loss: 0.0375 - acc: 0.9886 - val_loss: 0.0449 - val_acc: 0.9860
Epoch 6/10
60000/60000 [==============================] - 3s 57us/step - loss: 0.0307 - acc: 0.9907 - val_loss: 0.0392 - val_acc: 0.9863
Epoch 7/10
60000/60000 [==============================] - 4s 68us/step - loss: 0.0242 - acc: 0.9923 - val_loss: 0.0389 - val_acc: 0.9882
Epoch 8/10
60000/60000 [==============================] - 4s 75us/step - loss: 0.0192 - acc: 0.9944 - val_loss: 0.0354 - val_acc: 0.9891
Epoch 9/10
60000/60000 [==============================] - 4s 66us/step - loss: 0.0180 - acc: 0.9942 - val_loss: 0.0385 - val_acc: 0.9885
Epoch 10/10
60000/60000 [==============================] - 4s 67us/step - loss: 0.0143 - acc: 0.9956 - val_loss: 0.0516 - val_acc: 0.9860

得到的訓練曲線如下:

keras自定義回撥函式檢視訓練的loss和accuracy方式

三、模型的結果測試

這裡需要使用到sklearn庫,程式碼如下:

from keras.models import load_model
from sklearn.metrics import confusion_matrix,f1_score,precision_score,recall_score,accuracy_score
 
# 測試
model=load_model('./models/lenet5_weight.h5')
 
y_predict = model.predict(x_test,batch_size=512,verbose=1)
# y_predict = (y_predict > 0.007).astype(int)
y_predict = (y_predict > 0.01).astype(int)
y_true = np.reshape(y_test,[-1])
y_pred = np.reshape(y_predict,[-1])
 
# 評價指標
accuracy = accuracy_score(y_true,y_pred)
precision = precision_score(y_true,y_pred)
recall = recall_score(y_true,y_pred,average='binary')
f1score = f1_score(y_true,average='binary')
 
# Micro F1: 將n分類的評價拆成n個二分類的評價,將n個二分類評價的TP、FP、RN對應相加,計算評價準確率和召回率,由這2個準確率和召回率計算的F1 score即為Micro F1。
# Macro F1: 將n分類的評價拆成n個二分類的評價,計算每個二分類的F1 score,n個F1 score的平均值即為Macro F1。
# 一般來講,Macro F1、Micro F1高的分類效果好。Macro F1受樣本數量少的類別影響大。
micro_f1 = f1_score(y_true,average='micro')
macro_f1 = f1_score(y_true,average='macro')
 
print('accuracy:',accuracy)
print('precision:',precision)
print('recall:',recall)
print('f1score:',f1score)
print('Macro-F1: {}'.format(macro_f1))
print('Micro-F1: {}'.format(micro_f1))
 

執行結果是:

10000/10000 [==============================] - 2s 151us/step
accuracy: 0.98813
precision: 0.8956631049654306
recall: 0.9975
f1score: 0.9438425509769599
Macro-F1: 0.9686030934161676
Micro-F1: 0.98813

以上這篇keras自定義回撥函式檢視訓練的loss和accuracy方式就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支援我們。