一些常見的keras用法
一些常見的keras用法
Necther 誰終將聲震荒野必長久深自緘默 誰終將引燃閃電必長久如雲漂泊層的自定義#
這裡介紹Keras中自定義層及其一些運用技巧,在這之中我們可以看到Keras層的精巧之處。
基本定義方法#
在Keras中,自定義層的最簡單方法是通過Lambda層的方式:
from keras.layers import *
from keras import backend as K
x_in = Input(shape=(10,))
x = Lambda(lambda x: x+2)(x_in) # 對輸入加上2
有時候,我們希望區分訓練階段和測試階段,比如訓練階段給輸入加入一些噪聲,而測試階段則去掉噪聲,這需要用K.in_train_phase實現,比如
def add_noise_in_train(x):
x_ = x + K.random_normal(shape=K.shape(x)) # 加上標準高斯噪聲
return K.in_train_phase(x_, x)
x_in = Input(shape=(10,))
x = Lambda(add_noise_in_train)(x_in) # 訓練階段加入高斯噪聲,測試階段去掉
當然,Lambda層僅僅適用於不需要增加訓練引數的情形,如果想要實現的功能需要往模型新增引數,那麼就必須要用到自定義Layer了。其實這也不復雜,相比於Lambda層只不過程式碼多了幾行,官方文章已經寫得很清楚了:
這裡把它頁面上的例子搬過來:
class MyLayer(Layer):
def __init__(self, output_dim, **kwargs):
self.output_dim = output_dim # 可以自定義一些屬性,方便呼叫
super(MyLayer, self).__init__(**kwargs) # 必須
def build(self, input_shape):
# 新增可訓練引數
self.kernel = self.add_weight(name='kernel',
shape=(input_shape[1], self.output_dim),
initializer='uniform',
trainable=True)
def call(self, x):
# 定義功能,相當於Lambda層的功能函式
return K.dot(x, self.kernel)
def compute_output_shape(self, input_shape):
# 計算輸出形狀,如果輸入和輸出形狀一致,那麼可以省略,否則最好加上
return (input_shape[0], self.output_dim)
雙輸出的層#
平時我們碰到的所有層,幾乎都是單輸出的,包括Keras中自帶的所有層,都是一個或者多個輸入,然後返回一個結果輸出的。那麼Keras可不可以定義雙輸出的層呢?答案是可以,但要明確定義好output_shape,比如下面這個層,簡單地將輸入切開分兩半,並且同時返回。
class SplitVector(Layer):
def __init__(self, **kwargs):
super(SplitVector, self).__init__(**kwargs)
def call(self, inputs):
# 按第二個維度對tensor進行切片,返回一個list
in_dim = K.int_shape(inputs)[-1]
return [inputs[:, :in_dim//2], inputs[:, in_dim//2:]]
def compute_output_shape(self, input_shape):
# output_shape也要是對應的list
in_dim = input_shape[-1]
return [(None, in_dim//2), (None, in_dim-in_dim//2)]
x1, x2 = SplitVector()(x_in) # 使用方法
層與loss的結合#
有了《Keras中自定義複雜的loss函式》一文經驗的讀者可以知道,Keras中對loss的基本定義是一個輸入為y_true和y_pred函式。但在比較複雜的情況下,它不僅僅是預測值和目標值的函式,還可以結合權重進行復雜的運算。
這裡再次以center loss為例,介紹一種基於自定義層的寫法。
class Dense_with_Center_loss(Layer):
def __init__(self, output_dim, **kwargs):
self.output_dim = output_dim
super(Dense_with_Center_loss, self).__init__(**kwargs)
def build(self, input_shape):
# 新增可訓練引數
self.kernel = self.add_weight(name='kernel',
shape=(input_shape[1], self.output_dim),
initializer='glorot_normal',
trainable=True)
self.bias = self.add_weight(name='bias',
shape=(self.output_dim,),
initializer='zeros',
trainable=True)
self.centers = self.add_weight(name='centers',
shape=(self.output_dim, input_shape[1]),
initializer='glorot_normal',
trainable=True)
def call(self, inputs):
# 對於center loss來說,返回結果還是跟Dense的返回結果一致
# 所以還是普通的矩陣乘法加上偏置
self.inputs = inputs
return K.dot(inputs, self.kernel) + self.bias
def compute_output_shape(self, input_shape):
return (input_shape[0], self.output_dim)
def loss(self, y_true, y_pred, lamb=0.5):
# 定義完整的loss
y_true = K.cast(y_true, 'int32') # 保證y_true的dtype為int32
crossentropy = K.sparse_categorical_crossentropy(y_true, y_pred, from_logits=True)
centers = K.gather(self.centers, y_true[:, 0]) # 取出樣本中心
center_loss = K.sum(K.square(centers - self.inputs), axis=1) # 計算center loss
return crossentropy + lamb * center_loss
f_size = 2
x_in = Input(shape=(784,))
f = Dense(f_size)(x_in)
dense_center = Dense_with_Center_loss(10)
output = dense_center(f)
model = Model(x_in, output)
model.compile(loss=dense_center.loss,
optimizer='adam',
metrics=['sparse_categorical_accuracy'])
# 這裡是y_train是類別的整數id,不用轉為one hot
model.fit(x_train, y_train, epochs=10)
花式回撥器#
除了修改模型,我們還可能在訓練過程中做很多事情,比如每個epoch結束後,算一下驗證集的指標,儲存最優模型,還有可能在多少個epoch後就降低學習率,或者修改正則項引數,等等,這些都可以通過回撥器來實現。
回撥器官方頁:https://keras.io/callbacks/
儲存最優模型#
在Keras中,根據驗證集的指標來保留最優模型,最簡便的方法是通過自帶的ModelCheckpoint,比如
checkpoint = ModelCheckpoint(filepath='./best_model.weights',
monitor='val_acc',
verbose=1,
save_best_only=True)
model.fit(x_train,
y_train,
epochs=10,
validation_data=(x_test, y_test),
callbacks=[checkpoint])
然而,這種方法雖然簡單,但是有一個明顯的缺點,就是裡邊的指標是由compile的metrics來確定的,而Keres中自定義一個metric,需要寫成張量運算才行,也就是說如果你期望的指標並不能寫成張量運算(比如bleu等指標),那麼就沒法寫成一個metric函數了,也就不能用這個方案了。
於是,一個萬能的方案就出來了:自己寫回調器,愛算什麼就算什麼。比如:
from keras.callbacks import Callback
def evaluate(): # 評測函式
pred = model.predict(x_test)
return np.mean(pred.argmax(axis=1) == y_test) # 愛算啥就算啥
# 定義Callback器,計算驗證集的acc,並儲存最優模型
class Evaluate(Callback):
def __init__(self):
self.accs = []
self.highest = 0.
def on_epoch_end(self, epoch, logs=None):
acc = evaluate()
self.accs.append(acc)
if acc >= self.highest: # 儲存最優模型權重
self.highest = acc
model.save_weights('best_model.weights')
# 愛執行什麼就執行什麼
print 'acc: %s, highest: %s' % (acc, self.highest)
evaluator = Evaluate()
model.fit(x_train,
y_train,
epochs=10,
callbacks=[evaluator])
修改超引數#
訓練過程中還有可能對超引數進行微調,比如最常見的一個需求是根據epoch來調整學習率,這可以簡單地通過LearningRateScheduler來實現,它也屬於回撥器之一。
from keras.callbacks import LearningRateScheduler
def lr_schedule(epoch):
# 根據epoch返回不同的學習率
if epoch < 50:
lr = 1e-2
elif epoch < 80:
lr = 1e-3
else:
lr = 1e-4
return lr
lr_scheduler = LearningRateScheduler(lr_schedule)
model.fit(x_train,
y_train,
epochs=10,
callbacks=[evaluator, lr_scheduler])
如果是其他超引數呢?比如前面center loss的lamb,或者是類似的正則項。這種情況下,我們需要將lamb設為一個Variable,然後自定義一個回撥器來動態賦值。比如當初我定義的一個loss:
def mycrossentropy(y_true, y_pred, e=0.1):
loss1 = K.categorical_crossentropy(y_true, y_pred)
loss2 = K.categorical_crossentropy(K.ones_like(y_pred)/nb_classes, y_pred)
return (1-e)*loss1 + e*loss2
如果要動態改變引數e,那麼可以改為
e = K.variable(0.1)
def mycrossentropy(y_true, y_pred):
loss1 = K.categorical_crossentropy(y_true, y_pred)
loss2 = K.categorical_crossentropy(K.ones_like(y_pred)/nb_classes, y_pred)
return (1-e)*loss1 + e*loss2
model.compile(loss=mycrossentropy,
optimizer='adam')
class callback4e(Callback):
def __init__(self, e):
self.e = e
def on_epoch_end(self, epoch, logs={}):
if epoch > 100: # 100個epoch之後設為0.01
K.set_value(self.e, 0.01)
model.fit(x_train,
y_train,
epochs=10,
callbacks=[callback4e(e)])
注意Callback類共支援六種在不同階段的執行函式:on_epoch_begin、on_epoch_end、on_batch_begin、on_batch_end、on_train_begin、on_train_end,每個函式所執行的階段不一樣(根據名字很容易判斷),可以組合起來實現很複雜的功能。比如warmup,就是指設定了預設學習率後,並不是一開始就用這個學習率訓練,而是在前幾個epoch中,從零慢慢增加到預設的學習率,這個過程可以理解為在為模型調整更好的初始化。參考程式碼:
class Evaluate(Callback):
def __init__(self):
self.num_passed_batchs = 0
self.warmup_epochs = 10
def on_batch_begin(self, batch, logs=None):
# params是模型自動傳遞給Callback的一些引數
if self.params['steps'] == None:
self.steps_per_epoch = np.ceil(1. * self.params['samples'] / self.params['batch_size'])
else:
self.steps_per_epoch = self.params['steps']
if self.num_passed_batchs < self.steps_per_epoch * self.warmup_epochs:
# 前10個epoch中,學習率線性地從零增加到0.001
K.set_value(self.model.optimizer.lr,
0.001 * (self.num_passed_batchs + 1) / self.steps_per_epoch / self.warmup_epochs)
self.num_passed_batchs += 1
釋出於 2019-12-03
Keras
TensorFlow 學習
深度學習(Deep Learning)
文章被以下專欄收錄
南湖研究院 資料競賽經驗,工作積累的筆記,南湖邊有可愛的橘貓推薦閱讀
tf.keras一個存在自定義層時載入模型時的小坑
王嶽王院長Keras編寫自定義層--以GroupNormalization為例
BINGO HongTensorflow Finetune方法
BINGO Hong手把手教你用keras--CNN網路識別cifar10
馬卡斯·揚5 條評論
寫下你的評論...- hust-0offer02-12 想請問下ocr系列啥時候更新,謝謝
- Necther(作者)回覆hust-0offer02-12 最近在家裡沒回公司,手機打字不方便,等災情過去之後再寫
- hust-0offer回覆Necther(作者)02-12 好的,謝謝樓主
- 這世界有點煩04-12 請問class xxx(Layer):中的Layer怎麼定義?
-
咕嚕咕嚕小叔叔06-19
參考的蘇神的文章?