Tensorflow實現部分引數梯度更新操作

阿新 • • 發佈：2020-01-25

在深度學習中，遷移學習經常被使用，在大資料集上預訓練的模型遷移到特定的任務，往往需要保持模型引數不變，而微調與任務相關的模型層。

本文主要介紹，使用tensorflow部分更新模型引數的方法。

1. 根據Variable scope剔除需要固定引數的變數

def get_variable_via_scope(scope_lst):
  vars = []
  for sc in scope_lst:
    sc_variable = tf.get_collection(tf.GraphKeys.TRAINABLE_VARIABLES,scope=scope)
    vars.extend(sc_variable)
  return vars
 
trainable_vars = tf.trainable_variables()
no_change_scope = ['your_unchange_scope_name']
 
no_change_vars = get_variable_via_scope(no_change_scope)
 
for v in no_change_vars:
  trainable_vars.remove(v)
 
grads,_ = tf.gradients(loss,trainable_vars)
 
optimizer = tf.train.AdamOptimizer(lr)
 
train_op = optimizer.apply_gradient(zip(grads,trainable_vars),global_step=global_step)

2. 使用tf.stop_gradient()函式

在建立Graph過程中使用該函式，非常簡潔地避免了使用scope獲取引數

3. 一個矩陣中部分行或列引數更新

如果一個矩陣，只有部分行或列需要更新引數，其它保持不變，該場景很常見，例如word embedding中，一些預定義的領域相關詞保持不變（使用領域相關word embedding初始化），而另一些通用詞變化。

import tensorflow as tf
import numpy as np
 
def entry_stop_gradients(target,mask):
  mask_h = tf.abs(mask-1)
  return tf.stop_gradient(mask_h * target) + mask * target
 
mask = np.array([1.,1,1])
mask_h = np.abs(mask-1)
 
emb = tf.constant(np.ones([10,5]))
 
matrix = entry_stop_gradients(emb,tf.expand_dims(mask,1))
 
parm = np.random.randn(5,1)
t_parm = tf.constant(parm)
 
loss = tf.reduce_sum(tf.matmul(matrix,t_parm))
grad1 = tf.gradients(loss,emb)
grad2 = tf.gradients(loss,matrix)
print matrix
with tf.Session() as sess:
  print sess.run(loss)
  print sess.run([grad1,grad2])

以上這篇Tensorflow實現部分引數梯度更新操作就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

Tensorflow實現部分引數梯度更新操作

在深度學習中，遷移學習經常被使用，在大資料集上預訓練的模型遷移到特定的任務，往往需要保持模型引數不變，而微調與任務相關的模型層。

tensorflow 固定部分引數訓練,只訓練部分引數的例項

我就廢話不多說了。直接上程式碼吧！ def var_filter(var_list,last_layers = [0]): filter_keywords = [\'fine_tune\',\'layer_11\',\'layer_10\',\'layer_9\',\'layer_8\']

tensorflow 實現自定義梯度反向傳播程式碼

以sign函式為例： sign函式可以對數值進行二值化，但在梯度反向傳播是不好處理，一般採用一個近似函式的梯度作為代替，如上圖的Htanh。在[-1,1]直接梯度為1，其他為0。

TensorFlow實現批量歸一化操作的示例

批量歸一化在對神經網路的優化方法中，有一種使用十分廣泛的方法——批量歸一化，使得神經網路的識別準確度得到了極大的提升。

PostgreSQL實現批量插入、更新與合併操作的方法

前言就在 2019 年 1 月份微軟收購了 PostgreSQL 資料庫的初創公司 CitusData,在雲資料庫方面可以增強與 AWS 的竟爭。AWS 的 RDS 兩大開源資料庫就是 MySQL(Aurora 和 MariaDB 是它的變種) 和 PostgreSQL。

tensorflow實現對張量資料的切片操作方式

如下所示： import tensorflow as tf a=tf.constant([[[1,2,3,4],[4,5,6,7],[7,8,9,10]],[[11,12,13,14],[20,21,22,23],[15,16,17,18]]])

tensorflow實現測試時讀取任意指定的check point的網路引數

tensorflow在訓練時會儲存三個檔案， model.ckpt-xxx.data-00000-of-00001 model.ckpt-xxx.index model.ckpt-xxx.meta

在tensorflow實現直接讀取網路的引數(weight and bias)的值

訓練好了一個網路，想要檢視網路裡面引數是否經過BP演算法優化過，可以直接讀取網路裡面的引數，如果一直是隨機初始化的值，則證明訓練程式碼有問題，需要改。

Mybatis-Plus自動填充更新操作相關欄位的實現

在阿里開發手冊的建表規約中有說明，資料庫表中應該都要有create_time、update_time欄位；那麼在開發中，對於這些共有欄位的處理應該要進行統一，這樣就可以簡化我們的開發過程。那麼本文就對Mybatis-Plus中的欄位自

JAVA實現賬戶取款和存款操作

這篇文章主要介紹了JAVA實現賬戶取款和存款操作,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

SpringBoot中通過實現WebMvcConfigurer引數校驗的方法示例

在Spring5.0和SpringBoot2.0中廢棄了WebMvcConfigurerAdapter類。現有兩種解決方案 1 直接實現WebMvcConfigurer （官方推薦）

sql server使用臨時儲存過程實現使用引數新增檔案組指令碼複用

create procedure #pr_CreateFileGroup @dbname nvarchar(max),@filegroupname nvarchar(max) as begin /* 指令碼來源：https://www.cnblogs.com/zhang502219048/p/12105527.html