tensorflow Optimizer.minimize()和gradient clipping

阿新 • • 發佈：2018-07-16

mini 節點通過修改 glob radi per represent rain

在tensorflow中通常使用下述方法對模型進行訓練

# 定義Optimizer
opt = tf.train.AdamOptimizer(lr)
# 定義train
train = opt.minimize(loss)

for i in range(100):
    sess.run(train)

train指向的是tf.Graph中關於訓練的節點，其中opt.minimize(loss)相當不直觀，它相當於

# Compute the gradients for a list of variables.
grads_and_vars = opt.compute_gradients(loss, <list of variables>)

 
# grads_and_vars is a list of tuples (gradient, variable).  

# Ask the optimizer to apply the gradients.
opt.apply_gradients(grads_and_vars)

即建立了求梯度的節點和optimizer根據梯度對變量進行修改的節點

因此，可以通過下述方法對梯度進行修改

grads_and_vars = opt.compute_gradients(loss, <list of variables>)
capped_grads_and_vars = [(MyCapper(grad), var) for 
 grad, var in grads_and_vars]
opt.apply_gradients(capped_grads_and_vars)

舉兩個例子

# tf.clip_by_value(
#     t,
#     clip_value_min,
#     clip_value_max,
#     name=None
# )

grads_and_vars = opt.compute_gradients(loss)
capped_grads_and_vars = [(tf.clip_by_value(grad, -1., 1.), var) for grad, var in 
 grads_and_vars]
opt.apply_gradients(capped_grads_and_vars)

# tf.clip_by_global_norm(
#     t_list,
#     clip_norm,
#     use_norm=None,
#     name=None
# )
# Returns:
#     list_clipped: A list of Tensors of the same type as list_t.
#     global_norm: A 0-D (scalar) Tensor representing the global norm.

opt = tf.train.AdamOptimizer(lr)
grads, vars = zip(*opt.compute_gradients(loss))
grads, _ = tf.clip_by_global_norm(grads, 5.0)
train = opt.apply_gradients(zip(grads, vars))

tensorflow Optimizer.minimize()和gradient clipping

mini 節點通過修改 glob radi per represent rain 在tensorflow中通常使用下述方法對模型進行訓練 # 定義Optimizer opt = tf.train.AdamOptimizer(lr) # 定義train train =

第二十一節，使用TensorFlow實現LSTM和GRU網絡

進行初始引入 turn lean tuple inf deep can 本節主要介紹在TensorFlow中實現LSTM以及GRU網絡。關於LSTM的詳細內容推薦閱讀以下博客： LSTM模型與前向反向傳播算法深度學習筆記(五)：LSTM tensorflow筆記：

tensorflow在訓練和驗證時監視不同的summary的操作

write scalar all glob sca val rain 不同 valid 如果想在訓練和驗證時監視不同的summary，將train summary ops和val summary ops放進不同的集合中即可。 train_writer = tf.summar

tensorflow saver 儲存和恢復指定 tensor

在實踐中經常會遇到這樣的情況： 1，用簡單的模型預訓練引數 2，把預訓練的引數匯入複雜的模型後訓練複雜的模型這時就產生一個問題： &nb

Tensorflow之tfdbg和tfprof

Tfdbg TensorFlow debugger (tfdbg) is a specialized debugger for TensorFlow. To add support for tfdbg. from tensorflow.python impor

TensorFlow的variable_scope和name_scope詳細介紹

TensorFlow中有兩個作用域(scope)，分別是name_scope和variable_scope。variable_scope主要是給variable_name(變數名)增加字首，還可以給op_name(運算名稱)增加字首，而name_scope是，op_name(運算名稱)增加字首。

tensorflow中 session() 和 graph的關係

自己的理解一般我們都是先建立graph ,然後在建立一個 session,將圖載入進去最近自己在學習tensorflow過程中,發現我們將圖載入到會話裡面後,可以繼續基於載入的圖繼續構造圖例子 import tensorflow as tf import numpy as

pytorch系列 --3 Variable，Tensor 和 Gradient

Variable & Automatic Gradient Calculation Tensor vs Variable graph and gradient 注意，在pytorch0.4中，tensor和pytorch合併了。 https://pytorch.

手把手教你如何基於Anaconda安裝Tensorflow（Windows和Linux兩種版本）

現在越來越多的人工智慧和機器學習以及深度學習，強化學習出現了，然後自己也對這個產生了點興趣，特別的進行了一點點學習，就通過這篇文章來簡單介紹一下，關

tensorflow的placeholder和Variable函式

placeholder及用法： placeholder，中文意思是佔位符，在tensorflow中類似於函式引數，執行時必須傳入值 Variable及用法：（變數）：建立，初始化，儲存和載入您可以通過構造類Variable的例項向圖中新增變數。 Va

Tensorflow C++ 編譯和呼叫圖模型

簡介最近在研究如何打通tensorflow線下 python 的指令碼訓練建模, 利用freeze_graph工具輸出.pb圖檔案，之後再線上生產環境用C++程式碼直接呼叫預先訓練好的模型完成預測的工作，而不需要用自己寫的Inference的函式。因為目

強烈推薦的TensorFlow、Pytorch和Keras的樣例資源（深度學習初學者必須收藏）

本文轉自微信公眾號：機器學習初學者原創：機器學習初學者機器學習初學者 TensorFlow、Keras和Pytorch是目前深度學習的主要框架，也是入門深度學習必須掌握的三大框架，但是官方文件相對內容較多，初學者往往無從下手。本人從github

tensorflow資料讀取和處理

檔案匹配 ["file0", "file1"]或[("file%d" % i) for i in range(2)] files = tf.train.match_filenames_once("C:/path/to/data.tfrecords-*") 讀取

tensorflow的CPU和GPU的區別

最近深度學習CPU根本不夠用，老闆配置了GPU 怎麼能不會用呢？原來從來沒有關注過的底層東西，於是乎痛下決心搞清楚原理和操作先來看看第一部分為什麼GPU比CPU更diao呢？這裡就需要從他麼的區別入手那他麼的區別是什麼呢？這裡就需要從他的原理出發了，由於其設計目標

理解TensorFlow的Graph和Session

當我們import tensorflow的時候，就已經建立了一個預設的圖了。 import tensorflow as tf print(tf.get_default_graph()) $ result: <tensorflow.python.framework.

tensorflow指定gpu和cpu

如果機器中有多塊GPU，tensorflow會預設吃掉所有能用的視訊記憶體，如果實驗室多人公用一臺伺服器，希望指定使用特定某塊GPU。可以在檔案開頭加入如下程式碼： import os os.environ["CUDA_DEVICE_ORDER"] = "PCI_BU

tensorflow——openpose程式碼和原理分析

做openpose已經做了兩個月了，精度和速度都還沒有提上去，但是還是要總結一下。人體姿態估計（pose estimation）的目標實時地對圖片中每個人的姿態進行精準的估計。總結起來，就是實時的多人姿態精準估計現狀

【121】Tensorflow合成特徵和擷取離群值

開發環境 python 版本用的是2 資料來源沒有積分的讀者請給我留言，我給你單獨發。全部程式碼所有的程式碼都在下面，你可以把這些程式碼複製貼上到一個編輯器裡，然後執行程式碼。 import tensorflow as tf

tensorflow儲存模型和恢復模型

儲存模型 w1 = tf.placeholder("float", name="w1") w2 = tf.placeholder("float", name="w2") b1= tf.Variable(2.0,name="bias") feed_dict ={w1:4,w2:8} w3 =

手把手教你如何安裝Tensorflow（Windows和Linux兩種版本）

現在越來越多的人工智慧和機器學習以及深度學習，強化學習出現了，然後自己也對這個產生了點興趣，特別的進行了一點點學習，就通過這篇文章來簡單介紹一下，關於如何搭建Tensorflow以及如何進行使用。建議的話，還是要學習了一點Python基礎知識和Linux知識是最好的

tensorflow Optimizer.minimize()和gradient clipping

相關推薦