Tensorflow之梯度裁剪的實現示例

阿新 • • 發佈：2020-03-09

tensorflow中的梯度計算和更新

為了解決深度學習中常見的梯度消失（gradient explosion）和梯度爆炸（gradients vanishing）問題，tensorflow中所有的優化器tf.train.xxxOptimizer都有兩個方法：

compute_gradients
apply_gradients

compute_gradients

對於compute_gradients方法，計算var_list中引數的梯度，使得loss變小。預設情況下，var_list為GraphKeys.TRAINABLE_VARIABLES中的所有引數。

compute_gradients方法返回由多個（gradients， variable）二元組組成的列表。

compute_gradients(
  loss,var_list=None,gate_gradients=GATE_OP,aggregation_method=None,colocate_gradients_with_ops=False,grad_loss=None
)

apply_gradients

對於apply_gradients方法，根據compute_gradients的返回結果對引數進行更新

apply_gradients(
  grads_and_vars,global_step=None,name=None
)

梯度裁剪(Gradient Clipping)

tensorflow中裁剪梯度的幾種方式

方法一tf.clip_by_value

def clip_by_value(t,clip_value_min,clip_value_max,name=None):

其中，t為一個張量，clip_by_value返回一個與t的type相同、shape相同的張量，但是新tensor中的值被裁剪到了clip_value_min和clip_value_max之間。

方法二:tf.clip_by_global_norm

def clip_by_global_norm(t_list,clip_norm,use_norm=None,name=None):

其中，t_list為A tuple or list of mixed Tensors,IndexedSlices,or None。clip_norm為clipping ratio，use_norm指定global_norm，如果use_norm為None，則按global_norm = sqrt(sum([l2norm(t)**2 for t in t_list]))計算global_norm。

最終，梯度的裁剪方式為

Tensorflow之梯度裁剪的實現示例

可知，如果clip_norm > global_norm,則不對梯度進行裁剪，否則對梯度進行縮放。

  scale = clip_norm * math_ops.minimum(
    1.0 / use_norm,constant_op.constant(1.0,dtype=use_norm.dtype) / clip_norm)

方法的返回值為裁剪後的梯度列表list_clipped和global_norm

示例程式碼

optimizer = tf.train.AdamOptimizer(learning_rate)
gradients,v = zip(*optimizer.compute_gradients(loss))
gradients,_ = tf.clip_by_global_norm(gradients,grad_clip)
updates = optimizer.apply_gradients(zip(gradients,v),global_step=global_step)

方法三tf.clip_by_average_norm

def clip_by_average_norm(t,name=None):

t為張量，clip_norm為maximum clipping value

裁剪方式如下，

Tensorflow之梯度裁剪的實現示例

其中，avg_norm=l2norm_avg(t)

方法四:tf.clip_by_norm

def clip_by_norm(t,axes=None,name=None):

t為張量，clip_norm為maximum clipping value

裁剪方式為

Tensorflow之梯度裁剪的實現示例

示例程式碼

optimizer = tf.train.AdamOptimizer(learning_rate,beta1=0.5)
grads = optimizer.compute_gradients(cost)
for i,(g,v) in enumerate(grads):
  if g is not None:
    grads[i] = (tf.clip_by_norm(g,5),v) # clip gradients
train_op = optimizer.apply_gradients(grads)

注意到，clip_by_value、clib_by-avg_norm和clip_by_norm都是針對於單個張量的，而clip_by_global_norm可用於多個張量組成的列表。

到此這篇關於Tensorflow之梯度裁剪的實現示例的文章就介紹到這了,更多相關Tensorflow 梯度裁剪內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們！

Tensorflow之梯度裁剪的實現示例

tensorflow中的梯度計算和更新為了解決深度學習中常見的梯度消失（gradient explosion）和梯度爆炸（gradients vanishing）問題，tensorflow中所有的優化器tf.train.xxxOptimizer都有兩個方法：

Tensorflow的梯度非同步更新示例

背景：先說一下應用吧，一般我們進行網路訓練時，都有一個batchsize設定，也就是一個batch一個batch的更新梯度，能有這個batch的前提是這個batch中所有的圖片的大小一致，這樣才能組成一個placeholder。那麼若一個網

Tensorflow之MNIST CNN實現並儲存、載入模型

本文例項為大家分享了Tensorflow之MNIST CNN實現並儲存、載入模型的具體程式碼，供大家參考，具體內容如下

Spring實戰之使用TransactionProxyFactoryBean實現宣告式事務操作示例

本文例項講述了Spring實戰之使用TransactionProxyFactoryBean實現宣告式事務操作。分享給大家供大家參考，具體如下：

Spring實戰之使用註解實現宣告式事務操作示例

本文例項講述了Spring實戰之使用註解實現宣告式事務操作。分享給大家供大家參考，具體如下：

使用TensorFlow對影象進行隨機旋轉的實現示例

在使用深度學習對影象進行訓練時，對影象進行隨機旋轉有助於提升模型泛化能力。然而之前在做旋轉等預處理工作時，都是先對影象進行旋轉後儲存到本地，然後再輸入模型進行訓練，這樣的過程會增加工作量，如果圖片數量

Android Q之氣泡彈窗的實現示例

在Android Q中，使用者可以藉助氣泡，輕鬆地在裝置上任何位置進行多工處理。氣泡內置於“通知”系統中，它會浮動在其他應用的上層，並會跟隨使用者的移動而移動到螢幕的任何位置，用於取代SYSTEM_ALERT_WINDOW。氣泡

Java排序演算法三之歸併排序的遞迴與非遞迴的實現示例解析

歸併有遞迴和非遞迴兩種。歸併的思想是： 1.將原陣列首先進行兩個元素為一組的排序，然後合併為四個一組，八個一組，直至合併整個陣列；

.NetCore之介面快取的實現示例

1、問題：我們平時做開發的時候肯定都有用到快取這個功能，一般寫法是在需要的業務程式碼裡讀取快取、判斷是否存在、不存在則讀取資料庫再設定快取這樣一個步驟。但是如果我們有很多地方業務都有用到快取，我們就需要

python實現影象隨機裁剪的示例程式碼

實驗條件：從1張影象隨機裁剪100張影象裁剪出影象的大小為 60 x 60 IoU 大於等於 th=0.6 的裁剪框用紅色標出，其它裁剪框用藍色標出

python之隨機數函式的實現示例

前言這是俺寫的第一篇關於python的部落格，分享一下我所整合的python中的隨機數函式，就當作是自己的一個筆記，也可以供像我一樣的python入門新手小白參考學習。希望可以記錄下自己的學習過程。

Python之京東商品秒殺的實現示例

1 環境作業系統：Windows 10 Python版本：3.9.0 Google Chrome87.0.4280.88 ChromeDriver87.0.4280.88

Vue之全域性水印的實現示例

目錄1.建立水印檔案2.引入操作2.1 在App.中引用或其他頁面2.2 在router配置檔案中引用【需求】系統內頁面顯示水印，登入頁面沒有水印（退出登入時，登入頁面不會顯示水印）

4. 彤哥說netty系列之Java NIO實現群聊（自己跟自己聊上癮了）

你好，我是彤哥，本篇是netty系列的第四篇。歡迎來我的公從號彤哥讀原始碼系統地學習原始碼&架構的知識。

Java面試題之HashSet的實現原理

HashSet 的實現原理？首先，我們需要知道它是Set的一個實現，所以保證了當中沒有重複的元素。

Java的帶GUI介面猜數字遊戲的實現示例

先導包 import java.util.*; import javax.swing.*; 再寫主方法 public static void main(String[] args) {

Spring實戰之Qualifier註解用法示例

本文例項講述了Spring實戰之Qualifier註解用法。分享給大家供大家參考，具體如下：

Android之自定義實現BaseAdapter（通用介面卡三）

在上一篇中，我們說過，在setData中如果有很多控制元件的話，我們還是要在該方法中寫入很多程式碼，為了降低開發的方便性，本次就在此基礎上再一次優化。實現原理是這樣的，每次在setData中都要查詢控制元件，然後se

Java Swing JTextArea文字區域的實現示例

1. 概述官方JavaDocsApi: javax.swing.JTextArea JTextArea，文字區域。JTextArea 用來編輯多行的文字。JTextArea 除了允許多行編輯外，其他基本用法和 JTextField 基本一致。

Java Swing JPasswordField密碼框的實現示例

1. 概述官方JavaDocsApi: javax.swing.JPasswordField JPasswordField，密碼框。JPasswordField 繼承自 JTextField，只是顯示輸入的內容時用特定的字元替換顯示（例如 * 或 ●），用法和 JTextField 基本一致。

Tensorflow之梯度裁剪的實現示例

相關推薦