基於梯度爆炸的解決方法:clip gradient

阿新 • • 發佈：2020-02-05

1. 梯度爆炸的影響

在一個只有一個隱藏節點的網路中，損失函式和權值w偏置b構成error surface，其中有一堵牆，如下所示

損失函式每次迭代都是每次一小步，但是當遇到這堵牆時，在牆上的某點計算梯度，梯度會瞬間增大，指向某處不理想的位置。如果我們使用縮放，可以把誤導控制在可接受範圍內，如虛線箭頭所示

2. 解決梯度爆炸問題的方法

通常會使用一種叫”clip gradients “的方法. 它能有效地權重控制在一定範圍之內.

演算法步驟如下。

首先設定一個梯度閾值：clip_gradient

在後向傳播中求出各引數的梯度，這裡我們不直接使用梯度進去引數更新，我們求這些梯度的l2範數

然後比較梯度的l2範數||g||與clip_gradient的大小

如果前者大，求縮放因子clip_gradient/||g||,　由縮放因子可以看出梯度越大，則縮放因子越小，這樣便很好地控制了梯度的範圍

最後將梯度乘上縮放因子便得到最後所需的梯度

基於梯度爆炸的解決方法:clip gradient

3. 有無clip_gradient在GRU模型中的結果比較

無clip_gradient

可以很清楚地發現在2000次迭代出發生了梯度爆炸，最終影響了訓練的效果。　

基於梯度爆炸的解決方法:clip gradient

有clip_gradient

可以發現clip_gradient在前期有效了控制了梯度爆炸的影響，使得最終的loss能下降到滿意的結果

基於梯度爆炸的解決方法:clip gradient

以上這篇基於梯度爆炸的解決方法:clip gradient就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

基於梯度爆炸的解決方法:clip gradient

1. 梯度爆炸的影響在一個只有一個隱藏節點的網路中，損失函式和權值w偏置b構成error surface，其中有一堵牆，如下所示

基於jupyter程式碼無法在pycharm中執行的解決方法

存在問題： jupyter程式碼無法在pycharm中執行原因：工作檔案和安裝檔案不統一引起的

基於WSL2 的 Docker Desktop 啟動時 Failed to set version to docker-desktop: exit code: -1的解決方法

技術標籤：dockerdocker 在Windows 10 的 2004 版本中，啟用使用Docker Desktop 時發現根本無法啟動，偶爾或者頻繁的出錯:

1篇文章搞清楚8種JVM記憶體溢位（OOM）的原因和解決方法

前言擼Java的同學，多多少少會碰到記憶體溢位（OOM）的場景，但造成OOM的原因卻是多種多樣。

Unity登入註冊時限制傳送驗證碼次數功能的解決方法

當我們需要在Unity客戶端做一個限制功能，比如按鈕（最好是傳送驗證碼按鈕）要求每天只能點選三次，等到第二天又有三次機會，這個過程不涉及到服務端訊息，只涉及到本地儲存，以下是我的解決方案：

android點選無效驗證的解決方法

背景在寫一個東西滑動刪除列表的時候，出現了一個問題。我的需求是，左滑然後出現delete，然後點選delete，讓該滑塊消失。

SpringCloud Feign引數問題及解決方法

這篇文章主要介紹了SpringCloud Feign引數問題及解決方法,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

IDEA JavaWeb專案啟動執行後出現404錯誤的解決方法

404這個錯誤真的是一言難盡！不過大多是配置檔案出錯，認真修改還是可以的

執行vbs指令碼報錯無效字元、中文亂碼的解決方法(編碼問題)

程式碼沒有問題，總是報這樣的錯誤。測試程式碼 msgbox \"我們\" 很簡單的程式碼，但如果編碼不對問題就很多

IDEA 啟動 Tomcat 專案輸出亂碼的解決方法

剛開始碰到的時候沒除錯成功又放下了,老系統放在 MyEclipse 下面跑,這兩天 MyEclipse 和 Tomcat 老出問題,藉著這個機會又試了試,成功了.

springboot整合mybatis-plus遇到的問題及解決方法

在使用spring boot整合mybatis-plus的過程中遇到的問題如圖, 首先我放xml的包的是沒問題的，而是引入的架包和配置問題，問題配置如下

spring boot jpa寫原生sql報Cannot resolve table錯誤解決方法

錯誤如圖開啟View→Tool Windows→Persistence選項在彈出的Persistence視窗的專案上右鍵,選擇Generate Persistence Mapping→By Database Schema

Java執行緒死鎖例項及解決方法

這篇文章主要介紹了Java執行緒死鎖例項及解決方法,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

SpringBoot沒有主清單屬性的解決方法

解決 SpringBoot 沒有主清單屬性問題：SpringBoot打包成jar後執行提示沒有主清單屬性

mysql/Java服務端對emoji的支援與問題解決方法詳解

本文例項講述了mysql Java服務端對emoji的支援與問題解決方法。分享給大家供大家參考，具體如下：

SpringMVC日期型別接收空值異常問題解決方法

最近遇到SpringMVC寫個controller類，傳一個空串的字元型別過來，正常情況是會自動轉成date型別的，因為資料表對應類型別就是date的

idea2019版與maven3.6.2版本不相容的解決方法

昨天遇到了點問題解決浪費了一些時間(導致更新內容較少)回顧下問題專案出現Unable to import maven project: See logs for details

使用 SQL 伺服器時,"評估期已過期"錯誤訊息(解決方法)

當開啟sql server2008企業管理器的時候，出現報錯“評估期已過。有關如何升級的測試版軟體的資訊.....”

mysql滑動訂單問題原理與解決方法例項分析

本文例項講述了mysql滑動訂單問題原理與解決方法。分享給大家供大家參考，具體如下：

mysql資料庫中1045錯誤的解決方法

本地資料庫連線伺服器資料庫報1045，如何解決？這個意思是說：使用者“root”@本地主機的訪問被拒絕

基於梯度爆炸的解決方法:clip gradient

相關推薦