pytorch grad_fn以及權重梯度不更新的問題

阿新 • • 發佈：2018-12-29

前提：我訓練的是二分類網路，使用語言為pytorch

Varibale包含三個屬性：

data：儲存了Tensor，是本體的資料
grad：儲存了data的梯度，本事是個Variable而非Tensor，與data形狀一致
grad_fn：指向Function物件，用於反向傳播的梯度計算之用

在構建網路時，剛開始的錯誤為：沒有可以grad_fn屬性的變數。
百度後得知要對需要進行迭代更新的變數設定requires_grad=True ，操作如下：

train_pred = Variable(train_pred.float(), requires_grad= 
True)`

這樣設定之後網路是跑起來了，但是準確率一直沒有提升，很明顯可以看出網路什麼都沒學到。
我輸出 model.parameters() (網路內部的權重和偏置)檢視，發現它的權重並沒有更新，一直是同一個值，至此可以肯定網路什麼都沒學到，還是迭代那裡出了問題。
詢問同門後發現問題不在這裡。
計算loss時，target與train_pred的size不匹配，我以以下操作修改了train_pred，使兩者尺寸一致，才導致了上述問題。

        train_pred = model(data)
        train_pred = torch.max(train_pred, 
 1)[1].data.squeeze()
        train_pred = Variable(train_pred.float(), requires_grad=False)
        train_loss = F.binary_cross_entropy(validation_pred.float(), target)
        train_loss.backward()

對train_pred多次處理後，它已無法正確地反向傳播，實際上應該更改target，使其與train_pred size一致。

重點！！！要想loss正確反向傳播，應直接將model(data)傳入loss函式。

最終修改程式碼如下：

    for batch_idx, (data, target) in enumerate(train_loader):
        # Get Samples
        label = target.view(target.size(0), 1).long()
        target_onehot = torch.zeros(data.shape[0], args.num_classes).scatter_(1, label, 1)
        data, target_onehot = Variable(data.cuda()), Variable(target_onehot.cuda().float())
        
        model.zero_grad()

        # Predict
        train_pred = model(data)
        train_loss = F.binary_cross_entropy(train_pred, target_onehot)
        train_loss.backward()
        optimizer.step()

參考文獻：

[1]. pytorch入門教程
[2]. 『PyTorch』第三彈重置_Variable物件

pytorch grad_fn以及權重梯度不更新的問題

前提：我訓練的是二分類網路，使用語言為pytorch Varibale包含三個屬性： data：儲存了Tensor，是本體的資料 grad：儲存了data的梯度，本事是個Variable而非Tensor，與data形狀一致 grad_fn：指向Function物件

pytorch動態網路以及權重共享

pytorch 動態網路+權值共享 pytorch以動態圖著稱，下面以一個栗子來實現動態網路和權值共享技術: # -*- coding: utf-8 -*- import random import torch class DynamicNet(torch.

pytorch 卷積神經網路（alexnet）訓練中問題以及解決辦法（更新中）

上一篇部落格中使用的是pytorch中的預訓練模型效果較好。https://blog.csdn.net/pc1022/article/details/80440913這篇部落格是自己訓練卷積神經網路，最開始以簡單的alexnet進行訓練。對alexnet程式碼有三個版本的：

SEO百度快照不更新原因，以及解決辦法

百度對任何一個網站，都會有一個權重的分配，分出頁面的權重等級，並且它會根據這個權重的等級，給出快照時間。一般的網站都是首頁的權重最高，所以一般首頁的快照都會更新較快，甚至每日更新，而內頁的快照一般會停滯，等到百度更新的時候，內頁的快照才會有所更新。所以如果你網站的首頁在結構上並沒有得到核心的體現，都不如某些內

chrome瀏覽器更換favicon.ico後不更新緩存解決方案

avi get 什麽 favicon chrome 方案 lan chrome瀏覽器圖片 chrome瀏覽器更換favicon.ico後不更新緩存 1、按ctrl+F5強制刷新或網頁上右鍵重新載入。2、再不行就刪除緩存。3、但這樣太討厭了，還有個小竅門屢試不爽，那就是直接

全新的閃念膠囊，OneStep 1.5 以及 BigBang 2.0 更新後的 Smartisan OS 3.6 體驗

win .com googl 下午老羅 free 好的作者沒有本文標簽： OneStep1.5 BigBang2.0 SmartisanOS3.6 閃念膠囊隨著堅果手機的發布，Smartisan OS 也得到了例行更新。包括了全新的閃念膠囊，OneStep 1.5

tomcat 服務不支持 chkconfig 以及其他服務不能添加到開機啟動時的操作

支持 bin 服務啟動 tomcat chmod 報錯但是列表在安裝完tomcat後想添加的開機自啟動的操作，但是報錯tomcat 服務不支持 chkconfig，後來在 /etc/init.d/tomcat中的#!/bin/bash後添加上#chkconfig:

解決Hibernate4執行update操作,不更新數據的問題

current spa username tor color code soft etime 解決方法後臺封裝java對象，使用hibernate4再帶的update，執行不更新數據，不報錯。下面貼出解決方法：失敗的方法 hibernate自帶update代碼：（失效

Android Studio不更新到最新版使用Kotlin

java 窗口安裝完成 studio gradle 文件 idt image 更新第一步：安裝Kotlin插件打開Settings面板，找到Plugins選項，點擊Browse repositories(瀏覽倉庫)，輸入“Kotlin”查找，

react-native之遠程圖片修改後APP不更新

reactnative react-native react native 刷新圖片 base64今天在做客戶的項目時，有一個需求是App上要顯示遠端的圖片，而遠端的圖片有可能會更新，但圖片名不變。在react-native中，顯示圖片是用的自帶的Image組件，大家都知道react在更新組件之前都會判斷pr

svn 指定不更新目錄

進行 nbsp 需要 set 排除指定 run dep 打包　　打包時有些目錄不需要進行更新：使用 svn update --set-depth=exclude 進行路徑的排除 echo 更新Trunk_QA 排除Resoures下的Scenes等目錄 svn

Ajax 請求時後臺跳轉前端頁面不更新踩坑記錄

style 返回 url direct edi pos 通過繼續檢查踩坑環境：前端：Ajax post請求，json類型數據；後端 C#+MVC，前後端正常通信，但是當後臺驗證權限不通過時會RedirectToAction跳轉到登錄頁，結果現象是後臺正常執行登錄頁的渲

太深了，梯度傳不下去，於是有了highway。幹脆連highway的參數都不要，直接變殘差，於是有了ResNet。強行穩定參數的均值和方差，於是有了BatchNorm。RNN梯度不穩定，於是加幾個通路和門控，於是有了LSTM。 LSTM簡化一下，有了GRU。

梯度直接 ID orm rop 發展均值 nor 噪聲請簡述神經網絡的發展史sigmoid會飽和，造成梯度消失。於是有了ReLU。ReLU負半軸是死區，造成梯度變0。於是有了LeakyReLU，PReLU。強調梯度和權值分布的穩定性，由此有了ELU，以及較新的SELU

pytorch grad_fn以及權重梯度不更新的問題

前提：我訓練的是二分類網路，使用語言為pytorch

Varibale包含三個屬性：

重點！！！要想loss正確反向傳播，應直接將model(data)傳入loss函式。

參考文獻：

pytorch grad_fn以及權重梯度不更新的問題

pytorch動態網路以及權重共享

pytorch 卷積神經網路（alexnet）訓練中問題以及解決辦法（更新中）

SEO百度快照不更新原因，以及解決辦法

chrome瀏覽器更換favicon.ico後不更新緩存解決方案

全新的閃念膠囊，OneStep 1.5 以及 BigBang 2.0 更新後的 Smartisan OS 3.6 體驗

tomcat 服務不支持 chkconfig 以及其他服務不能添加到開機啟動時的操作

解決Hibernate4執行update操作,不更新數據的問題

Android Studio不更新到最新版使用Kotlin

react-native之遠程圖片修改後APP不更新

svn 指定不更新目錄

Ajax 請求時後臺跳轉前端頁面不更新踩坑記錄

太深了，梯度傳不下去，於是有了highway。幹脆連highway的參數都不要，直接變殘差，於是有了ResNet。強行穩定參數的均值和方差，於是有了BatchNorm。RNN梯度不穩定，於是加幾個通路和門控，於是有了LSTM。 LSTM簡化一下，有了GRU。

vue數組操作不更新視圖問題

離散數學：每條邊的權重均不相同的帶權圖有唯一最小生成樹

IE瀏覽器下AJAX緩存問題導致數據不更新的解決辦法

Vue 設置添加 JSON 視圖不更新

OSMDroid 切換地圖不更新的問題

複雜的react元件 setState不更新 - 使用函式作為setState的第一個引數

關於cordova打包vue寫的web-app時容易出現白屏以及部分BUG不能測出的問題

pytorch grad_fn以及權重梯度不更新的問題

前提：我訓練的是二分類網路，使用語言為pytorch

Varibale包含三個屬性：

重點！！！要想loss正確反向傳播，應直接將model(data)傳入loss函式。

參考文獻：

相關推薦