神經網路訓練與預測時結果不一致的一種原因

阿新 • • 發佈：2021-01-30

為了防止過擬合，我設定了提前終止early stop。發現預測時的train accuracy與訓練時打印出的max train accuracy並不一致。經斷點除錯，發現是early stop程式碼段的問題

 if test_accuracy > self.max_test_acc and train_accuracy > self.max_train_acc - 0.04:
     self.max_test_acc = test_accuracy
     self.max_acc_epoch = epoch
     self. 
train_sync_acc = train_accuracy
     if train_accuracy > self.max_train_acc:
         self.max_train_acc = train_accuracy
     self.best_net = self.net.state_dict()  # 這裡有問題
     print('*' * 50)
     print('epoch', epoch + 1, 'current loss', loss.cpu().data, 'train acc:', train_accuracy,
           'current max test acc:' 
, self.max_test_acc)
     print('*' * 50)
 if epoch > self.max_acc_epoch + early_stop:
     break

問題就出在標記處，我本來是想每獲得一個最大的test accuracy就儲存當前net。但是這步賦值後，self.best_net與self.net.state_dict()地址完全一致，兩者同時變化，因而這步賦值就沒有任何意義了。
修改方法：使用深拷貝

from copy import deepcopy

...
	self.best_net = deepcopy(self.net.state_dict( 
))
...

改過了之後就正常了~
（用的是PyTorch框架）

神經網路訓練與預測時結果不一致的一種原因

技術標籤：PyTorch神經網路機器學習深度學習為了防止過擬合，我設定了提前終止early stop。發現預測時的train accuracy與訓練時打印出的max train accuracy並不一致。經斷點除錯，發現是early stop程式碼段的問

分享一個shell指令碼的坑：grep匹配+wc取值在指令碼執行後的結果與手動執行結果不一致

技術標籤：Linux 文章目錄場景問題復現手動執行指令碼執行分析原因解決方案

為啥青蛙上樓問題數學法與動態規劃法結果不一致問題

技術標籤：pythonleetcode 為啥青蛙上樓問題數學法與動態規劃法結果不一致問題

神經網路訓練中，錯誤資料集對模型結果的影響有多大丨曼孚科技

人工智慧本質上是一門研究如何用機器代替人類的學科，工程師們嘗試用各種演算法模型來賦予機器像人類一樣的思考與聯想能力。

Python實現Keras搭建神經網路訓練分類模型教程

我就廢話不多說了，大家還是直接看程式碼吧~ 註釋講解版： # Classifier example import numpy as np

用PyTorch對Leela Zero進行神經網路訓練

作者|Peter Yu 編譯|Flin 來源|towardsdatascience 最近，我一直在尋找方法來加快我的研究和管理我的實驗，特別是圍繞著寫訓練管道和管理實驗配置檔案這兩個方面，我發現這兩個新專案叫做PyTorch Lightning和Hydra。

【tensorflow】自制神經網路訓練資料集

在實際應用中，我們常常需要自制資料集，解決本領域應用，而資料通常是圖片或文字，需要做格式轉換，才能在訓練時使用。

神經網路訓練中回撥函式的實用教程

作者|Andre Ye 編譯|VK 來源|Towards Data Science 回撥函式是神經網路訓練的重要組成部分

知識蒸餾：如何用一個神經網路訓練另一個神經網路

點選上方“AI公園”，關注公眾號，選擇加“星標“或“置頂” 作者：Tivadar Danka

pytorch卷積神經網路實現迴歸預測程式碼

pytorch卷積神經網路實現迴歸預測學習視訊：莫煩python # RNN for classification import torch

使用自己的資料集建立神經網路訓練模型

該內容來自---https://blog.csdn.net/weixin_43974748/article/details/89600269 使用Tensorflow建立自己的資料集，並訓練

卷積神經網路學習——第二部分：卷積神經網路訓練的基本流程

卷積神經網路學習——第二部分：卷積神經網路訓練的基本流程一、序言二、訓練流程1、資料集引入2、構建網路（1）四層卷積神經網路（2）兩層全連線層網路

Mybatis 當實體屬性與資料庫欄位不一致時的解決方案

Mybatis會根據相同的屬性和欄位名通過set方法進行注入，那如果實體類的屬性名和資料庫的欄位名不相同呢？

神經網路模型與誤差逆傳播演算法

目錄一、神經元模型1.1 M-P神經元1.2 激勵函式1.2.1 單位階躍函式1.2.2 logistic函式（sigmoid）1.2.3 tanh函式（雙曲正切函式）1.2.4 ReLU（修正線性單元）1.2.5 激勵函式對比1.3 羅森布拉特感知器1.4 Adaline（自適

卷積神經網路訓練

技術標籤：深度學習tensorflow機器學習神經網路輸入層（Input layer）：眾多神經元（Neuron）接受大量非線形輸入資訊。輸入的資訊稱為輸入向量。輸出層（Output layer）：資訊在神經元連結中傳輸、分析、權衡

神經網路訓練中如何一次跑多個數據集

技術標籤：小技巧python深度學習目錄一、作者介紹二、對於直接用引數指令修改讀取檔案路徑的程式碼三、對於在程式碼中修改檔案讀取路徑與指定權值檔案儲存路徑的程式1.找到讀取訓練資料的程式2.找到儲存權值

深度神經網路訓練的必知技巧

原地址：https://blog.csdn.net/u013709270/article/details/70949304 本文主要介紹8種實現細節的技巧或tricks：資料增廣、影象預處理、網路初始化、訓練過程中的技巧、啟用函式的選擇、不同正則化方法、來自於資料的

【預測模型】基於matlab BP神經網路混凝土強度預測【含Matlab原始碼 695期】

一、簡介 1 概述 BP（Back Propagation）神經網路是1986年由Rumelhart和McCelland為首的科研小組提出，參見他們發表在Nature上的論文 Learning representations by back-propagating errors 。

李巨集毅機器學習(六) 神經網路訓練技巧(2)

學習率調整策略，包含RMS、RMSProp、Adam、Learning Rate Scheduling 神經網路訓練技巧(2)

李巨集毅機器學習(六) 神經網路訓練技巧(3)

分類，batch normalization 神經網路訓練技巧(3) 分類可以將分類任務看作迴歸任務我們只需要將類別設定為數字，然後使用迴歸來擬合這個數字，從而達到分類的目的。

神經網路訓練與預測時結果不一致的一種原因

相關推薦