【Pytorch】Pytorch的net.train 和 net.eval的使用區別

阿新 • • 發佈：2020-12-21

技術標籤：Pytorch

在訓練Pytorch的時候，我們會

在訓練模型時會在前面加上：

model.train()

在測試模型時在前面使用：

model.eval()

同時發現，如果不寫這兩個程式也可以執行，這是因為這兩個方法是針對在網路訓練和測試時採用不同方式的情況，比如Batch Normalization 和 Dropout。

訓練時是正對每個min-batch的，但是在測試中往往是針對單張圖片，即不存在min-batch的概念。由於網路訓練完畢後引數都是固定的，因此每個批次的均值和方差都是不變的，因此直接結算所有batch的均值和方差。所有Batch Normalization

的訓練和測試時的操作不同
在訓練中，每個隱層的神經元先乘概率P，然後在進行啟用，在測試中，所有的神經元先進行啟用，然後每個隱層神經元的輸出乘P。

參考：

【Pytorch】Pytorch的net.train 和 net.eval的使用區別

技術標籤：Pytorch 在訓練Pytorch的時候，我們會在訓練模型時會在前面加上： model.train()

【JavaScript】window.load 和$(document).ready() 區別

【JavaScript】window.load 和$(document).ready() 區別【轉載】window.load 和$(document).ready() 區別

pytorch:model.train和model.eval用法及區別詳解

使用PyTorch進行訓練和測試時一定注意要把例項化的model指定train/eval，eval（）時，框架會自動把BN和DropOut固定住，不會取平均，而是用訓練好的值，不然的話，一旦test的batch_size過小，很容易就會被BN層導致生成

【Pytorch】pytorch中clamp()和clamp_()的區別[函式名有無下劃線]

技術標籤：PyTorch 在pytorch框架中，對於tensor的操作時候是inplace型別。 inplace型別是指，在一個tensor上操作了之後，是直接修改了這個tensor，還是返回一個新的tensor，也就是說舊的tensor修不修改的問題。

.net 知新：【4】NuGet簡介和使用

在包管理以前我們在專案中引用第三方包通常是去下載dll放到專案中再引用，後來逐漸發展成各種包管理工具，nuget就是一種工具，適用於任何現代開發平臺的基本工具可充當一種機制，通過這種機制，開發人員可以建立、共

pytorch 模型的train模式與eval模式例項

原因對於一些含有batch normalization或者是Dropout層的模型來說，訓練時的froward和驗證時的forward有計算上是不同的，因此在前向傳遞過程中需要指定模型是在訓練還是在驗證。

【JS】JavaScript語句和宣告之let,const

let 語句宣告一個「塊級作用域」的本地變數，且可選地將其初始化為一個值。

Vue【資料】計算屬性和偵聽器

筆記內容：學習編寫能夠讓模板產生響應式變化的資料。目錄：計算屬性偵聽器

【轉】混淆矩陣和ROC曲線

1.https://www.baidu.com/link?url=LvM7AdalbXSaDUmsELY0gPTErLvNbvAxlMpRJN0D3AX_xaIVv6sLI4M_3yVUx060NQQzYm-2d7t0s2bGEde1j1rgTr8OSpIikrTY8t42ZYe&wd=&eqid=9b791b9f00018c2d000000065f0295f8

【PyTorch】使用筆記

檢查使用的GPU的索引 torch.cuda.is_available() cuda是否可用； torch.cuda.device_count() 返回gpu數量；

【PyTorch】使用中注意事項

參考部落格： https://blog.csdn.net/u011276025/article/details/73826562/ 1. 把Label要轉成LongTensor格式

【interview】箭頭函式和普通函式的區別

一、箭頭函式是匿名函式的簡寫，不能作為建構函式，不能使用new 二、箭頭函式不能繫結arguments物件，arguments物件包含了函式執行時的所有引數，arguments只是像陣列，真正意義上並不是陣列，不可以使用陣列的方法

【Python】I/O和比賽的其他一些問題

I/O輸入輸出 #輸入一個字串分割並轉化成n個int數值 a, b= map(int, input().strip().split())

【JavaScript】標準內建函式 eval

以下內容為學習記錄，可以參考 MDN 原文。環境 node v12.18.1 npm 6.14.5 vscode 1.46 Microsoft Edge 83

【C++】類-派生和繼承

類-派生和繼承目錄類-派生和繼承1.基本概念2. 語法3. 繼承方式4. 型別轉換5. 派生類的構造、解構函式建構函式複製建構函式解構函式

【PyTorch】state_dict詳解

這篇部落格來自csdn，完全用於學習。 Introduce 在pytorch中，torch.nn.Module模組中的state_dict變數存放訓練過程中需要學習的權重和偏執係數，state_dict作為python的字典物件將每一層的引數對映成tensor張量，需要

【Oracle】手動安裝和解除安裝Oracle，這是最全的一篇了！！

寫在前面之前寫過一篇在CentOS 7/8上安裝Oracle的文章，按照我寫的文章安裝成功了，但是解除安裝Oracle時出現了問題。今天，我就整理一篇手動安裝和解除安裝Oracle的文章吧。全文為實戰型內容，全程乾貨。

【PyTorch】tensor.scatter

【PyTorch】scatter 引數： dim (int) – the axis along which to index index (LongTensor) – the indices of elements to scatter, can be either empty or the same size of src. When empty, the operation r

【轉載】基於timestamp和nonce的防重放攻擊

https://www.cnblogs.com/mymelody/p/7325325.html 　　以前總是通過timestamp來防止重放攻擊，但是這樣並不能保證每次請求都是一次性的。今天看到了一篇文章介紹的通過nonce（Number used once）來保證一次有效，

【IDEA】類註釋和方法註釋

類註釋和方法註釋 2020-09-0810:16:17 by沖沖 1.檔案註釋 ①設定 ②模板內容 /** * @ClassName ${NAME}

【Pytorch】Pytorch的net.train 和 net.eval的使用區別

參考：

相關推薦