batchsize大小對訓練速度的影響

阿新 • • 發佈：2020-10-09

1.batchsize越大是不是訓練越快？

GPU :一塊2080Ti
平臺：pytorch cuda
圖片數量：2700

batchsize	一個圖片處理時間	GPU記憶體佔用	GPU算力使用	一個epoch 所用時間
1	0.117s	2.5G	20%	2700 * 0.0117 = 318s
5	0.516s	8G	90%	2700 * 0.516/5 = 279s

batchsize大了之後，佔用的資源多了，算力多了，但是速度沒有提升，這樣是不是太坑了。
我們其實可以把 batchsize設定小點，然後把剩餘的記憶體跑其他實驗，而且再在同一張卡上跑一個新的實驗，對之前的速度也沒有影響。

結論：
1.本人實驗 batchsize越大，訓練速度提升不大

2.bachsize小點，多跑幾個實驗真香

完成每個epoch運算的所需的全部時間主要卡在：

load資料的時間，
每個epoch的iter數量。
因此對於每個epoch，不管是純計算時間還是全部時間，大體上還是大batch能夠更節約時間一點，但隨著batch增大，iter次數減小，完成每個epoch的時間更取決於載入資料所需的時間，此時也不見得大batch能帶來多少的速度增益了。

2.batchsize大了，是不是結果會變好？

收集資料發現，確實是這樣的，但是也不能太大了

在這裡插入圖片描述

Batch_Size 太小，演算法在 200 epoches 內不收斂。
隨著 Batch_Size 增大，處理相同資料量的速度越快。

隨著 Batch_Size 增大，達到相同精度所需要的 epoch 數量越來越多。
由於上述兩種因素的矛盾， Batch_Size增大到某個時候，達到時間上的最優。
由於最終收斂精度會陷入不同的區域性極值，因此 Batch_Size增大到某些時候，達到最終收斂精度上的最優。

batchsize大小對訓練速度的影響

1.batchsize越大是不是訓練越快？ GPU :一塊2080Ti 平臺：pytorch cuda 圖片數量：2700

dotnet 讀 WPF 原始碼筆記使用 Win32 方法修改視窗的座標和大小對視窗依賴屬性的影響...

技術標籤：WPF原始碼c#WPFdotnetC#WPF 咱可以使用 Win32 的 SetWindowPos 修改視窗的座標和大小，此時 WPF 的視窗的 Left 和 Top 和 Width 和 Height 依賴屬性也會受到影響，本文將會告訴大家在啥時候會同步更改

【BSP視訊教程】STM32H7視訊教程第12期：NVIC中斷管理和優先順序動態分配，實戰分享減小開關中斷對實時性影響，提升系統響應速度(2022-04-07)

視訊教程彙總帖：https://www.armbbs.cn/forum.php?mod=viewthread&tid=110519 本期視訊教程為大家分享BSP驅動教程第12期

mysql索引對排序的影響例項分析

本文例項講述了mysql索引對排序的影響。分享給大家供大家參考，具體如下：

MySQL中NULL對索引的影響深入講解

前言看了很多部落格，也聽過很多人說，包括我們公司的DBA，說MySql中如果某一列中含有null，那麼包含該列的索引就無效了。

淺談C# StringBuilder記憶體碎片對效能的影響

StringBuilder內部是由多段char[]組成的半自動連結串列，因此頻繁從中間修改StringBuilder，會將原本連續的記憶體分隔為多段，從而影響讀取/遍歷效能。

未使用繫結變數對share_pool的影響

oracle SGA中包含資料高速緩衝，重做日誌緩衝，以及共享池（share_pool）。共享池中包含庫高速緩衝（所有的SQL，執行計劃等）和資料字典緩衝（物件的定義，許可權等）。

外媒測試記憶體對遊戲效能的影響：對 AMD 處理器影響較大

10月5日訊息外媒 HardwareTimes 昨日測試了 PC 記憶體對遊戲效能的影響。結果顯示，記憶體確實會影響遊戲效能，但規律非常玄學；記憶體對於 AMD 平臺影響較英特爾平臺更強（但並沒有公佈英特爾平臺測試結果）。

自動駕駛汽車對保險業的影響

自動駕駛汽車的迅速發展不僅會重新定義汽車和交通運輸業，而且還會顛覆保險業。

電流檢測時運放的偏置電流對精度的影響

首先上圖，這個圖是我在TI的電流檢測相關培訓上看到的。當檢測的電流量程較大時，需要採用較小的分流器10mR，那麼偏置電流的誤差也比較小的，只有0.2uV.

finally語句塊對返回的影響

Java中用於異常處理的語句方法為： try { //... } catch (Excaption e){ //... } finally { //... }

DB2優化之：delete和update對效能的影響

2019獨角獸企業重金招聘Python工程師標準>>> 刪除和更新操作對效能的影響

KVM虛擬化Disk Cache模式對效能的影響分析

緩衝模式 qemu-kvm磁碟讀寫的緩衝(cache)模式一共有五種，分別是writethrough, wirteback, none, unsafe, directsync，當你對VM讀寫磁碟的效能有不同的要求的時候，你可以在其啟動的引數(cache=xxxx)裡面進行一個合理

MySQL中NULL對索引的影響

看了很多部落格，也聽過很多人說，包括我們公司的DBA，說MySql中如果某一列中含有null，那麼包含該列的索引就無效了。

一行程式碼讓訓練速度提升2倍，飛槳自動混合精度技術詳解

此文轉載自：https://my.oschina.net/u/4067628/blog/4766467 大咖揭祕Java人都栽在了哪？點選免費領取《大廠面試清單》，攻克面試難關~>>>

用MySQL 執行計劃分析 DATE_FORMAT 函式對索引的影響

前言最近公司在程式碼評審時，在使用DATE_FORMAT函式的問題上有了點不同的觀點。具體DATE_FORMAT對索引會不會產生影響？哪種情況下會產生影響呢？週末無事，通過mysql的執行計劃測試一波。

MYSQ建立聯合索引，欄位的先後順序，對查詢的影響分析

MYSQ建立聯合索引，欄位的先後順序，對查詢的影響分析前言對於聯合索引我們知道，在使用的時候有一個最左字首的原則，除了這些呢，比如欄位放置的位置，會不會對索引的效率產生影響呢？

使用@tf.function加快訓練速度

TensorFlow 2 預設的即時執行模式（Eager Execution）為我們帶來了靈活及易除錯的特性，但為了追求更快的速度與更高的效能，我們依然希望使用 TensorFlow 1.X 中預設的圖執行模式（Graph Execution）。此時，TensorF

《騎馬與砍殺2》任務對人物特性影響一覽

《騎馬與砍殺2》玩家們能夠通過完成一些任務讓自己的性格發生一些變化，可能會有玩家還不清楚這些任務能夠為玩家們更改哪些屬性，下面請看玩家“賞賜的溫柔”分享的《騎馬與砍殺2》任務對人物特性影響一覽，希望能為

蘋果 CEO 庫克：不關心 ATT 應用追蹤透明化功能對 Facebook 的影響

4月3日訊息蘋果即將為 iOS 14.5 提供應用追蹤透明化功能（ATT），對 App 提供更加嚴格的限制措施，阻止應用獲取大量使用者資訊。據外媒 macrumors 報道，蘋果 CEO 庫克近日接受了採訪，表達了對於隱私政策的看法。

batchsize大小對訓練速度的影響

1.batchsize越大 是不是訓練越快？

2.batchsize大了，是不是結果會變好？

相關推薦

1.batchsize越大是不是訓練越快？