EfficientNetV2 - 通過NAS、Scaling和Fused-MBConv獲得更小的模型和更快的訓練

阿新 • • 發佈：2022-02-16

EfficientNetV2是由 Google Research，Brain Team釋出在2021 ICML的一篇論文，它結合使用NAS和縮放，優化訓練速度和引數效率。並且模型中使用新操作（如 Fused-MBConv）在搜尋空間中進行搜尋。EfficientNetV2 模型比EfficientNetV1的訓練速度快得多，同時體積小 6.8 倍。

論文大綱如下：

理解和提高 EfficientNetV1 的訓練效率
NAS 和縮放
Progressive Learning
SOTA 比較
消融研究

理解和提高 EfficientNetV1 的訓練效率

1、使用非常大的影象尺寸進行訓練很慢

EfficientNet 的大影象尺寸會導致大量記憶體使用。由於 GPU/TPU 上的總記憶體是固定的，因此使用較小的批大小，這會大大減慢訓練速度。

FixRes （論文FixRes: Fixing the Train-Test Resolution Discrepancy）可用於通過使用更小的影象尺寸進行訓練而不是推理。較小的影象尺寸會導致較少的計算量並支援較大的批量大小，從而將訓練速度提高多達 2.2 倍，並且準確度還會有所提高。

2、Depth-wise卷積在模型的早期層執行緩慢但在後期層是有效的

Fused-MBConv 在谷歌 AI 部落格中提出， Fused-MBConv 將 MBConv 中的 depthwise conv3×3 和擴充套件 conv1×1 替換為單個常規 conv3×3。

MBConv 和 Fused-MBConv 的結構

Fused-MBConv 逐漸將 EfficientNet-B4 中的原始 MBConv 替換為 Fused-MBConv。

在早期階段 1-3 中應用時，Fused-MBConv 可以提高訓練速度，而引數和 FLOP 的開銷很小。

但是如果所有塊都使用 Fused-MBConv（階段 1-7），那麼它會顯著增加引數和 FLOP，同時也會減慢訓練速度。

3、在每個階段同樣擴大規模並不是最優的

EfficientNet 使用簡單的複合縮放規則平等地擴充套件所有階段。例如，當深度係數為 2 時，網路中的所有階段都會使層數翻倍。但是實際上這些階段對訓練速度和引數效率的貢獻並不相同。在EfficientNetV2中，使用非均勻縮放策略逐漸向模型的後期新增更多層。EfficientNets 積極擴大影象大小，導致大量記憶體消耗和緩慢訓練。為了解決這個問題，EfficientNetV2對縮放規則稍作修改，最大影象尺寸被限制為較小的值。

https://www.overfit.cn/post/053825be64b64acfa9cbd527a4a1cab7

EfficientNetV2 - 通過NAS、Scaling和Fused-MBConv獲得更小的模型和更快的訓練

理解和提高 EfficientNetV1 的訓練效率

EfficientNetV2 - 通過NAS、Scaling和Fused-MBConv獲得更小的模型和更快的訓練

英偉達：通過 BIOS、驅動和硬體握手確保 RTX 3060 挖礦效率減半 - IT之家

Java記憶體模型和volatile、synchronized

sql server使用公用表表達式CTE通過遞迴方式編寫通用函式自動生成連續數字和日期

Java通過What、Why、How瞭解弱引用

3、init_sequence_f[]中驅動模型和外設相關初始化

使用Graphics合成帶二維碼和頭像的分享圖(小程式分享、App分享)

1、Entity Framework Core 3.1入門教程-概述和準備工作

多執行緒基礎(建立、常用方法以及執行緒的生命週期和風險)

JS案例：質數判斷、質因數分解、兩個正整數的最大公因數和最小公倍數

百度地圖設定衛星、向量模式，球模型和瓦片模型載入

MySQL語法、UNION 一條資料拆分成多條和查詢結果中增加一個自定義欄位

聯想拯救者、小新和 YOGA 新品明日開售，新款 Y7000P 5799 元起

『言善信』Fiddler工具 — 6、Fiddler介面佈局詳解【命令列和狀態列】

021.PGSQL-調優3-審視和修改表定義：儲存模型、分佈方式、分佈列、分割槽表、資料型別

微軟開源工具包NNI：自動特徵工程、NAS、超參調優、模型壓縮

Java中的抽象、介面、Final修飾類與C++中抽象類和介面區別的概念解析

《地鐵：逃離》XSX、PS5和PC對比主機幀數穩PC載入快

通過小程式和微信社群來構建產品運營體系

美國鼓勵電動汽車但充電網路建設遠落後於中國：特斯拉收跌、小鵬和理想走漲

EfficientNetV2 - 通過NAS、Scaling和Fused-MBConv獲得更小的模型和更快的訓練

理解和提高 EfficientNetV1 的訓練效率

相關推薦