Pytorch之finetune使用詳解

阿新 • • 發佈：2020-01-19

finetune分為全域性finetune和區域性finetune。首先介紹一下區域性finetune步驟：

1.固定引數

  for name,child in model.named_children():
    for param in child.parameters():
      param.requires_grad = False

後，只傳入需要反傳的引數，否則會報錯

filter(lambda param: param.requires_grad,model.parameters())

2.調低學習率，加快衰減

finetune是在預訓練模型上進行微調，學習速率不能太大。

目前不清楚：學習速率降低的幅度可以更快一些。這樣以來，在使用step的策略時，stepsize可以更小一些。

直接從原始資料訓練的base_lr一般為0.01，微調要比0.01小,置為0.001

要比直接訓練的小一些，直接訓練的stepsize為100000，finetune的stepsize: 50000

3. 固定bn或取消dropout：

batchnorm會影響訓練的效果，隨著每個batch，追蹤樣本的均值和方差。對於固定的網路，bn應該使用全域性的數值

def freeze_bn(self):
  for layer in self.modules():
    if isinstance(layer,nn.BatchNorm2d):
      layer.eval()

訓練時，model.train()會修改模式，freeze_zn()應該在這裡後面

4.過濾引數

訓練時，對於優化器，應該只傳入需要改變的引數，否則會報錯

filter(lambda p: p.requires_grad,model.parameters())

以上這篇Pytorch之finetune使用詳解就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

Pytorch之finetune使用詳解

finetune分為全域性finetune和區域性finetune。首先介紹一下區域性finetune步驟： 1.固定引數

Tomcat原理系列之六:詳解socket如何封裝成request(上)

@TOC 看原始碼雖然不能馬上提升你的編碼水平。但能讓你更好的理解程式設計。

Tomcat原理系列之七:詳解socket如何封裝成request(下)

@TOC 推薦閱讀Tomcat原理系列之二：由點到線,請求主幹對於理解本文有很多幫助。

Java之BigDecimal詳解

一、BigDecimal概述 Java在java.math包中提供的API類BigDecimal，用來對超過16位有效位的數進行精確的運算。雙精度浮點型變數double可以處理16位有效數，但在實際應用中，可能需要對更大或者更小的數進行運算和處

玩轉Redis搭建叢集之Sentinel詳解

前言 Redis作為記憶體資料庫，需要具備高可用的特點，不然如果伺服器宕機，還在記憶體裡的資料就會丟失。我們最常用的高可用方法就是搭建叢集，master機器掛了，可以讓slave機器頂上，繼續提供服務。但是Redis叢集是

Python資料儲存之 h5py詳解

1、Python資料儲存（壓縮）（1）numpy.save,numpy.savez,scipy.io.savemat numpy和scipy內建的資料儲存方式。

pytorch方法測試詳解——歸一化(BatchNorm2d)

測試程式碼： import torch import torch.nn as nn m = nn.BatchNorm2d(2,affine=True) #權重w和偏重將被使用

C++11 併發指南之Lock 詳解

在《 C++11 併發指南三(std::mutex 詳解) 》一文中我們主要介紹了 C++11 標準中的互斥量(Mutex)，並簡單介紹了一下兩種鎖型別。本節將詳細介紹一下 C++11 標準的鎖型別。

Go語言學習之goroutine詳解

什麼是goroutine？ Goroutine是建立線上程之上的輕量級的抽象。它允許我們以非常低的代價在同一個地址空間中並行地執行多個函式或者方法。相比於執行緒，它的建立和銷燬的代價要小很多，並且它的排程是獨立於執行緒的

Python任務排程利器之APScheduler詳解

任務排程應用場景所謂的任務排程是指安排任務的執行計劃，即何時執行，怎麼執行等。在現實專案中經常出現它們的身影；特別是資料類專案，比如實時統計每5分鐘網站的訪問量，就需要每5分鐘定時從日誌資料分析訪問量

Go語言庫系列之dotsql詳解

導讀：能單獨拎出SQL檔案的某一行或幾行執行，是不是非常有趣？今天我們來介紹一下這個有意思的庫--dotsql。

python資料分析工具之 matplotlib詳解

不論是資料探勘還是數學建模，都免不了資料視覺化的問題。對於 Python 來說，matplotlib 是最著名的繪相簿，它主要用於二維繪圖，當然也可以進行簡單的三維繪圖。它不但提供了一整套和 Matlab 相似但更為豐富的命令，

win10從零安裝配置pytorch全過程圖文詳解

1.安裝anaconda （anaconda內建python在內的許多package，所以不用另外下載python）可以點選下面的清華開源軟體映象站，在官網下載anaconda不如在這下的快

JDK13的新特性之AppCDS詳解

簡介 AppCDS的全稱是Application Class-Data Sharing。主要是用來在不同的JVM中共享Class-Data資訊，從而提升應用程式的啟動速度。

JDK12的新特性之CompactNumberFormat詳解

簡介 JDK12引入了新的格式化數字的類叫做CompactNumberFormat。主要方便我們對很長的數字進行簡寫。比如1000可以簡寫為1K或者1 thousand。

vue元件系列之TagsInput詳解

簡介 TagsInput 是一種可編輯的輸入框，通過回車或者分號來分割每個標籤，用回退鍵刪除上一個標籤。用 vue 來實現還是比較簡單的。

C++11智慧指標之weak_ptr詳解

如題，我們今天要講的是 C++11 引入的三種智慧指標中的：weak_ptr。在學習 weak_ptr 之前最好對 shared_ptr 有所瞭解。如果你還不知道 shared_ptr 是何物，可以看看另一篇文章：

Vue初始化中的選項合併之initInternalComponent詳解

今天給大家分享Vue初始化中的選項合併之initInternalComponent的相關知識，具體程式碼如下所示：

Java多執行緒之volatile詳解

本文目錄從多執行緒交替列印A和B開始 Java 記憶體模型中的可見性、原子性和有序性

Quartz.Net系列（九）：Trigger之DailyTimeIntervalScheduleBuilder詳解

1.介紹中文意義就是每日時間間隔計劃生成 2.API講解 (1)WithInterval、WithIntervalInHours、WithIntervalInMinutes、WithIntervalInSeconds

Pytorch之finetune使用詳解

相關推薦