在pytorch中動態調整優化器的學習率方式

阿新 • • 發佈：2020-06-27

在深度學習中，經常需要動態調整學習率，以達到更好地訓練效果，本文紀錄在pytorch中的實現方法，其優化器例項為SGD優化器，其他如Adam優化器同樣適用。

一般來說，在以SGD優化器作為基本優化器，然後根據epoch實現學習率指數下降，程式碼如下:

step = [10,20,30,40]
base_lr = 1e-4
sgd_opt = torch.optim.SGD(model.parameters(),lr=base_lr,nesterov=True,momentum=0.9)
def adjust_lr(epoch):
 lr = base_lr * (0.1 ** np.sum(epoch >= np.array(step)))
 for params_group in sgd_opt.param_groups:
  params_group['lr'] = lr
 return lr

只需要在每個train的epoch之前使用這個函式即可。

for epoch in range(60):
 model.train()
 adjust_lr(epoch)
 for ind,each in enumerate(train_loader):
 mat,label = each
 ...

補充知識：Pytorch框架下應用Bi-LSTM實現汽車評論文字關鍵詞抽取

需要呼叫的模組及整體Bi-lstm流程

import torch
import pandas as pd
import numpy as np
from tensorflow import keras
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torch.utils.data import DataLoader
from torch.utils.data import TensorDataset
import gensim
from sklearn.model_selection import train_test_split
class word_extract(nn.Module):
 def __init__(self,d_model,embedding_matrix):
  super(word_extract,self).__init__()
  self.d_model=d_model
  self.embedding=nn.Embedding(num_embeddings=len(embedding_matrix),embedding_dim=200)
  self.embedding.weight.data.copy_(embedding_matrix)
  self.embedding.weight.requires_grad=False
  self.lstm1=nn.LSTM(input_size=200,hidden_size=50,bidirectional=True)
  self.lstm2=nn.LSTM(input_size=2*self.lstm1.hidden_size,bidirectional=True)
  self.linear=nn.Linear(2*self.lstm2.hidden_size,4)

 def forward(self,x):
  w_x=self.embedding(x)
  first_x,(first_h_x,first_c_x)=self.lstm1(w_x)
  second_x,(second_h_x,second_c_x)=self.lstm2(first_x)
  output_x=self.linear(second_x)
  return output_x

將文字轉換為數值形式

def trans_num(word2idx,text):
 text_list=[]
 for i in text:
  s=i.rstrip().replace('\r','').replace('\n','').split(' ')
  numtext=[word2idx[j] if j in word2idx.keys() else word2idx['_PAD'] for j in s ]
  text_list.append(numtext)
 return text_list

將Gensim裡的詞向量模型轉為矩陣形式，後續匯入到LSTM模型中

def establish_word2vec_matrix(model): #負責將數值索引轉為要輸入的資料
 word2idx = {"_PAD": 0} # 初始化 `[word : token]` 字典，後期 tokenize 語料庫就是用該詞典。
 num2idx = {0: "_PAD"}
 vocab_list = [(k,model.wv[k]) for k,v in model.wv.vocab.items()]

 # 儲存所有 word2vec 中所有向量的陣列，留意其中多一位，詞向量全為 0， 用於 padding
 embeddings_matrix = np.zeros((len(model.wv.vocab.items()) + 1,model.vector_size))
 for i in range(len(vocab_list)):
  word = vocab_list[i][0]
  word2idx[word] = i + 1
  num2idx[i + 1] = word
  embeddings_matrix[i + 1] = vocab_list[i][1]
 embeddings_matrix = torch.Tensor(embeddings_matrix)
 return embeddings_matrix,word2idx,num2idx

訓練過程

def train(model,epoch,learning_rate,batch_size,x,y,val_x,val_y):
 optimizor = optim.Adam(model.parameters(),lr=learning_rate)
 data = TensorDataset(x,y)
 data = DataLoader(data,batch_size=batch_size)
 for i in range(epoch):
  for j,(per_x,per_y) in enumerate(data):
   output_y = model(per_x)
   loss = F.cross_entropy(output_y.view(-1,output_y.size(2)),per_y.view(-1))
   optimizor.zero_grad()
   loss.backward()
   optimizor.step()
   arg_y=output_y.argmax(dim=2)
   fit_correct=(arg_y==per_y).sum()
   fit_acc=fit_correct.item()/(per_y.size(0)*per_y.size(1))
   print('##################################')
   print('第{}次迭代第{}批次的訓練誤差為{}'.format(i + 1,j + 1,loss),end=' ')
   print('第{}次迭代第{}批次的訓練準確度為{}'.format(i + 1,fit_acc))
   val_output_y = model(val_x)
   val_loss = F.cross_entropy(val_output_y.view(-1,val_output_y.size(2)),val_y.view(-1))
   arg_val_y=val_output_y.argmax(dim=2)
   val_correct=(arg_val_y==val_y).sum()
   val_acc=val_correct.item()/(val_y.size(0)*val_y.size(1))
   print('第{}次迭代第{}批次的預測誤差為{}'.format(i + 1,val_loss),end=' ')
   print('第{}次迭代第{}批次的預測準確度為{}'.format(i + 1,val_acc))
 torch.save(model,'./extract_model.pkl')#儲存模型

主函式部分

if __name__ =='__main__':
 #生成詞向量矩陣
 word2vec = gensim.models.Word2Vec.load('./word2vec_model')
 embedding_matrix,num2idx=establish_word2vec_matrix(word2vec)#輸入的是詞向量模型
 #
 train_data=pd.read_csv('./資料.csv')
 x=list(train_data['文字'])
 # 將文字從文字轉化為數值，這部分trans_num函式你需要自己改動去適應你自己的資料集
 x=trans_num(word2idx,x)
 #x需要先進行填充，也就是每個句子都是一樣長度，不夠長度的以0來填充，填充詞單獨分為一類
 # #也就是說輸入的x是固定長度的數值列表,例如[50,123,1850,21,199,0，0，...]
 #輸入的y是[2,1,3,.....]
 #填充程式碼你自行編寫，以下部分是針對我的資料集
 x=keras.preprocessing.sequence.pad_sequences(
   x,maxlen=60,value=0,padding='post',)
 y=list(train_data['BIO數值'])
 y_text=[]
 for i in y:
  s=i.rstrip().split(' ')
  numtext=[int(j) for j in s]
  y_text.append(numtext)
 y=y_text
 y=keras.preprocessing.sequence.pad_sequences(
   y,value=3,)
 # 將資料進行劃分
 fit_x,fit_y,val_y=train_test_split(x,train_size=0.8,test_size=0.2)
 fit_x=torch.LongTensor(fit_x)
 fit_y=torch.LongTensor(fit_y)
 val_x=torch.LongTensor(val_x)
 val_y=torch.LongTensor(val_y)
 #開始應用
 w_extract=word_extract(d_model=200,embedding_matrix=embedding_matrix)
 train(model=w_extract,epoch=5,learning_rate=0.001,batch_size=50,x=fit_x,y=fit_y,val_x=val_x,val_y=val_y)#可以自行改動引數,設定學習率，批次，和迭代次數
 w_extract=torch.load('./extract_model.pkl')#載入儲存好的模型
 pred_val_y=w_extract(val_x).argmax(dim=2)

以上這篇在pytorch中動態調整優化器的學習率方式就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

在pytorch中動態調整優化器的學習率方式

torch 預設引數初始化_Detection學習之九-torch中如何定義優化器及調整學習率

技術標籤：torch 預設引數初始化 torch.optim torch.optim是一個實現了各種優化演算法的庫。大部分常用的方法得到支援，並且介面具備足夠的通用性，使得未來能夠整合更加複雜的方法。

pytorch 實現在一個優化器中設定多個網路引數的例子

我就廢話不多說了，直接上程式碼吧！其實也不難，使用tertools.chain將引數連結起來即可

PyTorch中的padding(邊緣填充)操作方式

簡介我們知道，在對影象執行卷積操作時，如果不對影象邊緣進行填充，卷積核將無法到達影象邊緣的畫素，而且卷積前後影象的尺寸也會發生變化，這會造成許多麻煩。

在Pytorch中計算自己模型的FLOPs方式

https://github.com/Lyken17/pytorch-OpCounter 安裝方法很簡單： pip install thop 基本用法： from torchvision.models import resnet50from thop import profile

Pytorch學習筆記08----優化器演算法Optimizer詳解（SGD、Adam）

1.優化器演算法簡述首先來看一下梯度下降最常見的三種變形 BGD，SGD，MBGD，這三種形式的區別就是取決於我們用多少資料來計算目標函式的梯度，這樣的話自然就涉及到一個 trade－off，即引數更新的準確率和執行時間。

MySQL中的BNL優化器

在5.7以上版本中，BNL優化器預設是開啟的， show variables like \'optimizer_switch\' optimizer_switch index_merge=on,index_merge_union=on,index_merge_sort_union=on,index_merge_intersection=on,engine_c

Pytorch學習筆記之優化器的使用

技術標籤：PytorchPytorch torch.optim提供了不同演算法實現的優化器，在模型訓練時用於更新模型引數。torch.optim.Optimizer為基類，所有的優化器都是該類的子類。優化器使用比較簡單，以torch.optim.SGD為例，

pytorch 實現模型不同層設定不同的學習率方式

在目標檢測的模型訓練中，我們通常都會有一個特徵提取網路backbone，例如YOLO使用的darknet SSD使用的VGG-16。

pytorch中的卷積和池化計算方式詳解

TensorFlow裡面的padding只有兩個選項也就是valid和same pytorch裡面的padding麼有這兩個選項，它是數字0,1,2,3等等，預設是0

Pytorch中實現只匯入部分模型引數的方式

我們在做遷移學習，或者在分割，檢測等任務想使用預訓練好的模型，同時又有自己修改之後的結構，使得模型檔案儲存的引數，有一部分是不需要的（don\'t expected）。我們搭建的網路對儲存檔案來說，有一部分引數也是沒

pytorch::Dataloader中的迭代器和生成器應用詳解

在使用pytorch訓練模型，經常需要載入大量圖片資料，因此pytorch提供了好用的資料載入工具Dataloader。

pytorch中tensor張量資料型別的轉化方式

1.tensor張量與numpy相互轉換 tensor ----->numpy import torch a=torch.ones([2,5]) tensor([[1.,1.,1.],[1.,1.]])

pytorch nn.Conv2d()中的padding以及輸出大小方式

我就廢話不多說了，直接上程式碼吧！ conv1=nn.Conv2d(1,2,kernel_size=3,padding=1) conv2=nn.Conv2d(1,kernel_size=3)

Pytorch在dataloader類中設定shuffle的隨機數種子方式

如題：Pytorch在dataloader類中設定shuffle的隨機數種子方式雖然實驗結果差別不大，但是有時候也懸殊兩個百分點

淺談Pytorch torch.optim優化器個性化的使用

一、簡化前饋網路LeNet import torch as t class LeNet(t.nn.Module): def __init__(self): super(LeNet,self).__init__()

如何在keras中新增自己的優化器(如adam等)

本文主要討論windows下基於tensorflow的keras 1、找到tensorflow的根目錄如果安裝時使用anaconda且使用預設安裝路徑，則在 C:\\ProgramData\\Anaconda3\\envs\\tensorflow-gpu\\Lib\\site-packages\\tensorflow處可

Keras SGD 隨機梯度下降優化器引數設定方式

SGD 隨機梯度下降 Keras 中包含了各式優化器供我們使用，但通常我會傾向於使用 SGD 驗證模型能否快速收斂，然後調整不同的學習速率看看模型最後的效能，然後再嘗試使用其他優化器。

前端阻止冒泡事件、將專案打包並安裝在當前環境中、請求路徑引數傳遞方式、JQ觸發動態新增元素、position絕對定位和相對定位、js中動態新增id、Corpus專案部署上線

一、前端阻止冒泡事件舉例：button裡面有個span標籤，button和span都綁定了點選事件，點選span不會觸發button的點選事件

在PyTorch中使用深度自編碼器實現影象重建

作者|DR. VAIBHAV KUMAR 編譯|VK 來源|Analytics In Diamag 人工神經網路有許多流行的變體，可用於有監督和無監督學習問題。自編碼器也是神經網路的一個變種，主要用於無監督學習問題。

在pytorch中動態調整優化器的學習率方式

相關推薦