Pytorch訓練模型常用操作

阿新 • • 發佈：2021-10-21

One-hot編碼

將標籤轉換為one-hot編碼形式

def to_categorical(y, num_classes):
    """ 1-hot encodes a tensor """
    new_y = torch.eye(num_classes)[y.cpu().data.numpy(), ]
    if (y.is_cuda):
        return new_y.cuda()
    return new_y

示例

>>> y = np.array([1,2,3])
>>> y
array([1, 2, 3])
>>> torch.eye(4)[y,]
tensor([[0., 1., 0., 0.],
        [0., 0., 1., 0.],
        [0., 0., 0., 1.]])

>>> y
array([[1, 2, 2],
       [1, 2, 3]])
>>> torch.eye(4)[y,]
tensor([[[0., 1., 0., 0.],
         [0., 0., 1., 0.],
         [0., 0., 1., 0.]],

        [[0., 1., 0., 0.],
         [0., 0., 1., 0.],
         [0., 0., 0., 1.]]])
>>> torch.eye(4)[y]
tensor([1., 1., 0.])

分別初始化

def weights_init(m):
  classname = m.__class__.__name__
  if classname.find('Conv2d') != -1:
      torch.nn.init.xavier_normal_(m.weight.data)
      torch.nn.init.constant_(m.bias.data, 0.0)
  elif classname.find('Linear') != -1:
      torch.nn.init.xavier_normal_(m.weight.data)
      torch.nn.init.constant_(m.bias.data, 0.0)

classifier = classifier.apply(weights_init)

checkpoint檢查是否接著訓練

try:
    checkpoint = torch.load(str(exp_dir) + '/checkpoints/best_model.pth')
    start_epoch = checkpoint['epoch']
    classifier.load_state_dict(checkpoint['model_state_dict'])
    log_string('Use pretrain model')
except:
    log_string('No existing model, starting training from scratch...')
    start_epoch = 0

根據迭代次數調整學習率


def bn_momentum_adjust(m, momentum):
    if isinstance(m, torch.nn.BatchNorm2d) or isinstance(m, torch.nn.BatchNorm1d):
        m.momentum = momentum

lr = max(args.learning_rate * (args.lr_decay ** (epoch // args.step_size)), LEARNING_RATE_CLIP)
log_string('Learning rate:%f' % lr)
for param_group in optimizer.param_groups:
    param_group['lr'] = lr
momentum = MOMENTUM_ORIGINAL * (MOMENTUM_DECCAY ** (epoch // MOMENTUM_DECCAY_STEP))
if momentum < 0.01:
    momentum = 0.01
print('BN momentum updated to: %f' % momentum)
classifier = classifier.apply(lambda x: bn_momentum_adjust(x, momentum))
classifier = classifier.train()

批量資料維度不一致

自定義torch.utils.data.Dataloader(dataset, collate_fn=collate_fn)中的collate_fn

def my_collate_fn(batch_data):
    """
    descriptions: 對齊批量資料維度, [(data, label),(data, label)...]轉化成([data, data...],[label,label...])
    :param batch_data:  list，[(data, label),(data, label)...]
    :return: tuple, ([data, data...],[label,label...])
    """
    batch_data.sort(key=lambda x: len(x[0][0]), reverse=False)  # 按照資料長度升序排序
    data_list = []
    label_list = []
    max_len = len(batch_data[0][0][0])
    for batch in range(0, len(batch_data)):
        data = batch_data[batch][0][0]
        label = batch_data[batch][0][1]
        diff = max_len - len(data)
        for i in range(diff):
            data.append([0, 0, 0])
            label.append(0)
        data_list.append(data)
        label_list.append(label)

    data_tensor = torch.tensor(data_list, dtype=torch.float32)
    label_tensor = torch.tensor(label_list, dtype=torch.float32)
    data_copy = (data_tensor, label_tensor)
    return data_copy

Pytorch訓練模型常用操作

One-hot編碼將標籤轉換為one-hot編碼形式 def to_categorical(y, num_classes): \"\"\" 1-hot encodes a tensor \"\"\"

git log規範_deepvac-PyTorch訓練模型專案的工程化規範

技術標籤：git log規範 deepvac提供了PyTorch訓練模型專案的工程化規範。專案地址：

使用pytorch搭建AlexNet操作(微調預訓練模型及手動搭建)

本文介紹瞭如何在pytorch下搭建AlexNet，使用了兩種方法，一種是直接載入預訓練模型，並根據自己的需要微調（將最後一層全連線層輸出由1000改為10），另一種是手動搭建。

pytorch 實現在預訓練模型的 input上增減通道

如何把imagenet預訓練的模型，輸入層的通道數隨心所欲的修改，從而來適應自己的任務

pytorch載入預訓練模型後,實現訓練指定層

1、有了已經訓練好的模型引數，對這個模型的某些層做了改變，如何利用這些訓練好的模型引數繼續訓練：

Pytorch儲存模型用於測試和用於繼續訓練的區別詳解

儲存模型儲存模型僅僅是為了測試的時候，只需要 torch.save(model.state_dict,path) path 為儲存的路徑

PyTorch載入預訓練模型例項(pretrained)

使用預訓練模型的程式碼如下： # 載入預訓練模型 resNet50 = models.resnet50(pretrained=True)

MxNet預訓練模型到Pytorch模型的轉換方式

預訓練模型在不同深度學習框架中的轉換是一種常見的任務。今天剛好DPN預訓練模型轉換問題，順手將這個過程記錄一下。

Tensorflow載入Vgg預訓練模型操作

很多深度神經網路模型需要載入預訓練過的Vgg引數，比如說：風格遷移、目標檢測、影象標註等計算機視覺中常見的任務。那麼到底如何載入Vgg模型呢？Vgg檔案的引數到底有何意義呢？載入後的模型該如何使用呢？

使用Keras建立模型並訓練等一系列操作方式

由於Keras是一種建立在已有深度學習框架上的二次框架，其使用起來非常方便，其後端實現有兩種方法，theano和tensorflow。由於自己平時用tensorflow，所以選擇後端用tensorflow的Keras，程式碼寫起來更加方便。

Pytorch-Bert預訓練模型的使用（呼叫transformers）

筆記摘抄 1. transformer資料 transformers（以前稱為pytorch-transformers和pytorch-pretrained-bert）

[PyTorch 學習筆記] 7.3 使用 GPU 訓練模型

本章程式碼： https://github.com/zhangxiann/PyTorch_Practice/blob/master/lesson7/cuda_use.py https://github.com/zhangxiann/PyTorch_Practice/blob/master/lesson7/multi_gpu.py