用pytorch實現預訓練網路的finetune

阿新 • • 發佈：2018-12-31

繼續熟悉pytorch，發現的確比TensorFlow好用，在官網finetune教程的基礎上進行了大幅修改，主要是熟悉了pytorch自帶的Dataset和DataLoader類。

# -*- coding: utf-8 -*-

import os, torch, glob, time, copy
import numpy as np
from torch.autograd import Variable
from PIL import Image  
from torchvision import models, transforms
import torch.nn as nn
from torch.utils.data import DataLoader, Dataset
import torch.optim as optim
from torch.optim import lr_scheduler

train_data_dir = './hymenoptera_data/train'
test_data_dir = './hymenoptera_data/val'

def get_lists(data_dir):        
    files_list = []
    labels_list = []
    sub_dirs = [x[0] for x in os.walk(data_dir) ]
    sub_dirs = sub_dirs[1:]
    
    extentions = ['jpg', 'jpeg', 'JPG', 'JPEG']
        
    for sub_dir in sub_dirs:
        if os.path.basename(sub_dir) == 'ants':
            label = [0]
        elif os.path.basename(sub_dir) == 'bees':
            label = [1] 
            
        for extention in extentions:
            file_glob = os.path.join(sub_dir, '*.' + extention)
            new_files = glob.glob(file_glob)
            files_list.extend(new_files)
            labels_list = labels_list + label * len(new_files)
    return files_list, labels_list

class myDataset(Dataset):
    # TensorDataset繼承Dataset, 過載了__init__, __getitem__, __len__
    # 實現將一組Tensor資料對封裝成Tensor資料集
    # 能夠通過index得到資料集的資料，能夠通過len，得到資料集大小

    def __init__(self, files_list, labels_list, transform):
        self.files_list = files_list
        self.labels_list = labels_list
        self.transform = transform

    def __getitem__(self, index):
        img = Image.open(self.files_list[index])
        img = self.transform(img)
        return img, self.labels_list[index]

    def __len__(self):
        return len(self.labels_list)
    
def train_model(model, criterion, optimizer, scheduler, num_epochs=25):
    since1 = time.time()

    best_model_wts = copy.deepcopy(model.state_dict())
    best_acc = 0.0

    for epoch in range(num_epochs):
        since2 = time.time()
        print('Epoch {}/{}'.format(epoch, num_epochs - 1))
        print('-' * 10)

        # Each epoch has a training and validation phase
        for phase in ['train', 'val']:
            if phase == 'train':
                scheduler.step()
                model.train(True)  # Set model to training mode
            else:
                model.train(False)  # Set model to evaluate mode

            running_loss = 0.0
            running_corrects = 0

            # Iterate over data.
            for data in (dataloaders[phase]):
                # get the inputs
                inputs, labels = data

                # wrap them in Variable
                if use_gpu:
                    inputs = Variable(inputs.cuda())
                    labels = Variable(labels.cuda())
                else:
                    inputs, labels = Variable(inputs), Variable(labels)

                # zero the parameter gradients
                optimizer.zero_grad()

                # forward
                outputs = model(inputs)
                _, preds = torch.max(outputs.data, 1)
                loss = criterion(outputs, labels)

                # backward + optimize only if in training phase
                if phase == 'train':
                    loss.backward()
                    optimizer.step()

                # statistics
                running_loss += loss.data[0] * inputs.size(0)
                running_corrects += torch.sum(preds == labels.data)

            epoch_loss = running_loss / dataset_sizes[phase]
            epoch_acc = running_corrects / dataset_sizes[phase]

            print('{} Loss: {:.4f} Acc: {:.4f}'.format(
                phase, epoch_loss, epoch_acc))

            

            # deep copy the model
            if phase == 'val' and epoch_acc > best_acc:
                best_acc = epoch_acc
                best_model_wts = copy.deepcopy(model.state_dict())
                
        print(time.time() - since2)


    time_elapsed = time.time() - since1
    print('Training complete in {:.0f}m {:.0f}s'.format(
        time_elapsed // 60, time_elapsed % 60))
    print('Best val Acc: {:4f}'.format(best_acc))

    # load best model weights
    model.load_state_dict(best_model_wts)
    return model

if __name__ == '__main__':
    BATCH_SIZE = 4
    use_gpu = torch.cuda.is_available()

    transform = transforms.Compose([
            transforms.Scale(256),
            transforms.CenterCrop(224),
            transforms.ToTensor()    ]
    )
    train_images, train_labels = get_lists(train_data_dir)
    test_images, test_labels = get_lists(test_data_dir)

    train_dataset = myDataset(train_images, train_labels, transform)
    test_dataset = myDataset(test_images, test_labels, transform)
    train_loader = DataLoader(dataset=train_dataset, batch_size=BATCH_SIZE,  
                               shuffle=True, num_workers=0)  
    test_loader = DataLoader(dataset=test_dataset, batch_size=BATCH_SIZE,  
                               shuffle=True, num_workers=0)      
    dataloaders = {}
    dataloaders['train'] = train_loader
    dataloaders['val'] = test_loader
    
    dataset_sizes = {}
    dataset_sizes['train'] = len(train_labels)
    dataset_sizes['val'] = len(test_labels)
    
    model_ft = models.resnet18(pretrained=True)
    num_ftrs = model_ft.fc.in_features
    model_ft.fc = nn.Linear(num_ftrs, 2)
    
    if use_gpu:
        model_ft = model_ft.cuda()
    
    criterion = nn.CrossEntropyLoss()
    
    # Observe that all parameters are being optimized
    optimizer_ft = optim.SGD(model_ft.parameters(), lr=0.001, momentum=0.9)
    
    # Decay LR by a factor of 0.1 every 7 epochs
    exp_lr_scheduler = lr_scheduler.StepLR(optimizer_ft, step_size=7, gamma=0.1)
    model_ft = train_model(model_ft, criterion, optimizer_ft, exp_lr_scheduler,
                           num_epochs=25)
#    for (batch_x, batch_y) in enumerate(train_loader):
#        print(batch_x, batch_y)

用pytorch實現預訓練網路的finetune

繼續熟悉pytorch，發現的確比TensorFlow好用，在官網finetune教程的基礎上進行了大幅修改，主要是熟悉了pytorch自帶的Dataset和DataLoader類。 # -*- coding: utf-8 -*- import os, torch, g

用pytorch實現一個神經網路（一）

對於影象資料的resize問題： pytorch裡有幾種resize資料的方法： 1.torchvision.transforms.Resize：這個我始終沒用成，好像是伺服器上安裝的anacond

小白程式設計用Pytorch匯入預訓練模型&&設定不同學習速率

前兩天正好在做這個部分，參考了很多網友的做法，也去pytorch論壇查了一下，現在總結如下。建議還是自己單步除錯一下看看每個引數裡面的值是什麼樣的比較好。1.匯入預訓練的模型，預訓練模型是現有模型的一個或者幾個部分假設我有一個網路包含 pretrained和classify兩

韓國小哥哥用Pytorch實現谷歌最強NLP預訓練模型BERT | 程式碼

乾明編譯整理自 GitHub 量子位報道 | 公眾號 QbitAI新鮮程式碼，還熱乎著呢。前

用pytorch實現多層感知機（MLP)（全連線神經網路FC）分類MNIST手寫數字體的識別

1.匯入必備的包 1 import torch 2 import numpy as np 3 from torchvision.datasets import mnist 4 from torch import nn 5 from torch.autograd import Variable 6

用pytorch實現GAN——mnist（含有全部註釋和網路思想）

#coding=utf-8 import torch.autograd import torch.nn as nn from torch.autograd import Variable from torchvision import transforms from torchvision impo

用PyTorch實現一個卷積神經網路進行影象分類

1. 回顧在進入這一篇部落格的內容之前，我們先確保已經成功安裝好PyTorch，可以參考我之前的一篇部落格“Ubuntu12.04下PyTorch詳細安裝記錄”： http://blog.csdn.net/wblgers1234/article/details/729020161接下來，我們用設計一個簡單

TensorFlow 同時調用多個預訓練好的模型

預測 txt success ucc data 分享 ext font 訓練在某些任務中，我們需要針對不同的情況訓練多個不同的神經網絡模型，這時候，在測試階段，我們就需要調用多個預訓練好的模型分別來進行預測。調用單個預訓練好的模型請點擊此處弄明白了如何調用單個

Pytorch使用預訓練模型加速訓練的技巧

當屬於預訓練模型屬於下面的情況的時候，可以採用這個加速的技巧：固定前部分的層，只改變網路後面層的引數。比如，使用vgg16的預訓練模型，固定特徵提取層，改變後面的全連線層。要注意的是，如果固定的是特徵提取層+一個全連線層，也可以使用這個技巧，只要固定的是前一部分。

pytorch 更改預訓練模型網路結構

一個繼承nn.module的model它包含一個叫做children()的函式，這個函式可以用來提取出model每一層的網路結構，在此基礎上進行修改即可，修改方法如下(去除後兩層)： resnet_layer = nn.Sequential(*list(model.children())[:-2])

[Object Detection]關於“在預訓練網路中增加捲積和全連線層可以改善效能”

Yolo論文裡提到"Ren et al. show that adding both convolutional and connected layers to pretrained networks can improve performance [28]." [28] S. Ren, K. He, R.

keras 預訓練模型finetune,多模型ensemble，修改loss函式，調節學習率

keras 預訓練模型finetune,多模型ensemble，修改loss函式，調節學習率載入預訓練模型並finetune 修改loss函式兩個網路做ensemble，進行網路訓練，調節learning rate 載入預訓練模型並fi

Deeplearning4j 實戰（10）：遷移學習--ImageNet比賽預訓練網路VGG16分類花卉圖片

在最新發布的Deeplearning4j 0.8.0的版本中，開始支援深度神經網路的遷移學習模型。嚴格來說，這種遷移的方式是一種模型遷移。在具體操作的時候，將一個預先訓練好的神經網路，用新資料集重新訓練網路中的一小部分，從而完成在新資料集上建立的演算法任務，即完成了神經網路的遷移學習。在給出具體的案

預訓練網路模型

Keras Unet models with pre-trained backbones https://github.com/qubvel/segmentation_models Keras ResNet(18,34,50,101,152) pre-trained models https

pytorch 修改預訓練model

class Net(nn.Module): def __init__(self , model): super(Net, self).__init__() #取掉model的後兩層

AI：拿來主義——預訓練網路（一）

我們已經訓練過幾個神經網路了，識別手寫數字，房價預測或者是區分貓和狗，那隨之而來就有一個問題，這些訓練出的網路怎麼用，每個問題我都需要重新去訓練網路嗎？因為程式設計師都不太喜歡做重複的事情，因此答案肯定是已經有輪子了。我們先來介紹一個數據集，ImageNet。這就不得不提一個大名鼎鼎的華裔 AI 科學家李飛

AI：拿來主義——預訓練網路（二）

上一篇文章我們聊的是使用預訓練網路中的一種方法，特徵提取，今天我們討論另外一種方法，微調模型，這也是遷移學習的一種方法。微調模型為什麼需要微調模型？我們猜測和之前的實驗，我們有這樣的共識，資料量越少，網路的特徵節點越多，會越容易導致過擬合，這當然不是我們所希望的，但對於那些預先訓練好的模型，還有可能最終無

在 C/C++ 中使用 TensorFlow 預訓練好的模型—— 直接調用Ｃ++ 接口實現

input lac frame core 9.png pla 低版本訓練接口現在的深度學習框架一般都是基於 Python 來實現，構建、訓練、保存和調用模型都可以很容易地在 Python 下完成。但有時候，我們在實際應用這些模型的時候可能需要在其他編程語言下進行，本

PyTorch—torchvision.models匯入預訓練模型與殘差網路講解

文章目錄 torchvision.models 1. 模組呼叫 2. 原始碼解析 3. ResNet類 4. Bottlenect類 5. BasicB

PyTorch中使用預訓練的模型初始化網路的一部分引數(增減網路層，修改某層引數等) 固定引數

在預訓練網路的基礎上，修改部分層得到自己的網路，通常我們需要解決的問題包括： 1. 從預訓練的模型載入引數 2. 對新網路兩部分設定不同的學習率，主要訓練自己新增的層一. 載入引數的方法：載入引數可以參考apaszke推薦的做法，即刪除與當前mo

用pytorch實現預訓練網路的finetune

相關推薦