使用VGG模型遷移學習進行貓狗大戰

阿新 • • 發佈：2020-08-01

import numpy as np
import matplotlib.pyplot as plt
import os
import torch
import torch.nn as nn
import torchvision
from torchvision import models,transforms,datasets
import time
import json

# 判斷是否存在GPU裝置
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
print('Using gpu: %s ' % torch.cuda.is_available())

#1下載資料
#! wget http://fenggao-image.stor.sinaapp.com/dogscats.zip
#! unzip dogscats.zip

#2資料處理
normalize = transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
vgg_format = transforms.Compose([
                transforms.CenterCrop(224),
                transforms.ToTensor(),
                normalize,
            ])

data_dir = './dogscats'
dsets = {x: datasets.ImageFolder(os.path.join(data_dir, x), vgg_format)
         for x in ['train', 'valid']}

dset_sizes = {x: len(dsets[x]) for x in ['train', 'valid']}
dset_classes = dsets['train'].classes

# 通過下面程式碼可以檢視 dsets 的一些屬性
print(dsets['train'].classes)
print(dsets['train'].class_to_idx)
print(dsets['train'].imgs[:5])
print('dset_sizes: ', dset_sizes)

loader_train = torch.utils.data.DataLoader(dsets['train'], batch_size=64, shuffle=True, num_workers=6)
loader_valid = torch.utils.data.DataLoader(dsets['valid'], batch_size=5, shuffle=False, num_workers=6)

#valid 資料一共有2000張圖，每個batch是5張，因此，下面進行遍歷一共會輸出到 400
同時，把第一個 batch 儲存到 inputs_try, labels_try，分別檢視
count = 1
for data in loader_valid:
    print(count, end='\n')
    if count == 1:
        inputs_try,labels_try = data
    count +=1

print(labels_try)
print(inputs_try.shape)

# 顯示圖片的小程式

def imshow(inp, title=None):
#   Imshow for Tensor.
    inp = inp.numpy().transpose((1, 2, 0))
    mean = np.array([0.485, 0.456, 0.406])
    std = np.array([0.229, 0.224, 0.225])
    inp = np.clip(std * inp + mean, 0,1)
    plt.imshow(inp)
    if title is not None:
        plt.title(title)
    plt.pause(0.001)  # pause a bit so that plots are updated

# 顯示 labels_try 的5張圖片，即valid裡第一個batch的5張圖片
out = torchvision.utils.make_grid(inputs_try)
imshow(out, title=[dset_classes[x] for x in labels_try])

#3建立VGG Model
!wget https://s3.amazonaws.com/deep-learning-models/image-models/imagenet_class_index.json

model_vgg = models.vgg16(pretrained=True)

with open('./imagenet_class_index.json') as f:
    class_dict = json.load(f)
dic_imagenet = [class_dict[str(i)][1] for i in range(len(class_dict))]

inputs_try , labels_try = inputs_try.to(device), labels_try.to(device)
model_vgg = model_vgg.to(device)

outputs_try = model_vgg(inputs_try)

print(outputs_try)
print(outputs_try.shape)

#為了將VGG網路輸出的結果轉化為對每一類的預測概率，我們把結果輸入到 Softmax 函式

m_softm = nn.Softmax(dim=1)
probs = m_softm(outputs_try)
vals_try,pred_try = torch.max(probs,dim=1)

print( 'prob sum: ', torch.sum(probs,1))
print( 'vals_try: ', vals_try)
print( 'pred_try: ', pred_try)

print([dic_imagenet[i] for i in pred_try.data])
imshow(torchvision.utils.make_grid(inputs_try.data.cpu()), 
       title=[dset_classes[x] for x in labels_try.data.cpu()])

#4修改最後一層
print(model_vgg)

model_vgg_new = model_vgg;

for param in model_vgg_new.parameters():
    param.requires_grad = False
model_vgg_new.classifier._modules['6'] = nn.Linear(4096, 2)
model_vgg_new.classifier._modules['7'] = torch.nn.LogSoftmax(dim = 1)

model_vgg_new = model_vgg_new.to(device)

print(model_vgg_new.classifier)

#5訓練並測試
#第一步：建立損失函式和優化器
criterion = nn.NLLLoss()
# 學習率
lr = 0.001
# 隨機梯度下降
optimizer_vgg = torch.optim.SGD(model_vgg_new.classifier[6].parameters(),lr = lr)

#第二步：訓練模型
def train_model(model,dataloader,size,epochs=1,optimizer=None):
    model.train()
   
    for epoch in range(epochs):
        running_loss = 0.0
        running_corrects = 0
        count = 0
        for inputs,classes in dataloader:
            inputs = inputs.to(device)
            classes = classes.to(device)
            outputs = model(inputs)
            loss = criterion(outputs,classes)           
            optimizer = optimizer
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
            _,preds = torch.max(outputs.data,1)
            # statistics
            running_loss += loss.data.item()
            running_corrects += torch.sum(preds == classes.data)
            count += len(inputs)
            print('Training: No. ', count, ' process ... total: ', size)
        epoch_loss = running_loss / size
        epoch_acc = running_corrects.data.item() / size
        print('Loss: {:.4f} Acc: {:.4f}'.format(
                     epoch_loss, epoch_acc))
           
# 模型訓練
train_model(model_vgg_new,loader_train,size=dset_sizes['train'], epochs=1, 
            optimizer=optimizer_vgg)

def test_model(model,dataloader,size):
    model.eval()
    predictions = np.zeros(size)
    all_classes = np.zeros(size)
    all_proba = np.zeros((size,2))
    i = 0
    running_loss = 0.0
    running_corrects = 0
    for inputs,classes in dataloader:
        inputs = inputs.to(device)
        classes = classes.to(device)
        outputs = model(inputs)
        loss = criterion(outputs,classes)           
        _,preds = torch.max(outputs.data,1)
        # statistics
        running_loss += loss.data.item()
        running_corrects += torch.sum(preds == classes.data)
        predictions[i:i+len(classes)] = preds.to('cpu').numpy()
        all_classes[i:i+len(classes)] = classes.to('cpu').numpy()
        all_proba[i:i+len(classes),:] = outputs.data.to('cpu').numpy()
        i += len(classes)
        print('Testing: No. ', i, ' process ... total: ', size)        
    epoch_loss = running_loss / size
    epoch_acc = running_corrects.data.item() / size
    print('Loss: {:.4f} Acc: {:.4f}'.format(
                     epoch_loss, epoch_acc))
    return predictions, all_proba, all_classes
  
predictions, all_proba, all_classes = test_model(model_vgg_new,loader_valid,size=dset_sizes['valid'])

#6視覺化
# 單次視覺化顯示的圖片個數
n_view = 8
correct = np.where(predictions==all_classes)[0]
from numpy.random import random, permutation
idx = permutation(correct)[:n_view]
print('random correct idx: ', idx)
loader_correct = torch.utils.data.DataLoader([dsets['valid'][x] for x in idx],
                  batch_size = n_view,shuffle=True)
for data in loader_correct:
    inputs_cor,labels_cor = data
# Make a grid from batch
out = torchvision.utils.make_grid(inputs_cor)
imshow(out, title=[l.item() for l in labels_cor])

使用VGG模型遷移學習進行貓狗大戰

import numpy as np import matplotlib.pyplot as plt import os import torch import torch.nn as nn import torchvision

使用VGG模型進行貓狗大戰

1.下載資料 ! wget http://fenggao-image.stor.sinaapp.com/dogscats.zip ! unzip dogscats.zip 2.資料處理

LeNet 網路進行貓狗大戰

最近給學生布置了貓狗大戰的作業，是我自己拍腦袋想的。我發現大多同學做的並太理想，主要原因是因為對pytorch不太熟悉。中秋假期我也做了這個作業，效果雖然並不算好，但可以做為一個範例提供給初學者學習。(其實我

VGG模型貓狗大戰

VGG模型貓狗大戰下載資料 import numpy as np import matplotlib.pyplot as plt import os import torch

記錄一次失敗的深度學習經歷之Kaggle:貓狗大戰

內容導航實驗環境基本模組匯入模組函式：load_data 型別：CatsDogsDataset型別：BasicModule

【第一週】附：貓狗大戰

第五部分貓狗大戰（Colab） 5.1 基礎知識儲備 1.Pytorch：transforms的二十二個方法，推薦部落格連結：

貓狗大戰挑戰賽

VGG實現貓狗分類　　1、匯入資料和解壓資料 ! wget http://fenggao-image.stor.sinaapp.com/dogscats.zip! unzip dogscats.zip ! wget https://static.leiphone.com/cat_dog.rar! unrar x cat_dog.rar

AlexNet-Pytorch-Kaggle貓狗大戰

前言前一段時間基於LeNet-5實現了MNIST手寫數字識別，由於torchvision.datasets模組集成了MNIST資料集，所以在載入資料時使用的是torchvision.datasets自帶的方法，缺失瞭如何對一般資料集的處理部分，不能將其作為

基於遷移學習的 PyTorch 狗狗分類器

技術標籤：遷移學習機器學習、深度學習python演算法pythontensorflow機器學習人工智慧

VGG的遷移學習

原始碼執行生成資料集中圖片順序不是1-20000順序的。載入了預訓練的權重，引入softmax模組

貓狗大戰

貓狗大戰挑戰賽在 ImageNet 上預訓練的 VGG 網路進行測試。因為原網路的分類結果是1000類，所以這裡進行遷移學習，對原網路進行 fine-tune （即固定前面若干層，作為特徵提取器，只重新訓練最後兩層）。

基於VGG16模型對貓狗分類任務進行遷移學習

import os from torchvision import models from torchvision import transforms, datasets from torchvision.utils import make_grid

Pytorch-影象分類和CNN模型的遷移學習

導包： 1 import torch 2 import torch.nn as nn 3 import torch.nn.functional as F 4 import torch.optim as optim

總結一下最近整合的兩段訓練的程式碼(貓狗圖片分類)以供以後學習參考使用

第一種程式碼點選檢視程式碼 import os import random import numpy as np import torch import torch.nn as nn

最新論文：用 GAN 監督學習給左晃右晃的貓狗加表情，很絲滑很貼合

12 月 19 日訊息，生成性對抗網路 GAN 又被開發出一項“不正經”用途。給貓狗加表情：給馬斯克加鬍子：不管視訊中的腦袋怎麼左晃右晃，這些表情都能始終如一地貼合面部，且每一幀都表現得非常絲滑。這就是朱儁彥等人

tensorflow學習022——自定義訓練綜合貓狗資料例項訓練

點選檢視程式碼 import tensorflow as tf from tensorflow import keras import matplotlib.pyplot as plt

VGG貓狗分類和pytorch官網的程式碼

VGG貓狗分類: import tensorflow as tffrom tensorflow import kerasfrom tensorflow.keras import layers, regularizersimport numpy as npimport osimport cv2import matplotlib.pyplot as plt

利用VGG16網路模組進行遷移學習實現影象識別

Override the entrypoint of an image Introduced in GitLab and GitLab Runner 9.4. Read more about the extended configuration options.

面向物件學習之pygame坦克大戰

經過一天多的奮戰，查閱文獻，參考別人的程式碼等等，完成了第一個面向物件的小專案，也深深體會到面向物件程式設計思想在遊戲程式設計中所扮演的角色。

使用pytorch完成kaggle貓狗影象識別方式

kaggle是一個為開發商和資料科學家提供舉辦機器學習競賽、託管資料庫、編寫和分享程式碼的平臺，在這上面有非常多的好專案、好資源可供機器學習、深度學習愛好者學習之用。

使用VGG模型遷移學習進行貓狗大戰

相關推薦