pytorch + visdom CNN處理自建圖片資料集

阿新 • • 發佈：2019-01-06

環境

系統：win10
cpu：i7-6700HQ
gpu：gtx965m
python : 3.6
pytorch ：0.3

資料下載

來源自Sasank Chilamkurthy 的教程；資料：下載連結。
下載後解壓放到專案根目錄：
這裡寫圖片描述
資料集為用來分類螞蟻和蜜蜂。有大約120個訓練影象，每個類有75個驗證影象。

資料匯入

可以使用 torchvision.datasets.ImageFolder(root,transforms) 模組可以將圖片轉換為 tensor。
先定義transform：

data_transforms = {
    'train' 
: transforms.Compose([
        # 隨機切成224x224 大小圖片 統一圖片格式
        transforms.RandomResizedCrop(224),
        # 影象翻轉
        transforms.RandomHorizontalFlip(),
        # totensor 歸一化(0,255) >> (0,1)   normalize   channel=（channel-mean）/std
        transforms.ToTensor(),
        transforms.Normalize(mean=[0.485 
, 0.456, 0.406], std=[0.229, 0.224, 0.225])
    ]),
    "val" : transforms.Compose([
        # 圖片大小縮放 統一圖片格式
        transforms.Resize(256),
        # 以中心裁剪
        transforms.CenterCrop(224),
        transforms.ToTensor(),
        transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
    ])
}

匯入，載入資料：

data_dir = './hymenoptera_data'
# trans data
image_datasets = {x: datasets.ImageFolder(os.path.join(data_dir, x), data_transforms[x]) for x in ['train', 'val']}
# load data
data_loaders = {x: DataLoader(image_datasets[x], batch_size=BATCH_SIZE, shuffle=True) for x in ['train', 'val']}

data_sizes = {x: len(image_datasets[x]) for x in ['train', 'val']}
class_names = image_datasets['train'].classes
print(data_sizes, class_names)

{'train': 244, 'val': 153} ['ants', 'bees']

訓練集 244圖片，測試集153圖片。

視覺化部分圖片看看，由於visdom支援tensor輸入，不用換成numpy，直接用tensor計算即可：

inputs, classes = next(iter(data_loaders['val']))

out = torchvision.utils.make_grid(inputs)
inp = torch.transpose(out, 0, 2)
mean = torch.FloatTensor([0.485, 0.456, 0.406])
std = torch.FloatTensor([0.229, 0.224, 0.225])
inp = std * inp + mean
inp = torch.transpose(inp, 0, 2)
viz.images(inp)

這裡寫圖片描述

建立CNN

net 根據上一篇的處理cifar10的改了一下規格：

class CNN(nn.Module):
    def __init__(self, in_dim, n_class):
        super(CNN, self).__init__()
        self.cnn = nn.Sequential(
            nn.BatchNorm2d(in_dim),
            nn.ReLU(True),
            nn.Conv2d(in_dim, 16, 7), # 224 >> 218
            nn.BatchNorm2d(16),
            nn.ReLU(inplace=True),
            nn.MaxPool2d(2, 2),  # 218 >> 109
            nn.ReLU(True),
            nn.Conv2d(16, 32, 5),  # 105
            nn.BatchNorm2d(32),
            nn.ReLU(True),
            nn.Conv2d(32, 64, 5),  # 101
            nn.BatchNorm2d(64),
            nn.ReLU(True),
            nn.Conv2d(64, 64, 3, 1, 1),
            nn.BatchNorm2d(64),
            nn.ReLU(True),
            nn.MaxPool2d(2, 2),  # 101 >> 50
            nn.Conv2d(64, 128, 3, 1, 1),  #
            nn.BatchNorm2d(128),
            nn.ReLU(True),
            nn.MaxPool2d(3),  # 50 >> 16
        )
        self.fc = nn.Sequential(
            nn.Linear(128*16*16, 120),
            nn.BatchNorm1d(120),
            nn.ReLU(True),
            nn.Linear(120, n_class))
    def forward(self, x):
        out = self.cnn(x)
        out = self.fc(out.view(-1, 128*16*16))
        return out

# 輸入3層rgb ，輸出 分類 2       
model = CNN(3, 2)

loss，優化函式：

line = viz.line(Y=np.arange(10))
loss_f = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=LR, momentum=0.9)
scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=7, gamma=0.1)

引數：

BATCH_SIZE = 4
LR = 0.001
EPOCHS = 10

執行 10個 epoch 看看：

[9/10] train_loss:0.650|train_acc:0.639|test_loss:0.621|test_acc0.706
[10/10] train_loss:0.645|train_acc:0.627|test_loss:0.654|test_acc0.686
Training complete in 1m 16s
Best val Acc: 0.712418

這裡寫圖片描述

執行 20個看看：

[19/20] train_loss:0.592|train_acc:0.701|test_loss:0.563|test_acc0.712
[20/20] train_loss:0.564|train_acc:0.721|test_loss:0.571|test_acc0.706
Training complete in 2m 30s
Best val Acc: 0.745098

這裡寫圖片描述

準確率比較低：只有74.5%

我們使用models 裡的 resnet18 執行 10個epoch：

model = torchvision.models.resnet18(True)
num_ftrs = model.fc.in_features
model.fc = nn.Linear(num_ftrs, 2)

[9/10] train_loss:0.621|train_acc:0.652|test_loss:0.588|test_acc0.667
[10/10] train_loss:0.610|train_acc:0.680|test_loss:0.561|test_acc0.667
Training complete in 1m 24s
Best val Acc: 0.686275

效果也很一般，想要短時間內就訓練出效果很好的models，我們可以下載訓練好的state，在此基礎上訓練：

model = torchvision.models.resnet18(pretrained=True)
num_ftrs = model.fc.in_features
model.fc = nn.Linear(num_ftrs, 2)

[9/10] train_loss:0.308|train_acc:0.877|test_loss:0.160|test_acc0.941
[10/10] train_loss:0.267|train_acc:0.885|test_loss:0.148|test_acc0.954
Training complete in 1m 25s
Best val Acc: 0.954248

10個epoch直接的到95%的準確率。

這裡寫圖片描述

程式碼在這。

pytorch + visdom CNN處理自建圖片資料集

環境系統：win10 cpu：i7-6700HQ gpu：gtx965m python : 3.6 pytorch ：0.3 資料下載來源自Sasank Chilamkurthy 的教程；資料：下載連結。

TensorFlow2.0（10）：載入自定義圖片資料集到Dataset

前面的部落格中我們說過，在載入資料和預處理資料時使用tf.data.Dataset物件將極大將我們從建模前的資料清理工作中釋放出來，那麼，怎麼將自定義的資料集載入為DataSet物件呢？這對很多新手來說都是一個難題，因為絕大多數案例教學都是以

pytorch + visdom AutoEncode 和 VAE(Variational Autoencoder) 處理手寫數字資料集（MNIST）

環境系統：win10 cpu：i7-6700HQ gpu：gtx965m python : 3.6 pytorch ：0.3 資料使用 mnist，使用方法前面文章有。 train_dataset = da

圖片資料集+使用資料+資料預處理

1、The CIFAR-10 dataset 10類，一共含有60000張32*32的彩色圖片，每類大概6000張，測試集大概1000張，5000張訓練集網址：http://www.cs.toronto.edu/~kriz/cifar.html 2、imageNet資料集網址：h

將阿里雲ECS自建Redis資料匯入到阿里云云資料庫Redis

使用AOF檔案進行遷移使用者可以使用 redis-cli 工具，通過AOF檔案將自建Redis遷移到雲資料庫Redis版。 redis-cli 是 Redis 原生的命令列工具。雲資料庫 Redis 版支援通過 redis-cli 將已有的 Redis 資料匯入到雲資料庫 Redis 版裡

【pytorch】自定義讀取資料集，使用txt文字

使用txt文字讀入資料可以減少記憶體的需要，有時候自定義載入資料集是非常必要的，我下面的程式碼是針對影象的，並且帶有label的有監督的影象。先看程式碼： import numpy as np import os import torch.nn as nn from PIL import Ima

pytorch學習：準備自己的圖片資料

圖片資料一般有兩種情況： 1. 所有圖片放在一個資料夾內，另外有一個txt檔案顯示標籤。 2. 不同類別的圖片放在不同的資料夾內，資料夾就是圖片的類別。兩種情況，第一種可以自定義Dataset，第二種情況直接呼叫torchvision.datase

圖片資料集預處理，python

from PIL import Image import random import os import cv2 import shutil #opencv圖旋轉,並擷取 def rotate_crop(image, angle, center=None, scale=1.0,r

TFRecords的建立和讀取——自定義圖片資料的製作

TFRecords檔案的建立和讀取首先是檔案結構，這是我的檔案結構，大家可以自定義檔案位置，但是結構應該如下：首先是主資料夾tensorflow_application/jpg，該資料夾下有兩個次資料夾001和002，001資料夾的下面是一類圖片；002資料

ABAP 動態備份自建表資料到新表（自建表有資料的情況下要改欄位長度或者其他）

當abaper開發好一個程式給使用者使用一段時間後，發現某個欄位的長度需要修改，但資料庫表中已經存在很多資料，冒然直接改表字段可能會導致資料丟失，這種問題的後果可能非常嚴重。所以我想到先複製出一個新表，在新表裡改好欄位長度，然後把舊錶的資料插入到新表，這一步就是備份資料，再修改舊錶的欄位長度，如果舊錶資料丟

雲計算之路-阿裏雲上-容器難容：容器服務故障以及自建 docker swarm 集群故障

故障基本 pos 應用雲上灰色很大的 lead leader 3月21日，由於使用阿裏雲服務器自建 docker swarm 集群的不穩定，我們將自建 docker swarm 集群上的所有應用切換阿裏雲容器服務 swarm 版（非swarm mode）。 3月2

完整實現利用tensorflow訓練自己的圖片資料集

經過差不多一個禮拜的時間的學習，終於把完整的一個利用自己爬取的圖片做訓練資料集的卷積神經網路的實現（基於tensorflow）簡單整理一下思路：獲取資料集（上網爬取，或者直接找公開的圖片資料集） reshape圖片成相同大小（公開資料集一般都是相同sha

深度學習入門專案：用keras構建CNN或LSTM對minist資料集做簡單分類任務

深度學習入門專案：用keras構建CNN或LSTM或RNN對Minist資料集做簡單分類任務參考keras中文文件 ——keras：是一個高階神經網路庫，用 Python 語言寫成，可以執行在 TensorFlow 或者 Theano 之上（即以此為後端）。

圖片資料集讀取

import os import cv2 import numpy as np from tqdm import tqdm def read_image(path): '''讀取路徑下所有子資料夾中的圖片並存入list''' img_list

深度學習（六）——自動生成圖片資料集

最近做了一個漢字驗證碼識別的專案，該專案最大的難點就是資料集的準備。在自己沒有資料集的情況下選擇了自動生成，不過自己生成的資料集訓練出來的模型，只在用自己方法生成的資料上表現比較好，但是在真實資料集上表現比較差，也算是自己為自己踩了一格坑。不過自己生成資料集的經歷，還

資料處理-------利用jieba對資料集進行分詞和統計頻數

一，對txt檔案中出現的詞語的頻數統計再找出出現頻率多的二，程式碼： import re from collections import Counter import jieba def cut_word(datapath): with open(

python資料預處理（抽樣、資料集轉換）

博文：python大規模資料處理技巧之二：機器學習中常用操作（http://blog.csdn.net/asdfg4381/article/details/51725424） 1、資料預處理隨機化操作機器學習中的常用隨機化操作中可以使用random包做不重

圖片資料集擴充

#-*- coding: UTF-8 -*- from PIL import Image import random import os #讀取檔案內的所有,迭代 def read_file_all(data_dir_path,save_dir): for f in

用CNN工具箱對自己的資料集分類

在github上下載了一個Deeplearningtoolbox的工具箱裡面各種deeplearning 很全我用其中的CNN對自己的資料集分類但很麻煩很多地方都得改動 http://download.csdn.net/detail/wd1603926823/9

基於tensorflow 批量修改自己的圖片資料集（附程式碼）

現在網上有很多關於Deeplearning的教程，不過這些教程的資料集都是已經做好的，並且格式名字什麼的都已經整理好了。特別是很多入門的教程都是Mnist 的資料集，這都已經非常的完善了。不過對於想自己製作資料集的小白來說，如何將自己收集的圖片批量轉換為自己需要

pytorch + visdom CNN處理自建圖片資料集

環境

資料下載

資料匯入

建立CNN

相關推薦