pytorch學習：準備自己的圖片資料

阿新 • • 發佈：2018-12-29

圖片資料一般有兩種情況：

1. 所有圖片放在一個資料夾內，另外有一個txt檔案顯示標籤。

2. 不同類別的圖片放在不同的資料夾內，資料夾就是圖片的類別。

兩種情況，第一種可以自定義Dataset，第二種情況直接呼叫torchvision.datasets.ImageFolder處理，具體如下：

一、所有圖片均放在一個資料夾內

以mnist資料集的10000個test為例，先將test集裡面的10000圖片儲存出來，並生著對應的txt標籤檔案。先在當前目錄建立一個空資料夾mnist_test，用於儲存10000張圖片，接著執行程式碼：

import torch
import torchvision
import matplotlib.pyplot as plt
from skimage import io
mnist_test= torchvision.datasets.MNIST(
    ‘./mnist‘, train=False, download=True
)
print(‘test set:‘, len(mnist_test))

f=open(‘mnist_test.txt‘,‘w‘)
for i,(img,label) in enumerate(mnist_test):
    img_path="./mnist_test/"+str(i)+".jpg"
    io.imsave(img_path,img)
    f.write(img_path+‘ ‘+str(label)+‘\n‘)
f.close()

如此，圖片就儲存mnist_test資料夾裡面，並在當前目錄下生成了一個mnist_test.txt檔案，大致如下：

然後就正式開始處理資料：

from torchvision import transforms, utils
from torch.utils.data import Dataset, DataLoader
import matplotlib.pyplot as plt
from PIL import Image


def default_loader(path):
    return Image.open(path).convert(‘RGB‘)


class MyDataset(Dataset):
    def __init__(self, txt, transform=None, target_transform=None, loader=default_loader):
        fh = open(txt, ‘r‘)
        imgs = []
        for line in fh:
            line = line.strip(‘\n‘)
            line = line.rstrip()
            words = line.split()
            imgs.append((words[0],int(words[1])))
        self.imgs = imgs
        self.transform = transform
        self.target_transform = target_transform
        self.loader = loader

    def __getitem__(self, index):
        fn, label = self.imgs[index]
        img = self.loader(fn)
        if self.transform is not None:
            img = self.transform(img)
        return img,label

    def __len__(self):
        return len(self.imgs)

train_data=MyDataset(txt=‘mnist_test.txt‘, transform=transforms.ToTensor())
data_loader = DataLoader(train_data, batch_size=100,shuffle=True)
print(len(data_loader))


def show_batch(imgs):
    grid = utils.make_grid(imgs)
    plt.imshow(grid.numpy().transpose((1, 2, 0)))
    plt.title(‘Batch from dataloader‘)


for i, (batch_x, batch_y) in enumerate(data_loader):
    if(i<4):
        print(i, batch_x.size(),batch_y.size())
        show_batch(batch_x)
        plt.axis(‘off‘)
        plt.show()

二、不同類別圖片放在不同的資料夾內

首先依舊是準備資料，以flowers資料集為例，下載地址為：

http://download.tensorflow.org/example_images/flower_photos.tgz

一共五類，分別放在5個資料夾中，大致如下圖：

路徑為d:/flowers/。那麼處理資料如下：

import torch
import torchvision
from torchvision import transforms, utils
import matplotlib.pyplot as plt

img_data = torchvision.datasets.ImageFolder(‘D:/bnu/database/flower‘,
                                            transform=transforms.Compose([
                                                transforms.Scale(256),
                                                transforms.CenterCrop(224),
                                                transforms.ToTensor()])
                                            )

print(len(img_data))
data_loader = torch.utils.data.DataLoader(img_data, batch_size=20,shuffle=True)
print(len(data_loader))


def show_batch(imgs):
    grid = utils.make_grid(imgs,nrow=5)
    plt.imshow(grid.numpy().transpose((1, 2, 0)))
    plt.title(‘Batch from dataloader‘)


for i, (batch_x, batch_y) in enumerate(data_loader):
    if(i<4):
        print(i, batch_x.size(), batch_y.size())

        show_batch(batch_x)
        plt.axis(‘off‘)
        plt.show()

轉載連結：http://www.bubuko.com/infodetail-2304938.html

pytorch學習：準備自己的圖片資料

圖片資料一般有兩種情況： 1. 所有圖片放在一個資料夾內，另外有一個txt檔案顯示標籤。 2. 不同類別的圖片放在不同的資料夾內，資料夾就是圖片的類別。兩種情況，第一種可以自定義Dataset，第二種情況直接呼叫torchvision.datase

mxnet深度學習實戰：跑自己的資料實驗和一些問題總結

用mxnet跑自己的資料 0 程式碼編譯 git clone https://github.com/dmlc/mxnet.git git clone https://github.com/dmlc/mshadow.git git clone https://gi

pytorch 資料處理：定義自己的資料集合

資料處理版本1 #資料處理 import os import torch from torch.utils import data from PIL import Image import numpy as np #定義自己的資料集合 class D

caffe學習筆記1：轉化自己的資料為（leveldb/lmdb）檔案

環境：ubuntu16.04 CPU 經過千難萬險將環境配置好之後，MNIST資料集也測試過了，MNIST資料集是通過caffe可以直接獲取資料集，如果我們要處理自己的資料的話，我們就需要做一些轉化了，我們的影象資料往往是圖片檔案，jpg，jpeg，pn

Pytorch學習：自定義nn模組——一種搭建複雜網路的途徑

有時候順序化的模型並不能滿足我們搭建複雜網路的需求，這時候就可以使用子類nn.Module來定義一個向前傳播過程。下面的例子中通過自定義模組定義了一個兩層的前向傳播模型： # -*- coding: utf-8 -*- import torch class Two

YOLOV3實戰2：訓練自己的資料集，你不可能出錯！

大家好，我是小p，今天給大家帶來一期用darknet版本YOLO V3訓練自己資料集的教程，希望大家喜歡。歡迎加入物件檢測群813221712討論和交流，進群請看群公告！一、搭建環境搭建環境和驗證環境是否已經正確配置已在YOLOV3實戰1中詳細介紹，請一定

PyTorch學習：動態圖和靜態圖

動態圖和靜態圖目前神經網路框架分為靜態圖框架和動態圖框架，PyTorch 和 TensorFlow、Caffe 等框架最大的區別就是他們擁有不同的計算圖表現形式。 TensorFlow 使用靜態圖，這意味著我們先定義計算圖，然後不斷使用它，而在 PyTorch 中，每次都

PyTorch學習：一個非常簡單的線性迴歸的小例子

import torch import numpy as np from torch.autograd import Variable import matplotlib.pyplot as plt torch.manual_seed(2018) # 讀入資料 x 和 y x

PyTorch學習：引數初始化

Sequential 模型的引數初始化 import numpy as np import torch from torch import nn # 定義一個 Sequential 模型 net1 = nn.Sequential( nn.Linear(2, 4),

pytorch學習：卷積模組介紹程式碼

# -*- coding: utf-8 -*- """ Created on Mon Sep 3 20:24:28 2018 @author: www """ import numpy as np import torch from torch import nn fr

pytorch學習：構建網路模型的幾種方法

利用pytorch來構建網路模型有很多種方法，以下簡單列出其中的四種。假設構建一個網路模型如下：卷積層--》Relu層--》池化層--》全連線層--》Relu層--》全連線層首先匯入幾種方法用到的包： import torch import torch.nn.functional as F

3—YOLO：訓練自己的資料

—————————————————————— 一.製作資料集 1.資料集準備（1）將資料集VOCdevkit2007拷貝到darknet\scripts下（2）VOCdevkit20

R-CNN：使用自己的資料訓練 Faster R-CNN 的 ResNet-50 模型

上次使用 Faster R-CNN 訓練了一個 VGG16 的網路，為了再提升識別的準確率，利用 ResNet 網路在同樣的資料上面訓練了多一次。一、訓練網路（一）下載 ResNet-50 的 prototxt 檔案（二）相關檔案修改 1.cd $FR

SSD目標檢測(3)：使用自己的資料集做預測（詳細說明附原始碼）

前言：上兩章已經詳細介紹了SSD目標檢測(1)：圖片+視訊版物體定位（附原始碼），SSD目標檢測(2)：如何製作自己的資料集（詳細說明附原始碼）。由於SSD框架是開源的程式碼，自然有很多前輩研究後做了改進。我也不過是站在前輩的肩膀上才能完成這篇部落格，在這裡表示

Caffe：如何將圖片資料轉換成lmdb檔案

1 圖片資訊的轉換　　在caffe中經常使用的資料型別是lmdb或leveldb;不是常見的jpg,jpeg,png,tif等格式;因此，需要進行格式轉換，通過輸入你自己的圖片目錄（下有的大量圖片）轉換成一個lmdb庫檔案輸出;這個過程一般由caffe工具conve

[caffe學習筆記]用自己的資料進行訓練和測試

我今天嘗試製作一個自己的訓練資料集，參考薛開宇的學習方式，模仿搭建自己的資料庫。 1.因為我的電腦裡有整個ImageNet_ILSVRC2012的資料集，所以從訓練集ILSVRC2012_img_train中隨便選了兩種：bird和fowl2.生成標籤檔案列表，即生成 t

PyTorch學習：載入模型和引數

pytorch的模型和引數是分開的，可以分別儲存或載入模型和引數。 pytorch有兩種模型儲存方式：一、儲存整個神經網路的的結構資訊和模型引數資訊，save的物件是網路net 二、只儲存神經網路的訓練模型引數，save的物件是net.state_dict() 對應

tensorflow專案學習(1)——訓練自己的資料集並進行物體檢測(object detection)

Tensorflow Object Detection 前言本文主要介紹如何利用官方庫tensorflow/models/research/objection 並通過faster rcnn resnet 101(以及其他)深度學習框架

MVC系列——MVC原始碼學習：打造自己的MVC框架（四：瞭解神奇的檢視引擎）

前言：通過之前的三篇介紹，我們基本上完成了從請求發出到路由匹配、再到控制器的啟用，再到Action的執行這些個過程。今天還是趁熱打鐵，將我們的View也來完善下，也讓整個系列相對完整，博主不希望爛尾。對於這個系列，通過學習原始碼，博主也學到了很多東西，在此還是把博主知道的先發出來，供大家參考。 MVC原

MVC系列——MVC原始碼學習：打造自己的MVC框架（一：核心原理）

前言：最近一段時間在學習MVC原始碼，說實話，研讀原始碼真是一個痛苦的過程，好多晦澀的語法搞得人暈暈乎乎。這兩天算是理解了一小部分，這裡先記錄下來，也給需要的園友一個參考，奈何博主技術有限，如有理解不妥之處，還希望大家斧正，博主感激不盡！ MVC原始碼學習系列文章目錄：一、MVC原理解析最

pytorch學習：準備自己的圖片資料

一、 所有圖片均放在一個資料夾內

二、 不同類別圖片放在不同的資料夾內

相關推薦

一、所有圖片均放在一個資料夾內

二、不同類別圖片放在不同的資料夾內