利用transforms Dataset DataLoader對影象資料進行處理並構建自己的資料集

阿新 • • 發佈：2020-12-24

1. torchvision.transforms

在CV任務中，可以用此對影象進行預處理，資料增強等操作

1.1 Transforms on Image

import torchvision.transforms as transforms
from PIL import Image

img = Image.open('lena.png')
img = img.convert("RGB")
img

在這裡插入圖片描述

width, height = img.size
print(width, height)

132 193

1.1.1 transforms.Resize

把給定的圖片resize到給定的size

size = (100, 100)
transform = transforms.Resize(size=size)
resize_img = transform(img)
resize_img

在這裡插入圖片描述

1.1.2 transforms.CenterCrop

在圖片的中心區域進行裁剪

size = (100, 100)
transform = transforms.CenterCrop(size=size)
centercrop_img = transform(img)
centercrop_img

在這裡插入圖片描述

1.1.3 transforms.RandomCrop

在圖片上隨機一個位置進行裁剪

size = (100, 100)
transform = transforms.RandomCrop(size=size)
randomcrop_img = transform(img)
randomcrop_img

在這裡插入圖片描述

1.1.4 transforms.RandomHorizontalFlip§

以概率為p水平翻轉給定的影象

transform = transforms.RandomHorizontalFlip(p=0.5)
rpf_img = transform(img)
rpf_img

在這裡插入圖片描述

1.1.5 transforms.RandomVerticalFlip§

以概率為p垂直翻轉給定的影象

transform = transforms.RandomVerticalFlip(p=0.5)
rvf_img = transform(img)
rvf_img

在這裡插入圖片描述

1.1.6 transforms.ColorJitter

隨機修改圖片的亮度、對比度和飽和度，常用來進行資料增強

brightness = (1, 10)
contrast = (1, 10)
saturation = (1, 10)
hue = (0.2, 0.4)
transform = transforms.ColorJitter(brightness, contrast, saturation, hue)
colorjitter_img = transform(img)
colorjitter_img

在這裡插入圖片描述

1.1.7 transforms.Grayscale

將影象轉換為灰度影象

transform = transforms.Grayscale()
gary_img = transform(img)
gary_img

在這裡插入圖片描述

1.1.8 transforms.RandomGrayscale

以概率p將影象轉換為灰度影象

transform = transforms.RandomGrayscale(p=0.5)
rg_img = transform(img)
rg_img

在這裡插入圖片描述

1.2 transforms on Tensor

1.2.1 transforms.ToTensor()

將Image轉換為Tensor

transform = transforms.ToTensor()
tensor_img = transform(img)
tensor_img

tensor([[[0.7176, 0.7294, 0.7255,  ..., 0.6627, 0.6549, 0.6627],
         [0.7137, 0.7176, 0.7176,  ..., 0.6510, 0.6510, 0.6549],
         [0.7137, 0.7176, 0.7137,  ..., 0.6392, 0.6431, 0.6353],
         ...,
         [0.9922, 1.0000, 0.9725,  ..., 0.6863, 0.6902, 0.7059],
         [1.0000, 1.0000, 0.9961,  ..., 0.6745, 0.6824, 0.6902],
         [1.0000, 0.9961, 0.9882,  ..., 0.6745, 0.6745, 0.6863]],

        [[0.3843, 0.3922, 0.3922,  ..., 0.3529, 0.3451, 0.3529],
         [0.3765, 0.3804, 0.3804,  ..., 0.3412, 0.3412, 0.3412],
         [0.3765, 0.3804, 0.3804,  ..., 0.3294, 0.3412, 0.3333],
         ...,
         [0.8745, 0.8941, 0.8863,  ..., 0.3294, 0.3490, 0.3647],
         [0.9098, 0.9176, 0.9176,  ..., 0.3216, 0.3373, 0.3490],
         [0.9294, 0.9255, 0.9255,  ..., 0.3216, 0.3294, 0.3412]],

        [[0.2745, 0.2863, 0.2784,  ..., 0.2353, 0.2235, 0.2353],
         [0.2784, 0.2745, 0.2745,  ..., 0.2353, 0.2353, 0.2314],
         [0.2784, 0.2745, 0.2706,  ..., 0.2275, 0.2392, 0.2353],
         ...,
         [0.8706, 0.8824, 0.8627,  ..., 0.2510, 0.2706, 0.2863],
         [0.9216, 0.9176, 0.9059,  ..., 0.2392, 0.2588, 0.2706],
         [0.9451, 0.9333, 0.9255,  ..., 0.2392, 0.2510, 0.2588]]])

1.2.2 transforms.Normalize

input[channel] = (input[channel] - mean[channel]) / std[channel]

transform = transforms.Normalize(mean=(0.5, 0.5, 0.5), std=(0.5, 0.5, 0.5))
img_normal = transform(tensor_img)
img_normal

tensor([[[ 0.4353,  0.4588,  0.4510,  ...,  0.3255,  0.3098,  0.3255],
         [ 0.4275,  0.4353,  0.4353,  ...,  0.3020,  0.3020,  0.3098],
         [ 0.4275,  0.4353,  0.4275,  ...,  0.2784,  0.2863,  0.2706],
         ...,
         [ 0.9843,  1.0000,  0.9451,  ...,  0.3725,  0.3804,  0.4118],
         [ 1.0000,  1.0000,  0.9922,  ...,  0.3490,  0.3647,  0.3804],
         [ 1.0000,  0.9922,  0.9765,  ...,  0.3490,  0.3490,  0.3725]],

        [[-0.2314, -0.2157, -0.2157,  ..., -0.2941, -0.3098, -0.2941],
         [-0.2471, -0.2392, -0.2392,  ..., -0.3176, -0.3176, -0.3176],
         [-0.2471, -0.2392, -0.2392,  ..., -0.3412, -0.3176, -0.3333],
         ...,
         [ 0.7490,  0.7882,  0.7725,  ..., -0.3412, -0.3020, -0.2706],
         [ 0.8196,  0.8353,  0.8353,  ..., -0.3569, -0.3255, -0.3020],
         [ 0.8588,  0.8510,  0.8510,  ..., -0.3569, -0.3412, -0.3176]],

        [[-0.4510, -0.4275, -0.4431,  ..., -0.5294, -0.5529, -0.5294],
         [-0.4431, -0.4510, -0.4510,  ..., -0.5294, -0.5294, -0.5373],
         [-0.4431, -0.4510, -0.4588,  ..., -0.5451, -0.5216, -0.5294],
         ...,
         [ 0.7412,  0.7647,  0.7255,  ..., -0.4980, -0.4588, -0.4275],
         [ 0.8431,  0.8353,  0.8118,  ..., -0.5216, -0.4824, -0.4588],
         [ 0.8902,  0.8667,  0.8510,  ..., -0.5216, -0.4980, -0.4824]]])

1.2.3 transforms.Compose

將多個變換組合在一起

img = Image.open('lena.png')
img = img.convert('RGB')

transform = transforms.Compose([
    transforms.Resize(100),
    transforms.RandomHorizontalFlip(),
    transforms.CenterCrop(64),
    transforms.ToTensor(),
    transforms.Normalize((.5, .5, .5), (.5, .5, .5))
])

img_compose = transform(img)
img_compose.size()

torch.Size([3, 64, 64])

2. torchvision.datasets

用來進行資料載入的，下面以CIFAR-10資料集為例，其中transform表示對資料進行預處理，對應著上面所講

import torchvision

trainset = torchvision.datasets.CIFAR10(
    root='./dataset',  # 資料集下載的地方
    train=True,   # True表示建立訓練集；False表示建立測試集
    download=True, # 如果為true，則從Internet下載資料集。如果已下載資料集，則不會再次下載
    transform=None  # 表示是否對資料進行預處理，None表示不做任何處理
)

3. torch.utils.data.DataLoader

import torch
from torch.utils.data.sampler import SubsetRandomSampler

trainloader = torch.utils.data.DataLoader(
    dataset=trainset,  # 載入torch.utils.data.Dataset物件資料或者是torchvision.datasets中的資料
    batch_size=1, # 每個batch所含樣本的大小
    shuffle=False, # 是否對資料進行打亂
    sampler=SubsetRandomSampler(indices=), # 按指定下標進行取樣，如果此引數被指定，shuffle引數必須為False
    drop_last=False, # 當整個資料集不能整除batch_size，False表示最後一個batch的大小會變小，True表示直接丟棄最後一個batch
    num_workers=0 # 表示載入的時候子程序數
)

4. torch.utils.data.Dataset

from torch.utils.data.dataset import Dataset


# 基本框架
class CustomDataset(Dataset):
    def __init__(self):
    	"""
    	一些初始化過程寫在這裡
    	"""
        # TODO
        # 1. Initialize file paths or a list of file names. 
        pass
    def __getitem__(self, index):
    	"""
    	返回資料和標籤，可以這樣顯示呼叫：
    	img, label = MyCustomDataset.__getitem__(index)
    	"""
        # TODO
        # 1. Read one data from file (e.g. using numpy.fromfile, PIL.Image.open).
        # 2. Preprocess the data (e.g. torchvision.Transform).
        # 3. Return a data pair (e.g. image and label).
        pass
    def __len__(self):
    	"""
    	返回所有資料的數量
    	"""
        # You should change 9 to the total size of your dataset.
        return 9 # e.g. 9 is size of dataset

目前我們有一個關於影象分類的問題，資料結構如下：

在這裡插入圖片描述

其中一個是訓練資料夾，一個測試資料夾，分類的類別數為6個，其中每個資料夾包含很多圖片

如何構建Custom Dataset

分別為訓練集和測試集建立兩個DataFrame檔案，其中DataFrame檔案有兩列，一列是圖片的名字，令一列為標籤

Images	Labels
0.jpg	0
99.jpg	5

構建Custom Dataset

class INTELDataset(Dataset):
    def __init__(self, img_data,img_path,transform=None):
        self.img_path = img_path    # 資料路徑
        self.transform = transform
        self.img_data = img_data  # DaraFrame
        
   
    
    def __getitem__(self, index):
        img_name = os.path.join(self.img_path,self.img_data.loc[index, 'labels'],
                                self.img_data.loc[index, 'Images'])  # 圖片路徑
        image = Image.open(img_name)  # 獲得圖片
        image = image.convert('RGB')
        label = torch.tensor(self.img_data.loc[index, 'labels'])  # 獲得標籤
        if self.transform is not None:
            image = self.transform(image)
        return image, label

    
    
    def __len__(self):
        return len(self.img_data)  # 資料大小

利用transforms Dataset DataLoader對影象資料進行處理並構建自己的資料集

技術標籤：python機器學習計算機視覺深度學習pytorch 1. torchvision.transforms 在CV任務中，可以用此對影象進行預處理，資料增強等操作

對多表進行查詢並知道這個資料是哪張表得出的，同時需要對結果集進行排序等操作

技術標籤：資料庫前言今天做到一個操作：需要對三張不同型別的問題表進行查詢，並且需要得到這個資料是哪種問題，同時需要對時間進行排序

利用FFmpeg對火眼一體攝像機的回撥資料進行處理：YUV轉H264，H264封裝flv，所有輸入都是在記憶體中。

整個工程程式碼下載地址 http://download.csdn.net/download/gongluck93/10175326 Code //#define WIN32_LEAN_AND_MEAN// 從 Windows 頭中排除極少使用的資料

uni-app中使用sqlite對本地快取下資料進行處理最近的學習分析

uni-app中使用sqlite對本地快取下資料進行處理最近的學習分析先分享一個自己參考的文章

Oracle sql function 對資料進行處理

目錄要求用資料庫function實現資料處理身分證字號：開發環境(DEV)至少遮5-8字元byte，使用者測試(UAT)環境之假資料若由測試單位自行編造輸入可不遮。姓名(客戶之姓名、英文姓名、緊急聯絡人、代理人

BigDecimalUtil:對double型別的資料進行處理（加減乘除、四捨五入、型別轉換、比較兩個值的大小）

該工具類所在的包：import java.math.BigDecimal; 專案中使用該工具類的相關程式碼：

AAAI 2021論文：利用深度元學習對城市銷量進行預測

對於線上和線下的零售行業，銷量預測都是一項至關重要的任務，它可以幫助企業更好的預備庫存以及在各個倉庫之間分配商品。特別是在大型購物節期間，強勁的促銷活動將極大地促進消費。然而，可供參考的歷史資料卻非常

對後臺返回的樹行資料進行處理並用el-tree去進行展示

1 <template> 2 <el-tree 3:data=\"datas\" 4node-key=\"code\" 5:highlight-current=\"bmhighlight\"

使用java程式碼將下列介面中的資料進行合併,必須定義初始資料的儲存型別,必須定義結果集的資料型別,寫出實現合併的邏輯過程

public class Test { /*** * 使用java程式碼將下列介面中的資料進行合併,必須定義初始資料的儲存型別,必須定義結果集的資料型別,寫出實現合併的邏輯過程

通過JAVA程式對ORACLE資料庫進行操作並匯出序列（SEQUENCE）

序列的作用序列是指的是序列號生成器（SEQUENCE），可以為表中的行自動生成序列號，產生一組等間隔的數值。不佔用磁碟空間，但是佔用記憶體空間。

一.對影象的resize處理

技術標籤：C++ vs2019影象opencv 一.對影象的resize處理之前學到的一個博主的對影象分塊和合並處理的程式碼是自己define的尺寸大小但是研究的輸入影象可能大小不一定統一，每次都要改就比較麻煩，所以就先re

Java-對返回引數進行處理（parseObject，getJSONArray,getJSONObject）

a代表response返回的結果，獲取欄位reserve3的值，操作程式碼如下： import com.alibaba.fastjson.JSON;

二、opencv對影象的基本處理

通過上一節已經學會了使用OpenCV讀取、顯示、寫入影象等基本操作，有了初步基礎就可以學習更多的影象處理方法。

利用OpenCV中對影象資料進行64F和8U轉換的方式

在OpenCV中很多對資料的運算都需要轉換為64F型別，比如伽瑪變換，這個很明顯要求冪的底數是double型別~

Python利用XGBoost庫，對資料進行分類預測

from sklearn.datasets import load_iris import xgboost as xgb import pandas as pd from xgboost import plot_importance

OpenCV入門基礎操作（三）----利用numpy對影象進行處理

技術標籤：影象處理opencvpython計算機視覺利用numpy對影象進行處理前言一、讀取影象二、修改畫素值程式碼示例總結

Pytorch資料讀取機制(DataLoader)與影象預處理模組(transforms)

Pytorch資料讀取機制(DataLoader)與影象預處理模組(transforms) 1.DataLoader torch.utils.data.DataLoader():構建可迭代的資料裝載器, 訓練的時候，每一個for迴圈，每一次iteration，就是從DataLoader中獲取一個ba

利用卷積對影象進行模糊處理

若cv.imread(\'圖片路徑\') 這個圖片路徑錯了，就會報錯error: (-215:Assertion failed) size.width>0 && size.height>0 in function \'cv::imshow\'

對影象進行資料增強

這是原始影象：　　　　改變影象的光照程度。 def transform_ei(img_arr): def gamma_transform(im_array, gamma):

利用d3.js對QQ群資料進行大資料視覺化分析

對於前段時間流出的QQ群資料大家想必已經有所瞭解了，處理後大小將近100G，多達15億條關係資料（QQ號，群內暱稱，群號，群內許可權，群內性別和年齡）和將近9000萬條群資訊（群號，群名，建立時間，群介紹），這些資

利用transforms Dataset DataLoader對影象資料進行處理並構建自己的資料集

1. torchvision.transforms

1.1 Transforms on Image

1.1.1 transforms.Resize

1.1.2 transforms.CenterCrop

1.1.3 transforms.RandomCrop

1.1.4 transforms.RandomHorizontalFlip§

1.1.5 transforms.RandomVerticalFlip§

1.1.6 transforms.ColorJitter

1.1.7 transforms.Grayscale

1.1.8 transforms.RandomGrayscale

1.2 transforms on Tensor

1.2.1 transforms.ToTensor()

1.2.2 transforms.Normalize

1.2.3 transforms.Compose

2. torchvision.datasets

3. torch.utils.data.DataLoader

4. torch.utils.data.Dataset

相關推薦