Pytorch資料讀取機制(DataLoader)與影象預處理模組(transforms)

阿新 • • 發佈：2021-07-20

Pytorch資料讀取機制(DataLoader)與影象預處理模組(transforms)

1.DataLoader

torch.utils.data.DataLoader():構建可迭代的資料裝載器, 訓練的時候，每一個for迴圈，每一次iteration，就是從DataLoader中獲取一個batch_size大小的資料的。

Dataloader()引數：

dataset： Dataset類，決定資料從哪讀取(資料路徑)以及如何讀取（做哪些預處理）
batchsize: 批大小
num_works: 是否採用多程序讀取機制
shuffle: 每一個epoch是否亂序
drop_last: 當樣本數不能被batchsize整除時，是否捨棄最後一批資料。

2. Dataset

torch.utils.data.Dataset():Dataset抽象類，所有自定義的Dataset都需要繼承它，並且必須複寫__getitem__()這個類方法。

__getitem__方法的是Dataset的核心，作用是接收一個索引，返回一個樣本，看上面的函式，引數裡面接收index，然後我們需要編寫究竟如何根據這個索引去讀取我們的資料部分。

2.1 ImageFolder

torchvision已經預先實現了常用的Dataset, 其他預先實現的有: torchvision.datasets.CIFAR10, 可以讀取CIFAR-10，以及ImageNet、COCO、MNIST、LSUN等資料集。

ImageFolder假設所有的檔案按資料夾儲存，每個資料夾下儲存同一個類別的圖片，資料夾名為類名，其建構函式如下：

ImageFolder(root, transform=None, target_transform=None, loader=default_loader)

引數：

root: 圖片路徑
transform: 對PIL Image進行的轉換操作，transform的輸入是使用loader讀取圖片的返回物件
target_transform：對label的轉換
loader：給定路徑後如何讀取圖片，預設讀取為RGB格式的PIL Image物件

示例：

資料夾格式：

train_path = r'datasets/myDataSet/train'

預處理格式：

train_transform = transforms.Compose([
    transforms.Resize((40,40)),
    transforms.RandomCrop(40,padding=4),
    transforms.ToTensor(),
    transforms.Normalize([0.485,0.456,0.406],
                         [0.229,0.224,0.225],)
])

dataset:

trainset = ImageFolder(train_path,transform = train_transform)
# print(trainset[30]) # 元組型別，第30號圖片的(畫素資訊，label)

Data.DataLoader:

train_loader = Data.DataLoader(dataset=trainset, batch_size=4,shuffle=False)

for i,(img, target) in enumerate(train_loader):
    print(i)
    print(img.shape) # (batchsize, channel, H, W)
    print(target.shape) # (batch)
    print(target) # 一個batch圖片對應的label

2.2

class myDataset(Data.Dataset):
    def __init__(self, path, transform):
        self.path = path
        self.transform = transform
        self.data_info = self.get_img_info(path)
        self.label = []
        for i in range(len(self.data_info)):
            self.label.append(list(self.data_info[i])[1])

    def __getitem__(self, idx):
        path_img = self.data_info[idx][0]
        label = self.label[idx]
        img = Image.open(path_img).convert('RGB')  # 0~255
        if self.transform is not None:
            img = self.transform(img)  # 在這裡做transform，轉為tensor等等
        return img, label, idx

    def __len__(self):
        return len(self.data_info)

    @staticmethod
    def get_img_info(data_dir):
        data_info = list()
        for root, dirs, _ in os.walk(data_dir):
            # 遍歷類別
            for sub_dir in dirs:
                img_names = os.listdir(os.path.join(root, sub_dir))
                img_names = list(filter(lambda x: x.endswith('.jpg'), img_names))
                # 遍歷圖片
                for i in range(len(img_names)):
                    img_name = img_names[i]
                    path_img = os.path.join(root, sub_dir, img_name)
                    label = int(sub_dir)
                    data_info.append((path_img, int(label)))
        return data_info

trainset = myDataset(train_path, train_transform)

train_loader = Data.DataLoader(dataset=trainset, batch_size=4,shuffle=True)
for i,(img, target, index) in enumerate(train_loader):
    print(i)
    print(img.shape) # (batchsize, channel, H, W)
    print(target.shape) # (batch)
    print(target) # 一個batch的圖片對應的label
    print(index) #  一個batch的圖片在資料集中對應的index

Pytorch資料讀取機制(DataLoader)與影象預處理模組(transforms)

Pytorch資料讀取機制(DataLoader)與影象預處理模組(transforms) 1.DataLoader torch.utils.data.DataLoader():構建可迭代的資料裝載器, 訓練的時候，每一個for迴圈，每一次iteration，就是從DataLoader中獲取一個ba

pytorch 影象預處理之減去均值,除以方差的例項

如下所示： #coding=gbk \'\'\' GPU上面的環境變化太複雜，這裡我直接給出在筆記本CPU上面的執行時間結果

python資料分析處理庫-Pandas資料讀取、索引與計算

_Pandas資料讀取、索引與計算 _ Pandas資料結構為DataFrame，裡面可以同時是int、float、object（string型別時）、datatime、bool資料型別

python實現資料清洗(缺失值與異常值處理)

1。將本地sql檔案寫入mysql資料庫本文寫入的是python資料庫的taob表 source [本地檔案]

Python scipy的二維影象卷積運算與影象模糊處理操作示例

本文例項講述了Python scipy的二維影象卷積運算與影象模糊處理操作。分享給大家供大家參考，具體如下：

keras實現影象預處理並生成一個generator的案例

如下所示：接下來，給出我自己目前積累的程式碼，從目錄中自動讀取影象，併產生generator：

指紋影象預處理

指紋影象預處理是指紋識別的前提,它的好壞直接影響到指紋識別的成敗，但由於指紋影象降質帶來的困難,並根據指紋影象的特徵提出了合理的假設，再根據假設提出了增強指紋影象對比度的演算法、提取指紋有效區

2.影象預處理

1.影象顯示與邊緣處理顏色空間： RGB(紅綠藍)，越疊加越白，色彩值（b，g，r）取值範圍[0,255];[0.0,1.0] CMYK印刷顏色空間，越疊加越黑畫素顏色值：HSV

opencv-python影象預處理記錄

技術標籤：Python 1. image_array = cv2.imread(img_name, -1) if image_array.ndim == 2: image_array = cv2.cvtColor(image_array, cv2.COLOR_GRAY2BGR)

[Python]-torchvision.transforms模組-影象預處理

PyTorch框架中常用torchvision模組來輔助計算機視覺演算法的搭建，transforms用於影象的預處理。

【模型推理】教你用 C++ 實現一般模型推理圖片預處理模組

歡迎關注我的公眾號 [極智視界]，回覆001獲取Google程式設計規範 O_o >_< o_O O_o ~_~ o_O

Pytorch 資料載入與資料預處理方式

資料載入分為載入torchvision.datasets中的資料集以及載入自己使用的資料集兩種情況。

pytorch 影象中的資料預處理和批標準化例項

目前資料預處理最常見的方法就是中心化和標準化。中心化相當於修正資料的中心位置，實現方法非常簡單，就是在每個特徵維度上減去對應的均值，最後得到 0 均值的特徵。

pytorch讀取資料（Dataset, DataLoader, DataLoaderIter）

技術標籤：學習總結pytorch pytorch資料讀取參考資料： pytorch資料讀取 pytorch對nlp資料的處理部落格（以短文字匹配為例） dataloader使用教程部落格 pytorch使用DataLoader對資料集進行批處理簡單示例

關於Pytorch的MNIST資料集的預處理詳解

關於Pytorch的MNIST資料集的預處理詳解 MNIST的準確率達到99.7% 用於MNIST的卷積神經網路（CNN）的實現，具有各種技術，例如資料增強，丟失，偽隨機化等。

pytorch資料預處理錯誤的解決

出錯： Traceback (most recent call last): File \"train.py\",line 305,in <module> train_model(model_conv,criterion,optimizer_conv,exp_lr_scheduler)

Python Numpy中資料的常用儲存與讀取方法

在經常性讀取大量的數值檔案時(比如深度學習訓練資料),可以考慮現將資料儲存為Numpy格式,然後直接使用Numpy去讀取,速度相比為轉化前快很多.

Pytorch資料拼接與拆分操作實現圖解

1、cat：拼接直接合並資料 2、stack拼接：與cat不同的是，stack建立了一個新的維度，在拼接的同時，給資料增加了類別。並且stack的所有資料維度必須一致。

資料讀取與資料分析

一、資料讀取 import pandas as pd train_df = pd.read_csv(\'../input/train_set.csv\', sep=\'\\t\', nrows=100)

NLP-資料讀取與資料分析

Task2 資料讀取與資料分析一、資料讀取 1 import pandas as pd 2 train_df = pd.read_csv(\'./train_set.csv\', sep=\'\\t\')

Pytorch資料讀取機制(DataLoader)與影象預處理模組(transforms)

Pytorch資料讀取機制(DataLoader)與影象預處理模組(transforms)

1.DataLoader

2. Dataset

2.1 ImageFolder

2.2

相關推薦