PyTorch 解決Dataset和Dataloader遇到的問題

阿新 • • 發佈：2020-01-09

今天在使用PyTorch中Dataset遇到了一個問題。先看程式碼

class psDataset(Dataset):
  def __init__(self,x,y,transforms = None):
    super(Dataset,self).__init__()
    self.x = x
    self.y = y
    if transforms == None:
      self.transforms = Compose([Resize((224,224)),ToTensor()])
    else:
      self.transforms = transforms
    
  def __len__(self):
    return len(self.x)
  
  def __getitem__(self,idx):
    img = Image.open(self.x[idx])
    img = self.transforms(img)    
    return img,torch.tensor([[self.y[idx]]])

結果執行時報錯：RuntimeError: invalid argument 0: Sizes of tensors must match except in dimension 0. Got 3 and 1 in dimension 1 at /opt/conda/conda-bld/pytorch_1522182087074/work/torch/lib/TH/generic/THTensorMath.c:2897

Google了一下發現是這樣的：讀入的圖片有些是灰度圖（1個通道），絕大多數是RGB圖片（3通道），也有些是帶透明度的（4通道）

。這導致在讀入後最後一個維度（通道數）不一致（可能是1、3或者4）。

Dataloader在製作batch data時，tensor的shape必須一樣，就報了這個錯誤。解決的方法是：img = img.convert(“RGB”)。完

整程式碼如下：

class psDataset(Dataset):
  def __init__(self,idx):
    img = Image.open(self.x[idx])
    img = img.convert("RGB")
    img = self.transforms(img)    
    return img,torch.tensor([[self.y[idx]]])

以上這篇PyTorch 解決Dataset和Dataloader遇到的問題就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

PyTorch 解決Dataset和Dataloader遇到的問題

今天在使用PyTorch中Dataset遇到了一個問題。先看程式碼 class psDataset(Dataset): def __init__(self,x,y,transforms = None):

PyTorch學習記錄003-Dataset和DataLoader

1.utils.data包括Dataset和DataLoader torch.utils.data.Dataset為抽象類,表示Dataset的抽象類,所有其他資料集都應該進行子類化,所有子類應該override,__len__和__getitem__,前者提供了資料集的大小,後者支援整數索引

PyTorch筆記之Dataset 和 Dataloader

技術標籤：pytorch深度學習 PyTorch筆記之Dataset 和 Dataloader PyTorch筆記之 Dataset 和 Dataloader

Pytorch(五) 使用DataSet和DataLoader資料載入

技術標籤：深度學習深度學習python Pytorch(五) 使用DataSet和DataLoader資料載入記錄一下DataSet和DataLoader的使用

Pytorch Dataset和Dataloader 學習筆記(二)

Pytorch Dataset & Dataloader Pytorch框架下的工具包中，提供了資料處理的兩個重要介面，Dataset 和 Dataloader，能夠方便的使用和按批裝載自己的資料集。

PyTorch之Dataset和TensorDataset

技術標籤：Deep Learning深度學習pytorchtensorflow人工智慧機器學習 Deep Learning系列 @cxx

pytorch的dataset與dataloader解析

整理一下pytorch獲取的流程：建立Dataset物件建立DataLoader物件，裝載有dataset物件

PyTorch自定義資料載入：深究Dataset與DataLoader類

PyTorch自定義資料載入：深究Dataset與DataLoader類寫在文章開頭資料載入步驟建立Dataset物件建立DataLoader物件迴圈獲取資料用以訓練

機器學習-dataset、dataloader的使用（pytorch環境）

Dataset 官方的dataset 例子 import torchvision.datasets from torch.utils.tensorboard import SummaryWriter

3. Dataset、transform和Dataloader的聯立使用

在前兩篇我部落格1.法寶函式、編譯器的初級使用和使用Dataset 和2. tensorboard和 transform的使用中，我分別介紹了 Dataset 和 transform 的簡單使用，並推薦使用了 pytorch 中常用的日誌工具 tensorboard，在本篇

pytorch資料集和資料處理部分dataset自定義、繼承

https://blog.csdn.net/zhenaoxi1077/article/details/80953227 一、資料載入在Pytorch 中，資料載入可以通過自己定義的資料集物件來實現。資料集物件被抽象為Dataset類，實現自己定義的資料集需要繼承Dataset,

Pytorch(1)-載入資料Dataset與DataLoader的使用

1.Dataset和DataLoader基礎知識圖解： 2.Dataset的關注點：　　1.如何獲取每一個數據及其label

Pytorch的mean和std調查例項

如下所示： # coding: utf-8 from __future__ import print_function import copy import click import cv2 import numpy as np

pytorch .detach() .detach_() 和 .data用於切斷反向傳播的實現

當我們再訓練網路的時候可能希望保持一部分的網路引數不變，只對其中一部分的引數進行調整；或者值訓練部分分支網路，並不讓其梯度對主網路的梯度造成影響，這時候我們就需要使用detach()函式來切斷一些分支的反向傳

pytorch:torch.mm()和torch.matmul()的使用

如下所示： torch.mm(mat1,mat2,out=None) → Tensor torch.matmul(mat1,out=None) → Tensor 對矩陣mat1和mat2進行相乘。如果mat1 是一個n×m張量，mat2 是一個 m×p 張量，將會輸出一個 n×p 張量out。

pytorch torch.expand和torch.repeat的區別詳解

1.torch.expand 函式返回張量在某一個維度擴充套件之後的張量，就是將張量廣播到新形狀。函式對返回的張量不會分配新記憶體，即在原始張量上返回只讀檢視，返回的張量記憶體是不連續的。類似於numpy中的broadcast_t

Pytorch中accuracy和loss的計算知識點總結

這幾天關於accuracy和loss的計算有一些疑惑，原來是自己還沒有弄清楚。給出例項

Pytorch實現LSTM和GRU示例

為了解決傳統RNN無法長時依賴問題，RNN的兩個變體LSTM和GRU被引入。 LSTM Long Short Term Memory，稱為長短期記憶網路，意思就是長的短時記憶，其解決的仍然是短時記憶問題，這種短時記憶比較長，能一定程度上解決長

詳細介紹解決vue和jsp結合的方法

emm...實訓後的小組作業是做一個培訓基地的網站，但是老師教了一個學期的jsp後臺..

pytorch:model.train和model.eval用法及區別詳解

使用PyTorch進行訓練和測試時一定注意要把例項化的model指定train/eval，eval（）時，框架會自動把BN和DropOut固定住，不會取平均，而是用訓練好的值，不然的話，一旦test的batch_size過小，很容易就會被BN層導致生成

PyTorch 解決Dataset和Dataloader遇到的問題

相關推薦