pytorch讀取自己的csv資料集

阿新 • • 發佈：2022-05-24

自己需要完成一個基於時序訊號資料的自編碼器，但是在讀取資料時遇到了一些困難。資料集（無標籤）由csv檔案構成，每個資料樣本為一個csv檔案，csv檔案中的資料為4列512行。
CSDN同步：pytorch讀取自己的csv資料集

python程式碼

// 重寫dataset類
import os
import torch
import pandas as pd
from torch.utils.data import Dataset
from torch.utils.data import DataLoader

class myDataset(Dataset):
    def __init__(self, data_dir): 
        # data_dir:輸入路徑

        # 讀資料夾下每個資料檔案的名稱
        self.file_name = os.listdir(data_dir)

        self.data_path = []
        # 把每一個檔案的路徑拼接起來
        for index in range(len(self.file_name)):
            self.data_path.append(os.path.join(data_dir, self.file_name[index]))

    def __len__(self):
        return len(self.file_name)

    def __getitem__(self, index):
        # 讀取每一個數據
        data = pd.read_csv(self.data_path[index], header=None)
        # 轉成張量
        data = torch.tensor(data.values)

        return data


// 例項化，讀取資料

in_dir = r"E:\202205\train"
# 讀取資料集
train_dataset = myDataset(data_dir=in_dir)
# 載入資料集
train_iter = DataLoader(train_dataset)

看看讀取的資料的大小和格式

for x in enumerate(train_iter):
	print(x)
    print(type(x))

當index = 0 時的結果為

(0, tensor([[[  5.4378,   5.4378,   5.4378,   5.4378],
         [  5.6137,   5.6137,   5.6137,   5.6137],
         [  5.7855,   5.7855,   5.7855,   5.7855],
         ...,
         [219.6983, 219.6983, 219.6983, 219.6983],
         [214.3309, 214.3309, 214.3309, 214.3309],
         [209.1339, 209.1339, 209.1339, 209.1339]]], dtype=torch.float64))
<class 'tuple'>

對於我來說，tuple不能直接用，需要取出裡面的tensor

    # 取出tuple的第二列
    mydata = x[1]
    print(mydata)
    print(mydata.shape)
    print(type(mydata))

當index = 0時的結果為

tensor([[[  5.4378,   5.4378,   5.4378,   5.4378],
         [  5.6137,   5.6137,   5.6137,   5.6137],
         [  5.7855,   5.7855,   5.7855,   5.7855],
         ...,
         [219.6983, 219.6983, 219.6983, 219.6983],
         [214.3309, 214.3309, 214.3309, 214.3309],
         [209.1339, 209.1339, 209.1339, 209.1339]]], dtype=torch.float64)
torch.Size([1, 512, 4])
<class 'torch.Tensor'>

OK，能得到我想要的東西了。

參考文章:https://blog.csdn.net/qq_42653159/article/details/124511467

PyTorch載入自己的資料集例項詳解

資料預處理在解決深度學習問題的過程中，往往需要花費大量的時間和精力。資料處理的質量對訓練神經網路來說十分重要，良好的資料處理不僅會加速模型訓練，更會提高模型效能。為解決這一問題，PyTorch提供了幾個高效

yolov5-pytorch訓練自己的資料集

技術標籤：pytorch 程式碼下載這個是github的下載地址 git clone https://github.com/ultralytics/yolov5

pytorch讀取自己的csv資料集

自己需要完成一個基於時序訊號資料的自編碼器，但是在讀取資料時遇到了一些困難。資料集（無標籤）由csv檔案構成，每個資料樣本為一個csv檔案，csv檔案中的資料為4列512行。

pytorch實現建立自己的資料集(以mnist為例)

本文將原始的numpy array資料在pytorch下封裝為Dataset類的資料集，為後續深度網路訓練提供資料。

pytorch版CenterNet訓練自己的資料集

CenterNet(Objects as points)已經有一段時間了，之前這篇文章-【目標檢測Anchor-Free】CVPR 2019 Object as Points（CenterNet）中講解了CenterNet的原理，可以回顧一下。

Pytorch 怎麼構建自己的資料集。怎麼重寫官方資料集。

技術標籤：機器學習pytorch深度學習機器學習神經網路影象處理小白記錄，大神勿擾

pytorch 批次遍歷資料集列印資料的例子

我就廢話不多說了，直接上程式碼吧！ from os import listdir import os from time import time

將自己的資料集製作成TFRecord格式教程

在使用TensorFlow訓練神經網路時，首先面臨的問題是：網路的輸入此篇文章，教大家將自己的資料集製作成TFRecord格式，feed進網路，除了TFRecord格式，TensorFlow也支援其他格

C#使用TensorFlow.NET訓練自己的資料集的方法

今天，我結合程式碼來詳細介紹如何使用 SciSharp STACK 的 TensorFlow.NET 來訓練CNN模型，該模型主要實現影象的分類，可以直接移植該程式碼在 CPU 或 GPU 下使用，並針對你們自己本地的影象資料集進行訓練和推理。

object_detection Faster_rcnn win10訓練自己的資料集

https://blog.csdn.net/qq_28019591/article/details/82023949 https://blog.csdn.net/dy_guox/article/details/79111949

Windows版YOLOv4目標檢測實戰：訓練自己的資料集

課程連結：https://edu.51cto.com/course/22982.html 課程演示環境：Windows10; cuda 10.2; cudnn7.6.5; Python3.7; VisualStudio2019; OpenCV3.4

keras-siamese用自己的資料集實現詳解

Siamese網路不做過多介紹，思想並不難，輸入兩個影象，輸出這兩張影象的相似度，兩個輸入的網路結構是相同的，引數共享。

pytorch VGG11識別cifar10資料集(訓練+預測單張輸入圖片操作)

首先這是VGG的結構圖，VGG11則是紅色框裡的結構，共分五個block，如紅框中的VGG11第一個block就是一個conv3-64卷積層：

tensorflow yolov3訓練自己的資料集，詳細教程

這個教程是我在自己學習的過程中寫的，當作一個筆記，寫的比較詳細在github上下載yolov3的tensorflow1.0版本：https://github.com/YunYang1994/tensorflow-yolov3在19年12月，發現網上訓練的教程大部分似乎已經過時了

使用自己的資料集建立神經網路訓練模型

該內容來自---https://blog.csdn.net/weixin_43974748/article/details/89600269 使用Tensorflow建立自己的資料集，並訓練

在機器學習和深度學習中建立屬於自己的資料集

技術標籤：機器學習深度學習python機器學習深度學習 def CreateDataSet(file_path): """ demo :

【Tensorflow】使用tf-keras在InceptionV3上finetune自己的資料集

技術標籤：Keras深度學習tensorflowtensorflowkerasInceptionV3finetune 環境：Ubuntu16.04 LTS Tensorflow-gpu 1.12.0

yolov3訓練自己的資料_YOLOv4 訓練自己的資料集

技術標籤：yolov3訓練自己的資料yolov3訓練自己的資料集yolov4訓練自己的資料yolov4訓練自己的資料集yolov5如何執行自己的資料集yolov5訓練自己的資料

detectron2訓練自己的資料集_目標檢測基於kerasYoloV3訓練自己的資料集

技術標籤：detectron2訓練自己的資料集mask rcnn訓練自己的資料集maskrcnn訓練自己的資料集mmdetection訓練自己的資料ssd目標檢測訓練自己的資料yolov3資料集下載訓練

eriklindernoren的YOLOv3如何使用自己的資料集進行train

eriklindernoren的YOLOv3如何使用自己的資料集進行train 1.data下面資料夾分佈2.修改引數3.使用下面的generate檔案進行一系列txt生成（改檔案放置於custom目錄下）4.train下面修改自己的預設引數

pytorch讀取自己的csv資料集

python程式碼

相關推薦