PyTorch 自定義 Dataset 及訓練集、測試集劃分方法

阿新 • • 發佈：2020-12-16

例項 1：自定義資料集類，torch.utils.data.random_split() 劃分訓練集和測試集，通過普通遍歷方式使用自定義資料集中的樣本

import numpy as np
import torch
from torch.utils.data import Dataset, DataLoader

random_data = np.random.randn(10,3)
print(random_data)
print("#"*len(random_data))


class MyDataSet(Dataset):
    def 
 __init__(self, loaded_data):
        self.data = loaded_data
    
    def __len__(self):
        return len(self.data)
    
    def __getitem__(self, idx):
        return self.data[idx]
    

custom_dataset = MyDataSet(random_data)

for i in range(len(custom_dataset)):
    print(custom_dataset[i])
    

train_size = 
 int(len(custom_dataset) * 0.7)
test_size = len(custom_dataset) - train_size
train_dataset, test_dataset = torch.utils.data.random_split(custom_dataset, [train_size, test_size])

print(len(train_dataset))
print(len(test_dataset))

print("#"*len(custom_dataset))

for i in range(len(train_dataset) 
):
    print(train_dataset[i])

print("#"*len(train_dataset))
    
for i in range(len(test_dataset)):
    print(test_dataset[i])

輸出：
例項 2：自定義資料集類，torch.utils.data.random_split() 劃分訓練集和測試集，通過 dataloader 方式使用自定義資料集中的樣本

import numpy as np
import torch
from torch.utils.data import Dataset, DataLoader

random_data = np.random.randn(10,3)
print(random_data)
print("#"*len(random_data))


class MyDataSet(Dataset):
    def __init__(self, loaded_data):
        self.data = loaded_data
    
    def __len__(self):
        return len(self.data)
    
    def __getitem__(self, idx):
        return self.data[idx]
    

custom_dataset = MyDataSet(random_data)

for i in range(len(custom_dataset)):
    print(custom_dataset[i])
    

train_size = int(len(custom_dataset) * 0.5)
validate_size = int(len(custom_dataset) * 0.2)
test_size = len(custom_dataset) - validate_size - train_size
train_dataset, validate_dataset, test_dataset = torch.utils.data.random_split(custom_dataset, [train_size, validate_size, test_size])


train_loader = DataLoader(train_dataset, batch_size=1, shuffle=False, num_workers=0)
validate_loader = DataLoader(validate_dataset, batch_size=1, shuffle=False, num_workers=0)
test_loader = DataLoader(test_dataset, batch_size=1, shuffle=False, num_workers=0)

print(len(train_loader))
print(len(validate_loader))
print(len(test_loader))



for i, train_sample in enumerate(train_loader):
    print("{} {}".format(i, train_sample))

    
for j, validate_sample in enumerate(validate_loader):
    print("{} {}".format(j, validate_sample))


for k, test_sample in enumerate(test_loader):
    print("{} {}".format(k, test_sample))

參考

https://pytorch.org/tutorials/recipes/recipes/custom_dataset_transforms_loader.html?highlight=custom%20dataset

PyTorch 自定義 Dataset 及訓練集、測試集劃分方法

技術標籤：PyTorch 基礎例項 1：自定義資料集類，torch.utils.data.random_split() 劃分訓練集和測試集，通過普通遍歷方式使用自定義資料集中的樣本

Python 實現訓練集、測試集隨機劃分

隨機從列表中取出元素： import random dataSet = [[0],[1],[2],[3],[4],[5],[6],[7],[8],[9],[10]]

隨機劃分訓練集、測試集

技術標籤：好用的python小程式只需要把root_path 的路徑修改即可 # -*- coding: utf-8 -*-

訓練集、驗證集、測試集的區別與聯絡

使用隨機森林演算法時用到了交叉驗證，突然陷入沉思，有測試集的情況下用交叉驗證做什麼？整理思路如下：

PyTorch自定義資料載入：深究Dataset與DataLoader類

PyTorch自定義資料載入：深究Dataset與DataLoader類寫在文章開頭資料載入步驟建立Dataset物件建立DataLoader物件迴圈獲取資料用以訓練

Java 自定義註解及使用場景

Java自定義註解一般使用場景為：自定義註解+攔截器或者AOP，使用自定義註解來自己設計框架，使得程式碼看起來非常優雅。

詳解Dubbo無法處理自定義異常及解決方案

問題描述 Dubbo有一個比較奇怪的問題，目前不知道Apache和Alibaba公司出於什麼樣的考慮，貌似一直都沒有一個比較合適的解決方案，問題如下：

Pytorch: 自定義網路層例項

自定義Autograd函式對於淺層的網路，我們可以手動的書寫前向傳播和反向傳播過程。但是當網路變得很大時，特別是在做深度學習時，網路結構變得複雜。前向傳播和反向傳播也隨之變得複雜，手動書寫這兩個過程就會存在很

pytorch自定義二值化網路層方式

任務要求：自定義一個層主要是定義該層的實現函式,只需要過載Function的forward和backward函式即可,如下:

pytorch 自定義引數不更新方式

nn.Module中定義引數：不需要加cuda，可以求導，反向傳播 class BiFPN(nn.Module): def __init__(self,fpn_sizes):

pytorch 自定義卷積核進行卷積操作方式

一卷積操作：在pytorch搭建起網路時，大家通常都使用已有的框架進行訓練，在網路中使用最多就是卷積操作，最熟悉不過的就是

Springboot自定義banner及驗證過程

一什麼是banner 我們在啟動專案的時候控制檯會打印出spring的圖案就是banner。二自定義banner

解決Pytorch自定義層出現多Variable共享記憶體錯誤問題

錯誤資訊: RuntimeError: in-place operations can be only used on variables that don\'t share storage with any other variables,but detected that there are 4 objects sharing it

（八十九）c#Winform自定義控制元件-自定義滾動條（treeview、panel、datagridview、listbox、listview、textbox）

官網 http://www.hzhcontrols.com/ 前提入行已經7,8年了，一直想做一套漂亮點的自定義控制元件，於是就有了本系列文章。

基於C++程式碼的UE4學習（七）—— 自定義事件及觸發Custom Event

今天講解的是自定義事件的觸發（Custom Event）。在藍圖中是這個：我們現在用程式碼來完成自定義事件的觸發。這次我們並不使用GameModeBase類作為中介，而是就使用Trigger類充當中介，我們將其巨集可以定義為E

自定義異常及經驗小結

自定義異常及經驗小結使用Java內建的異常類可以描述在程式設計時出現的大部分異常情況。除此之外，使用者還可以自定義異常。使用者自定義異常類，只需繼承Exception類即可。

Hibernate JPA 各種自定義SQL及返回總結

我的總結基於 spring-data-jpa-2.1.15RELEASE.jar JPA代替mybatis的dao import com.dahuatech.bigfish.project.assignment.entity.AssignmentDO;import org.springframework.data.jpa.repository.JpaRepository;i

java SpringBoot自定義註解,及自定義解析器實現物件自動注入操作

# java-SpringBoot自定義引數解析器實現物件自動注入解析器邏輯流程圖表後臺解析註解的解析器

談談Java中自定義註解及使用場景

Java自定義註解一般使用場景為：自定義註解+攔截器或者AOP，使用自定義註解來自己設計框架，使得程式碼看起來非常優雅。本文將先從自定義註解的基礎概念說起，然後開始實戰，寫小段程式碼實現自定義註解+攔截器，自定

異常03：自定義異常及經驗小結

toString異常的列印資訊程式碼示例： application.java: package com.exception.Test2; public class Application {

PyTorch 自定義 Dataset 及訓練集、測試集劃分方法

參考

相關推薦