pytorch實現對輸入超過三通道的資料進行訓練

阿新 • • 發佈：2020-01-15

案例背景:視訊識別

假設每次輸入是8s的灰度視訊,視訊幀率為25fps,則視訊由200幀影象序列構成.每幀是一副單通道的灰度影象,通過pythonb裡面的np.stack(深度拼接)可將200幀拼接成200通道的深度資料.進而送到網路裡面去訓練.

如果輸入影象200通道覺得多,可以對視訊進行抽幀,針對具體場景可以隨機抽幀或等間隔抽幀.比如這裡等間隔抽取40幀.則最後輸入視訊相當於輸入一個40通道的影象資料了.

pytorch對超過三通道資料的載入:

讀取視訊每一幀,轉為array格式,然後依次將每一幀進行深度拼接,最後得到一個40通道的array格式的深度資料,儲存到pickle裡.

對每個視訊都進行上述操作,儲存到pickle裡.

我這裡將火的視訊深度資料儲存在一個.pkl檔案中,一共2504個火的視訊,即2504個火的深度資料.

將非火的視訊深度資料儲存在一個.pkl檔案中,一共3985個非火的視訊,即3985個非火的深度資料.

資料載入

import torch 
from torch.utils import data
import os
from PIL import Image
import numpy as np
import pickle
 
class Fire_Unfire(data.Dataset):
  def __init__(self,fire_path,unfire_path):
    self.pickle_fire = open(fire_path,'rb')
    self.pickle_unfire = open(unfire_path,'rb')
    
  def __getitem__(self,index):
    if index <2504:
      fire = pickle.load(self.pickle_fire)#高*寬*通道
      fire = fire.transpose(2,1)#通道*高*寬
      data = torch.from_numpy(fire)
      label = 1
      return data,label
    elif index>=2504 and index<6489:
      unfire = pickle.load(self.pickle_unfire)
      unfire = unfire.transpose(2,1)
      data = torch.from_numpy(unfire)
      label = 0
      return data,label
    
  def __len__(self):
    return 6489

root_path = './datasets/train'
dataset = Fire_Unfire(root_path +'/fire_train.pkl',root_path +'/unfire_train.pkl')
 
#轉換成pytorch網路輸入的格式(批量大小,通道數,高,寬)
from torch.utils.data import DataLoader
fire_dataloader = DataLoader(dataset,batch_size=4,shuffle=True,drop_last = True)

模型訓練

import torch
from torch.utils import data
from nets.mobilenet import mobilenet
from config.config import default_config
from torch.autograd import Variable as V
import numpy as np
import sys
import time
 
opt = default_config()
def train():
  #模型定義
  model = mobilenet().cuda()
  if opt.pretrain_model:
    model.load_state_dict(torch.load(opt.pretrain_model))
  
  #損失函式
  criterion = torch.nn.CrossEntropyLoss().cuda()
  
  #學習率
  lr = opt.lr
  
  #優化器
  optimizer = torch.optim.SGD(model.parameters(),lr = lr,weight_decay=opt.weight_decay)
  
  
  pre_loss = 0.0
  #訓練
  for epoch in range(opt.max_epoch):
     #訓練資料
    train_data = Fire_Unfire(opt.root_path +'/fire_train.pkl',opt.root_path +'/unfire_train.pkl')
    train_dataloader = data.DataLoader(train_data,batch_size=opt.batch_size,drop_last = True)
    loss_sum = 0.0
    for i,(datas,labels) in enumerate(train_dataloader):
      #print(i,datas.size(),labels)
      #梯度清零
      optimizer.zero_grad()
      #輸入
      input = V(datas.cuda()).float()
      #目標
      target = V(labels.cuda()).long()
      #輸出
      score = model(input).cuda()
      #損失
      loss = criterion(score,target)
      loss_sum += loss
      #反向傳播
      loss.backward()
      #梯度更新
      optimizer.step()      
    print('{}{}{}{}{}'.format('epoch:',epoch,','loss:',loss))
    torch.save(model.state_dict(),'models/mobilenet_%d.pth'%(epoch+370))

RuntimeError: Expected object of scalar type Long but got scalar type Float for argument #2 'target'

解決方案：target = target.long()

以上這篇pytorch實現對輸入超過三通道的資料進行訓練就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

pytorch實現對輸入超過三通道的資料進行訓練

案例背景:視訊識別假設每次輸入是8s的灰度視訊,視訊幀率為25fps,則視訊由200幀影象序列構成.每幀是一副單通道的灰度影象,通過pythonb裡面的np.stack(深度拼接)可將200幀拼接成200通道的深度資料.進而送到網路裡面去

利用pytorch實現對CIFAR-10資料集的分類

步驟如下： 1.使用torchvision載入並預處理CIFAR-10資料集、 2.定義網路 3.定義損失函式和優化器

pytorch:實現簡單的GAN示例(MNIST資料集)

我就廢話不多說了，直接上程式碼吧！ # -*- coding: utf-8 -*- \"\"\" Created on Sat Oct 13 10:22:45 2018

element-ui 選擇元件 el-select遠端搜尋功能，實現對輸入內容長度的限制

技術標籤：element-uiJavaScript 需求如下：遠端搜尋select限制搜尋內容輸入的長度

Django def clean()函式對錶單中的資料進行驗證操作

最近寫的資源策略管理，在ceilometer 中建立alarm時，name要求是不能重複的，所以在建立policy的時候，要對policy的name欄位進行驗證，而django中正好擁有強大的表單資料驗證的功能。

PyTorch搭建神經網路模型，並匯入資料進行訓練

技術標籤：《動手學深度學習》記錄 1.PyTorch搭建神經網路模型的四種方法參考https://www.cnblogs.com/picassooo/p/12817629.html

c++ 實現對結構體中的元素進行操作

#include<iostream> using namespace std; //設計一個結構體，成員包括姓名，性別和年齡

python對醫院2018年銷售資料進行資料分析

一、資料描述 1、資料欄位及解釋購藥時間：朝陽醫院藥物賣出時間社保卡號：每個人的社保卡號

淺析Spring自定義註解+aop實現對實體類的欄位進行校驗

　　API開發中經常會遇到一些對請求資料進行驗證的情況，這時候如果使用註解就有兩個好處：

darknet用自己的資料進行訓練

根據之前部落格的內容自行收集訓練資料集已經成功收集了一波標註好的資料，現在嘗試利用自己的資料對yolo v2模型進行訓練。

pytorch sampler對資料進行取樣的實現

PyTorch中還單獨提供了一個sampler模組，用來對資料進行取樣。常用的有隨機取樣器：RandomSampler，當dataloader的shuffle引數為True時，系統會自動呼叫這個取樣器，實現打亂資料。預設的是採用SequentialSampler，它

（pytorch-深度學習系列）使用softmax迴歸實現對Fashion-MNIST資料集進行分類-學習筆記

使用softmax迴歸實現對Fashion-MNIST資料集進行分類 import torch from torch import nn from torch.nn import init

（pytorch-深度學習系列）pytorch實現多層感知機（自動定義模型）對Fashion-MNIST資料集進行分類-學習筆記

pytorch實現多層感知機（自動定義模型）對Fashion-MNIST資料集進行分類匯入模組：

springMVC如何對輸入資料校驗實現程式碼

前言資料的校驗是互動式網站一個不可或缺的功能，資料驗證分為客戶端驗證和伺服器端驗證。前端的js校驗可以涵蓋大部分的校驗職責，如使用者名稱唯一性，生日格式，郵箱格式校驗等等常用的校驗；但是為了避免使用者繞

Oracle + mybatis實現對資料的簡單增刪改查例項程式碼

什麼是 MyBatis？ MyBatis 是支援普通 SQL 查詢，儲存過程和高階對映的優秀持久層框架。 MyBatis 消除了幾乎所有的 JDBC 程式碼和引數的手工設定以及對結果集的檢索。MyBatis 可以使用簡單的XML 或註解用於配置和原始

pytorch 實現在預訓練模型的 input上增減通道

如何把imagenet預訓練的模型，輸入層的通道數隨心所欲的修改，從而來適應自己的任務

pytorch實現用CNN和LSTM對文字進行分類方式

model.py： #!/usr/bin/python # -*- coding: utf-8 -*- import torch from torch import nn import numpy as np

使用 PyTorch 實現 MLP 並在 MNIST 資料集上驗證方式

簡介這是深度學習課程的第一個實驗，主要目的就是熟悉 Pytorch 框架。MLP 是多層感知器，我這次實現的是四層感知器，程式碼和思路參考了網上的很多文章。個人認為，感知器的程式碼大同小異，尤其是用 Pytorch 實現，

pytorch 實現將自己的圖片資料處理成可以訓練的圖片型別

為了使用自己的影象資料，需要仿照pytorch資料輸入建立新的類，其中資料格式為numpy.ndarray。

pytorch實現mnist資料集的影象視覺化及儲存

如何將pytorch中mnist資料集的影象視覺化及儲存匯出一些庫 import torch import torchvision

pytorch實現對輸入超過三通道的資料進行訓練

相關推薦