PyTorch搭建神經網路模型，並匯入資料進行訓練

阿新 • • 發佈：2020-12-07

1.PyTorch搭建神經網路模型的四種方法

參考https://www.cnblogs.com/picassooo/p/12817629.html

方法一：torch.nn.Sequential()

torch.nn.Sequential類是torch.nn中的一種序列容器，引數會按照我們定義好的序列自動傳遞下去。

# nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True)
# padding=2, 使輸出的維度不變
# 計算輸出維度 （width - kernel_size + 2*padding）/stride + 1
# 從卷積層 到 全連線層，需要把（32，7，7）結果拉成（32*7*7，1）

import torch.nn as nn
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Sequential(           # input shape (1, 28, 28)
            nn.Conv2d(1, 16, 5, 1, 2),        # output shape (16, 28, 28)
            nn.ReLU(),
            nn.MaxPool2d(2),                  # output shape (16, 14, 14)
        )
        self.conv2 = nn.Sequential(
            nn.Conv2d(16, 32, 5, 1, 2),       # output shape (32, 14, 14)
            nn.ReLU(),
            nn.MaxPool2d(2),                  # output shape (32, 7, 7)
        )
        self.linear = nn.Linear(32*7*7, 10)
 
    def forward(self, x):
        x = self.conv1(x)
        x = self.conv2(x)
        x = x.view(x.size(0), -1)
        output = self.linear(x)
        return output
 
net = Net()
print(net)

執行結果：

注意：這樣做有一個問題，每一個層是沒有名稱，預設的是以0、1、2、3來命名，從上面的執行結果也可以看出。

方法二：torch.nn.Sequential() 搭配 collections.OrderDict()

import torch.nn as nn
from collections import OrderedDict   # OrderedDict是字典的子類，可以記住元素的新增順序
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Sequential(OrderedDict([
            ('conv1', nn.Conv2d(1, 16, 5, 1, 2)),
            ('ReLU1', nn.ReLU()),
            ('pool1', nn.MaxPool2d(2)),
        ]))
        self.conv2 = nn.Sequential(OrderedDict([
            ('conv2', nn.Conv2d(16, 32, 5, 1, 2)),
            ('ReLU2', nn.ReLU()),
            ('pool2', nn.MaxPool2d(2)),
        ]))
        self.linear = nn.Linear(32*7*7, 10)
 
    def forward(self, x):
        x = self.conv1(x)
        x = self.conv2(x)
        x = x.view(x.size(0), -1)
        output = self.linear(x)
        return output
 
net = Net()
print(net)

執行結果：

從上面的結果中可以看出，這個時候每一個層都有了自己的名稱，但是此時需要注意，我們並不能夠通過名稱直接獲取層，依然只能通過索引index，即net.conv1[1] 是正確的，net.conv1['ReLU1']是錯誤的。這是因為torch.nn.Sequential()只支援index訪問。

方法三：torch.nn.Sequential() 搭配 add_module()

import torch.nn as nn
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Sequential()
        self.conv1.add_module('conv1', nn.Conv2d(1, 16, 5, 1, 2))
        self.conv1.add_module('ReLU1', nn.ReLU())
        self.conv1.add_module('pool1', nn.MaxPool2d(2))
 
        self.conv2 = nn.Sequential()
        self.conv2.add_module('conv2', nn.Conv2d(16, 32, 5, 1, 2))
        self.conv2.add_module('ReLU2', nn.ReLU())
        self.conv2.add_module('pool2', nn.MaxPool2d(2))
 
        self.linear = nn.Linear(32*7*7, 10)
 
    def forward(self, x):
        x = self.conv1(x)
        x = self.conv2(x)
        x = x.view(x.size(0), -1)
        output = self.linear(x)
        return output
 
net = Net()
print(net)

執行結果：

方法四

import torch.nn as nn
import torch.nn.functional as F
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(1, 16, 5, 1, 2)
        self.conv2 = nn.Conv2d(16, 32, 5, 1, 2)
        self.linear = nn.Linear(32*7*7, 10)
 
    def forward(self, x):
        x = F.max_pool2d(F.relu(self.conv1(x)), 2)
        x = F.max_pool2d(F.relu(self.conv2(x)), 2)
        output = self.linear(x)
        return output
 
net = Net()
print(net)

執行結果：

2. 構建loss函式，選擇優化方法

optimizer = optim.Adam(net.parameters(), lr=lr)
self.scheduler = optim.lr_scheduler.MultiStepLR(optimizer, milestones=[75, 150], gamma=0.5)
self.criterion = nn.CrossEntropyLoss()

3. 匯入資料（以mnist資料為例）

mnist = input_data.read_data_sets("data/MNIST_data/", one_hot=False)
train_data_images = []
train_data_labels = []
test_data_images = []
test_data_labels = []
 
X_train, y_train = mnist.train.images, mnist.train.labels  # 返回的 X_train 是 numpy 下的 多維陣列，(55000, 784), (55000,)
X_test, y_test = mnist.test.images, mnist.test.labels  # (10000, 784), (10000,)
X_valid, y_valid = mnist.validation.images, mnist.validation.labels  # (5000, 784),(5000, )

train_data_images = np.concatenate((X_train, X_valid), axis=0) #(60000, 784)
train_data_labels = np.concatenate((y_train, y_valid), axis=0) #(60000,)
test_data_images = X_test #(10000, 784)
test_data_labels = y_test #(10000,)
 
#變形
train_data_images = np.reshape(train_data_images, [-1, 1, 28, 28]) #(60000, 1, 28, 28)
test_data_images = np.reshape(test_data_images, [-1, 1, 28, 28]) #(10000, 1, 28, 28)

4.訓練

for epoch in range(epochs):
    #iterate_minibatches（）對train_data_images, train_data_labels批量劃分，shuffle=True，表示亂序
    for data, target in iterate_minibatches(train_data_images, train_data_labels, train_batch_size, shuffle=True):
        optimizer.zero_grad()  # 清除梯度
        output = net(data)
        loss = criterion(output, target)  # 計算誤差
        loss.backward()
        optimizer.step()
        train_loss += loss.item()  # 計算1個epoch的loss和

        pred = torch.max(output, 1)  # max函式會返回兩個tensor，第一個tensor是每行的最大值；第二個tensor是每行最大值的索引。
        train_correct += np.sum(pred[1] == target) # 計算1個epoch的accuracy
        total += target.size(0)


Train_Accuracy = train_correct / total
Train_Loss = train_loss


#def iterate_minibatches(self, inputs, targets, batch_size, shuffle=True):
#     assert len(inputs) == len(targets)
#     if shuffle:
#         indices = np.arange(len(inputs))
#         np.random.shuffle(indices)
#
#     start_idx = None
#     for start_idx in range(0, len(inputs) - batch_size + 1, batch_size):
#         if shuffle:
#             excerpt = indices[start_idx:start_idx + batch_size]
#         else:
#             excerpt = slice(start_idx, start_idx + batch_size)
#         yield inputs[excerpt], targets[excerpt]
#
#     if start_idx is not None and start_idx + batch_size < len(inputs):
#         excerpt = indices[start_idx + batch_size:] if shuffle else slice(start_idx + batch_size, len(inputs))
#         yield inputs[excerpt], targets[excerpt]

5. 測試

for data, target in iterate_minibatches(self.test_x, self.test_y, self.test_batch_size, shuffle=False):
    output = net(data)
    
    loss = criterion(output, target)
    test_loss += loss.item()
    
    pred = torch.max(output, 1)
    test_correct += np.sum(pred[1] == target)
    total += target.size(0)


Test_Accuracy = test_correct / total
Test_Loss = test_loss

6. 儲存模型

model_out_path = "model.pth"
torch.save(net, model_out_path)
print("Checkpoint saved to {}".format(model_out_path))

PyTorch搭建神經網路模型，並匯入資料進行訓練

技術標籤：《動手學深度學習》記錄 1.PyTorch搭建神經網路模型的四種方法參考https://www.cnblogs.com/picassooo/p/12817629.html

建神經網路模型，哪種優化演算法更好？35000次測試告訴你丨圖賓根大學出品

蕭簫發自凹非寺量子位報道 | 公眾號 QbitAI 想要優化自己的神經網路，卻不知道哪種優化器更適合自己？

十分鐘掌握Pytorch搭建神經網路的流程（轉載）

原文連結：https://blog.csdn.net/zkk9527/article/details/88399176 作者：zkk9527 最近發現身邊的一些初學者朋友捧著各種pytorch指南一邊看一邊敲程式碼，到最後反而變成了打字員。

使用Keras建立一個卷積神經網路模型，可對手寫數字進行識別

在過去的幾年裡，影象識別研究已經達到了驚人的精確度。不可否認的是，深度學習在這個領域擊敗了傳統的計算機視覺技術。

MATLAB讀寫txt檔案，並對資料進行二/十/十六進位制轉換（量化）

clear;close all;clc; % 讀取資料txtfileID1 = fopen(\'D:\\設計文件\\dataset1_I.txt\',\'r\');[dat_i]=textscan(fileID1,\'%f\');fclose(fileID1);

pytorch實現對輸入超過三通道的資料進行訓練

案例背景:視訊識別假設每次輸入是8s的灰度視訊,視訊幀率為25fps,則視訊由200幀影象序列構成.每幀是一副單通道的灰度影象,通過pythonb裡面的np.stack(深度拼接)可將200幀拼接成200通道的深度資料.進而送到網路裡面去

Python實現Keras搭建神經網路訓練分類模型教程

我就廢話不多說了，大家還是直接看程式碼吧~ 註釋講解版： # Classifier example import numpy as np

pytorch快速搭建神經網路_Sequential操作

之前用Class類來搭建神經網路 class Neuro_net(torch.nn.Module): \"\"\"神經網路\"\"\" def __init__(self,n_feature,n_hidden_layer,n_output):

pytorch(二) 自定義神經網路模型

我們可以定義一個模型，這個模型繼承自nn.Module類。如果需要定義一個比Sequential模型更加複雜的模型，就需要定義nn.Module模型。

【tensorflow】搭建手寫數字識別神經網路模型：Sequential() / 神經網路類class 兩種方法

MNIST 資料集一共有 7 萬張圖片，都是28x28 畫素點的 0~9 手寫數字，其中6 萬用於訓練，1 萬張用於測試。

【tensorflow】搭建_Fashion資料集_神經網路模型：Sequential() / 神經網路類class 兩種方法

FASHION 資料集一共有 7 萬張圖片，每張圖片都是 28x28 畫素點的灰度值資料，其中 6 萬張用於訓練，1 萬張用於測試。

（pytorch-深度學習系列）pytorch實現自定義網路層，並自設定前向傳播路徑-學習筆記

pytorch實現自定義網路層，並自設定前向傳播路徑-學習筆記 1. 不包含模型引數的自定義網路層

Pytorch實現神經網路的分類方式

本文用於利用Pytorch實現神經網路的分類！！！ 1.訓練神經網路分類模型 import torch

使用 pytorch 建立神經網路擬合sin函式的實現

我們知道深度神經網路的本質是輸入端資料和輸出端資料的一種高維非線性擬合，如何更好的理解它，下面嘗試擬合一個正弦函式，本文可以通過簡單設定節點數，實現任意隱藏層數的擬合。

CentOS7.6安裝KVM，並匯入已有的windows8.1映象

KVM：Kernel-based Virtual Machine的簡稱，是一個開源的系統虛擬化模組，整合在Linux核心各大發行版中，使用Linux自身的排程器進行管理。KVM的虛擬化需要硬體支援（如：Intel VT或者AMD V技術)，是基於硬體的完全虛

TensorFlow 2.0 快速搭建神經網路

tf.keras 是 TensorFlow2 引入的高度封裝框架，可以快速搭建神經網路模型。下面介紹一些常用API，更多內容可以參考官方文件：tensorflow

【tensorflow】tf.keras + class 6 步搭建神經網路

tf.keras + Sequential()可以搭建出上層輸入就是下層輸出的順序網路結構，但是無法寫出一些帶有跳連的非順序網路結構。

pytorch迴圈神經網路RNN從結構原理到應用例項

一、 RNN概述人工神經網路和卷積神經網路的假設前提都是：元素之間是相互獨立的，但是在生活中很多情況下這種假設並不成立，比如你寫一段有意義的話 “遇見一個人只需1秒，喜歡一個人只需3,秒，愛上一個人只需1分鐘

CentOS7搭建本地YUM倉庫，並定期同步阿里雲源

cat /etc/centos-release CentOS Linux release 7.6.1810 (Core) uname -r 3.10.0-957.el7.x86_64 ip a |awk \'NR==9{print $2}\'|awk -F \'/\' \'{print $1}\'

PyTorch教程-3：PyTorch中神經網路的構建與訓練基礎

技術標籤：PyTorch學習筆記pythonpytorch PyTorch 教程系列：https://blog.csdn.net/qq_38962621/category_10652223.html

PyTorch搭建神經網路模型，並匯入資料進行訓練

1.PyTorch搭建神經網路模型的四種方法

方法一：torch.nn.Sequential()

方法二：torch.nn.Sequential() 搭配 collections.OrderDict()

方法三：torch.nn.Sequential() 搭配 add_module()

方法四

2. 構建loss函式，選擇優化方法

3. 匯入資料（以mnist資料為例）

4.訓練

5. 測試

6. 儲存模型

相關推薦