線性模型和CNN實現MNIST資料集手寫數字辨識

阿新 • • 發佈：2020-09-07

用CNN實現

#1
import torch 
import torch.nn as nn
import torch.nn.functional as F 
#用來製作Dataloader
import torch.utils.data as Data 
import torch.optim as optim
#MNIST資料集哎torchvision裡面
import torchvision

#2
#訓練集一共有60000張圖片 使用小批量梯度下降 batch_size代表一次將64張圖片輸入到神經網路(每張圖片大小是1*28*28)
batch_size = 64
transform = torchvision.transforms.Compose([
    #將MNIST中的資料轉換為tensor
    torchvision.transforms.ToTensor(),
    #切換到標準差分佈
    torchvision.transforms.Normalize((0.1307, ), (0.3081, ))
])

train_data = torchvision.datasets.MNIST('./dataset/mnist/', train= True, transform= transform)
train_loader = Data.DataLoader(train_data, shuffle= True, batch_size= batch_size)
test_date = torchvision.datasets.MNIST('./dataset/mnist/', train= False, transform= transform)
test_loader = Data.DataLoader(test_date, shuffle= False, batch_size= batch_size)

#3
class CNN(nn.Module):
    def __init__(self):
        super(CNN,self).__init__()
        #引數分別是:輸入的維度(一層,灰度圖), 輸出的維度(10層的feature map,用了10個kernel), kernel的大小
        self.conv1 = nn.Conv2d(1,10,5)
        self.conv2 = nn.Conv2d(10,20,5)
        #maxpooling的大小是2(2*2中選取最大的)
        self.pooling = nn.MaxPool2d(2)
        #全連線網路
        self.fc = nn.Linear(320,10)
        
    def forward(self,x):
        #這一步很重要 batch_size是64 訓練集一共有60000張照片 60000%64=32 所以最後一個batch裡只有32張照片 
        batch_size = x.size(0)
        #輸入大小: batch_size*1*28*28 輸出大小: batch_size*10*24*24(10個kernel,28-5+1=24) maxpooling之後: batch_size*10*12*12
        x = F.relu(self.pooling(self.conv1(x)))
        #輸入大小: batch_size*10*12*12 輸出大小: batch_size*20*8*8 maxpooling之後:batch_size*20*4*4
        x = F.relu(self.pooling(self.conv2(x)))
        #輸入大小: batch_size*20*4*4 經過view函式reshape之後: batch_size*320(這也是為什麼Linear(320,10))
        x = x.view(batch_size,-1)
        x = self.fc(x)
        return x
model = CNN()

#4
#使用交叉熵作為損失函式
criterion = nn.CrossEntropyLoss()
#用mini-batch stochastic gradient descent(小批量隨機梯度下降)
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum= 0.5)

#5
def train(epoch):
    running_loss = 0
    for batch_idx, data in enumerate(train_loader):
        inputs, target = data
        #將引數清零
        optimizer.zero_grad()

        outputs = model(inputs)
        loss = criterion(outputs, target)
        loss.backward()
        optimizer.step()
		
        #為了不構建向量圖 取loss.item() 是一個標量
        running_loss += loss.item()
        if batch_idx % 300 ==299:
            print("[%d,%5d] loss: %.3f" % (epoch+1, batch_idx+1, running_loss/300))
            running_loss = 0

#6
def test():
    correct = 0
    total = 0
    #當您確定不會呼叫時，禁用梯度計算對於推斷很有用Tensor.backward()。它將減少原本需要require_grad = True的計算的記憶體消耗。在這種模式下，即使輸入具有require_grad = True，每次計算的結果也將具有 require_grad = False。(來自pytorch文件)
    with torch.no_grad():
        for data in test_loader:
            inputs, labels = data
            outputs = model(inputs)
            #對於每個影象,有10個數字分別預測值,取出10箇中最大的,也就是神經網路預測的最有可能是什麼數字
            _, prediction = torch.max(outputs.data, dim = 1)
            total += labels.size(0)
            correct += (prediction == labels).sum().item()
    print("ACC: %d %%" % (100*correct/total))
    
#7    
if __name__ == '__main__':
    # 設定迴圈次數
    for epoch in range(5):
        train(epoch)
        test()

執行結果

用全連線的Linear模型實現

#1
import torch 
import torch.nn as nn
import torch.nn.functional as F 
import torch.utils.data as Data 
import torch.optim as optim
import torchvision

#2
batch_size = 64 
transform = torchvision.transforms.Compose([
    torchvision.transforms.ToTensor(),
    torchvision.transforms.Normalize((0.1307, ), (0.3081, ))
])

train_data = torchvision.datasets.MNIST('./dataset/mnist/', train= True, transform= transform)
train_loader = Data.DataLoader(train_data, shuffle= True, batch_size= batch_size)
test_date = torchvision.datasets.MNIST('./dataset/mnist/', train= False, transform= transform)
test_loader = Data.DataLoader(test_date, shuffle= False, batch_size= batch_size)

#3(使用全連線的網路)
class Net(torch.nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.l1 = nn.Linear(784, 512)
        self.l2 = nn.Linear(512, 256)
        self.l3 = nn.Linear(256, 128)
        self.l4 = nn.Linear(128, 64)
        self.l5 = nn.Linear(64, 10)

    def forward(self, x):
        x = x.view(-1, 784)
        x = F.relu(self.l1(x))
        x = F.relu(self.l2(x))
        x = F.relu(self.l3(x))
        x = F.relu(self.l4(x))
        # 注意最後一層不做啟用 因為輸出要接到後面的softmax裡面
        return self.l5(x)
model = Net()

#4
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum= 0.5)

#5
def train(epoch):
    running_loss = 0
    for batch_idx, data in enumerate(train_loader):
        inputs, target = data
        optimizer.zero_grad()

        outputs = model(inputs)
        loss = criterion(outputs, target)
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        if batch_idx % 300 ==299:
            print("[%d,%5d] loss: %.3f" % (epoch+1, batch_idx+1, running_loss/300))
            running_loss = 0

#6
def test():
    correct = 0
    total = 0
    with torch.no_grad():
        for data in test_loader:
            inputs, labels = data
            outputs = model(inputs)
            _, prediction = torch.max(outputs.data, dim = 1)
            total += labels.size(0)
            correct += (prediction == labels).sum().item()
    print("ACC: %d %%" % (100*correct/total))
    
#7    
if __name__ == '__main__':
    for epoch in range(5):
        train(epoch)
        test()

線性模型和CNN實現MNIST資料集手寫數字辨識

用CNN實現 #1 import torch import torch.nn as nn import torch.nn.functional as F #用來製作Dataloader

loss曲線 pytorch_PyTorch：MNIST資料集手寫數字識別

技術標籤：loss曲線 pytorch MNIST 包括6萬張28x28的訓練樣本，1萬張測試樣本，很多教程都會對它”下手”幾乎成為一個 “典範”，可以說它就是計算機視覺裡面的Hello World。所以我們這裡也會使用MNIST來進行實

（pytorch-深度學習系列）pytorch實現多層感知機（自動定義模型）對Fashion-MNIST資料集進行分類-學習筆記

pytorch實現多層感知機（自動定義模型）對Fashion-MNIST資料集進行分類匯入模組：

pytorch實現mnist資料集的影象視覺化及儲存

如何將pytorch中mnist資料集的影象視覺化及儲存匯出一些庫 import torch import torchvision

MNIST 資料集分類# 構建簡單的CNN對 mnist 資料集進行分類

這是一篇學習貼。1 import torch 2 import torch.nn as nn 3 import torch.nn.functional as F 4 import torch.optim as optim

Pytorch使用MNIST資料集實現CGAN和生成指定的數字方式

CGAN的全拼是Conditional Generative Adversarial Networks，條件生成對抗網路，在初始GAN的基礎上增加了圖片的相應資訊。

Pytorch使用MNIST資料集實現基礎GAN和DCGAN詳解

原始生成對抗網路Generative Adversarial Networks GAN包含生成器Generator和判別器Discriminator，資料有真實資料groundtruth，還有需要網路生成的“fake”資料，目的是網路生成的fake資料可以“騙過”判別器，讓判

使用 PyTorch 實現 MLP 並在 MNIST 資料集上驗證方式

簡介這是深度學習課程的第一個實驗，主要目的就是熟悉 Pytorch 框架。MLP 是多層感知器，我這次實現的是四層感知器，程式碼和思路參考了網上的很多文章。個人認為，感知器的程式碼大同小異，尤其是用 Pytorch 實現，

pytorch:實現簡單的GAN示例(MNIST資料集)

我就廢話不多說了，直接上程式碼吧！ # -*- coding: utf-8 -*- \"\"\" Created on Sat Oct 13 10:22:45 2018

MNIST資料集轉化為二維圖片的實現示例

本文介紹了MNIST資料集轉化為二維圖片的實現示例，分享給大家，具體如下：

使用tensorflow實現VGG網路,訓練mnist資料集方式

VGG作為流行的幾個模型之一,訓練圖形資料效果不錯，在mnist資料集是常用的入門集資料，VGG層數非常多，如果嚴格按照規範來實現，並用來訓練mnist資料集，會出現各種問題，如，經過16層卷積後，28*28*1的圖片幾乎無法

tensorflow實現殘差網路方式(mnist資料集)

介紹殘差網路是何凱明大神的神作，效果非常好，深度可以達到1000層。但是，其實現起來並沒有那末難，在這裡以tensorflow作為框架，實現基於mnist資料集上的殘差網路，當然只是比較淺層的。

用tensorflow搭建簡單神經網路測試iris 資料集和MNIST 資料集

1.步驟第一步：import 相關模組，如 import tensorflow as tf 第二步：指定輸入網路的訓練集和測試集，如指定訓練集的輸入 x_train 和標籤y_train，測試集的輸入 x_test 和標籤 y_test。

（pytorch-深度學習系列）使用softmax迴歸實現對Fashion-MNIST資料集進行分類-學習筆記

使用softmax迴歸實現對Fashion-MNIST資料集進行分類 import torch from torch import nn from torch.nn import init

Pytorch 之 MNIST 資料集實現（程式碼講解）

技術標籤：深度學習基礎原文連結：https://www.cnblogs.com/cmybky/archive/2004/01/13/12172745.html

MNIST資料集全連線神經網路python實現

技術標籤：演算法的程式碼實現TensorFlow深度學習演算法原理與程式設計實戰讀書筆記pythontensorflow機器學習

【北京大學】9 TensorFlow1.x的實現自定義Mnist資料集

技術標籤：機器學習Pythonpythontensorflowmnist資料集目錄 1 實現把任意圖片放進訓練好的網路進行測試2 實現製作資料2.1 簡介2.2 生成tfrecords檔案2.3 解析tfrecords檔案2.4 生成自定義資料的完整程式碼mni

Pytorch之MNIST資料集的訓練和測試

技術標籤：深度學習神經網路pythonpytorch 訓練和測試的完整程式碼： import torch import torch.nn as nn

深度學習入門-基於Python的理論入門與實現原始碼加mnist資料集下載推薦

深度學習入門-基於Python的理論入門與實現原始碼加mnist資料集下載推薦書籍封面

【Tensorflow】tensorflow和keras+讀取官方版本的MNIST資料集

技術標籤：Tensorflow 1.資料集介紹 tensorflow官方mnist：（放在database2資料夾下面）

線性模型和CNN實現MNIST資料集手寫數字辨識

用CNN實現

用全連線的Linear模型實現

相關推薦