pytorch 利用lstm做mnist手寫數字識別分類

阿新 • • 發佈：2019-01-31

程式碼如下，U我認為對於新手來說最重要的是學會rnn讀取資料的格式。

# -*- coding: utf-8 -*-
"""
Created on Tue Oct  9 08:53:25 2018

@author: www
"""

import sys
sys.path.append('..')

import torch
import datetime
from torch.autograd import Variable
from torch import nn
from torch.utils.data import DataLoader

from torchvision import transforms as tfs
from torchvision.datasets import MNIST

#定義資料
data_tf = tfs.Compose([
     tfs.ToTensor(),
     tfs.Normalize([0.5], [0.5])
])
train_set = MNIST('E:/data', train=True, transform=data_tf, download=True)
test_set = MNIST('E:/data', train=False, transform=data_tf, download=True)

train_data = DataLoader(train_set, 64, True, num_workers=4)
test_data = DataLoader(test_set, 128, False, num_workers=4)

#定義模型
class rnn_classify(nn.Module):
     def __init__(self, in_feature=28, hidden_feature=100, num_class=10, num_layers=2):
          super(rnn_classify, self).__init__()
          self.rnn = nn.LSTM(in_feature, hidden_feature, num_layers)#使用兩層lstm
          self.classifier = nn.Linear(hidden_feature, num_class)#將最後一個的rnn使用全連線的到最後的輸出結果
          
     def forward(self, x):
          #x的大小為（batch，1，28,28），所以我們需要將其轉化為rnn的輸入格式（28，batch，28）
          x = x.squeeze() #去掉（batch，1,28,28）中的1，變成（batch， 28,28）
          x = x.permute(2, 0, 1)#將最後一維放到第一維，變成（batch，28,28）
          out, _ = self.rnn(x) #使用預設的隱藏狀態，得到的out是（28， batch， hidden_feature）
          out = out[-1,:,:]#取序列中的最後一個，大小是（batch， hidden_feature)
          out = self.classifier(out) #得到分類結果
          return out
          
net = rnn_classify()
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adadelta(net.parameters(), 1e-1)

#定義訓練過程
def get_acc(output, label):
    total = output.shape[0]
    _, pred_label = output.max(1)
    num_correct = (pred_label == label).sum().item()
    return num_correct / total
    
    
def train(net, train_data, valid_data, num_epochs, optimizer, criterion):
    if torch.cuda.is_available():
        net = net.cuda()
    prev_time = datetime.datetime.now()
    for epoch in range(num_epochs):
        train_loss = 0
        train_acc = 0
        net = net.train()
        for im, label in train_data:
            if torch.cuda.is_available():
                im = Variable(im.cuda())  # (bs, 3, h, w)
                label = Variable(label.cuda())  # (bs, h, w)
            else:
                im = Variable(im)
                label = Variable(label)
            # forward
            output = net(im)
            loss = criterion(output, label)
            # backward
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()

            train_loss += loss.item()
            train_acc += get_acc(output, label)

        cur_time = datetime.datetime.now()
        h, remainder = divmod((cur_time - prev_time).seconds, 3600)
        m, s = divmod(remainder, 60)
        time_str = "Time %02d:%02d:%02d" % (h, m, s)
        if valid_data is not None:
            valid_loss = 0
            valid_acc = 0
            net = net.eval()
            for im, label in valid_data:
                if torch.cuda.is_available():
                    im = Variable(im.cuda())
                    label = Variable(label.cuda())
                else:
                    im = Variable(im)
                    label = Variable(label)
                output = net(im)
                loss = criterion(output, label)
                valid_loss += loss.item()
                valid_acc += get_acc(output, label)
            epoch_str = (
                "Epoch %d. Train Loss: %f, Train Acc: %f, Valid Loss: %f, Valid Acc: %f, "
                % (epoch, train_loss / len(train_data),
                   train_acc / len(train_data), valid_loss / len(valid_data),
                   valid_acc / len(valid_data)))
        else:
            epoch_str = ("Epoch %d. Train Loss: %f, Train Acc: %f, " %
                         (epoch, train_loss / len(train_data),
                          train_acc / len(train_data)))
        prev_time = cur_time
        print(epoch_str + time_str)
        
train(net, train_data, test_data, 10, optimizer, criterion)

pytorch 利用lstm做mnist手寫數字識別分類

程式碼如下，U我認為對於新手來說最重要的是學會rnn讀取資料的格式。 # -*- coding: utf-8 -*- """ Created on Tue Oct 9 08:53:25 2018 @author: www """ import sys sys.path

Keras中將LSTM用於mnist手寫數字識別

import keras from keras.layers import LSTM from keras.layers import Dense, Activation from keras.datasets import mnist from keras.models

GAN學習總結三-Pytorch實現利用GAN進行MNIST手寫數字生成

GAN學習總結三-Pytorch實現利用GAN進行MNIST手寫數字生成前面兩篇部落格分別介紹了GAN的基本概念和理論推導，理論聯絡實際，本節從程式碼的角度理解GAN網路的實現及相關細節,加深自己的理解. 整個實現過程如下: 匯入相關庫 import torch

PyTorch基礎入門六：PyTorch搭建卷積神經網路實現MNIST手寫數字識別

1）卷積神經網路(CNN)簡介關於什麼是卷積神經網路(CNN)，請自行查閱資料進行學習。如果是初學者，這裡推薦一下臺灣的李巨集毅的深度學習課程。連結就不給了，這些資料網站上隨處可見。值得一提的是，CNN雖然在影象處理的領域具有不可阻擋的勢頭，但是它絕對不僅僅只能用來影

Pytorch 快速入門（六）MNIST 手寫數字識別之CNN

接觸過深度學習的朋友對MNIST資料集肯定不陌生。基本上算是玩神經網路裡的“hello,world！”本節基於MNIST資料集，實現CNN學習過程。下面是一個 CNN 最後一層的學習過程, 我們先視覺化看看:MNIST手寫資料首先是資料集下載，為了看看資料集裡究竟是長什麼樣

使用LSTM實現mnist手寫數字分類識別 TensorFlow

RNN做影象識別原理：MNIST資料集中一張圖片資料包含28*28的畫素點。RNN是將一張圖片資料的一行作為一個向量總體輸入一個X中。也就是說，RNN有28個輸入X，一個輸入X有28個畫素點。輸出最後一個結果做為預測值。 TensorFlow入門學習程式碼： # -

pytorch學習：MNIST手寫數字識別程式碼

# -*- coding: utf-8 -*- """ Created on Mon Sep 3 08:38:27 2018 @author: www """ import torch from torch import nn from torchvision.data

深度學習入門——利用卷積神經網路實現MNIST手寫數字識別

MNIST（Modified National Institute of Standards and Technology）資料庫是一個大型手寫數字資料庫，通常用於訓練各種影象處理系統。該資料庫還廣泛用於機器學習領域的培訓和測試。它是通過重新打亂來自NIST原始資料集的樣本而

Tensorflow實踐 mnist手寫數字識別

model 損失函數兩層最簡 sin test http gif bat minst數據集　　　　tensorflow的文檔中就自帶了mnist手寫數字識別的例子，是一個很經典也比較簡單

tensorflow 基礎學習五：MNIST手寫數字識別

truncate averages val flow one die correct 表示 data MNIST數據集介紹： from tensorflow.examples.tutorials.mnist import input_data # 載入MNIST數據集，

Caffe的運行mnist手寫數字識別

而不是所在結果 ack cif sting one efi 打開老規矩，首先附上官方教程：http://caffe.berkeleyvision.org/gathered/examples/mnist.html 1、必要軟件　　因為Caffe中使用的是Linux才能

MNIST手寫數字識別——CNN

參考：http://www.tensorfly.cn/tfdoc/tutorials/mnist_pros.html 網上已經有很多相關內容的部落格、資料，有很多也寫得挺好的，我也是參考別人的，這裡就不再寫原理上的東西了。附一下我做實驗的程式碼，簡單記錄一下遇到的問題。實

Tensorflow之MNIST手寫數字識別：分類問題（1）

一、MNIST資料集讀取 one hot 獨熱編碼獨熱編碼是一種稀疏向量，其中：一個向量設為1，其他元素均設為0.獨熱編碼常用於表示擁有有限個可能值的字串或識別符號優點： 1、將離散特徵的取值擴充套件到了歐式空間，離散特徵的某個取值就對應歐式空間的某個點　　　　2、機器學習演算法中，

Tensorflow之MNIST手寫數字識別：分類問題（2）

整體程式碼： #資料讀取 import tensorflow as tf import matplotlib.pyplot as plt import numpy as np from tensorflow.examples.tutorials.mnist import input_data mnis

基於Keras mnist手寫數字識別---Keras卷積神經網路入門教程

目錄 1、一些說明 2、常量定義 3、工具函式 4、模型定義以及訓練 4.1、匯入庫 4.2、主入口 4.3、主函式 4.3.1、獲取訓練資料 4.3.1、定義模型 4.3.2

【AI實戰】訓練第一個AI模型：MNIST手寫數字識別模型

在上篇文章中，我們已經把AI的基礎環境搭建好了（見文章：Ubuntu + conda + tensorflow + GPU + pycharm搭建AI基礎環境），接下來將基於tensorflow訓練第一個AI模型：MNIST手寫數字識別模型。 MNIST是一個經典的手寫數字資料集，來自美國國家

TensorFlow筆記（1）非線性迴歸、MNIST手寫數字識別

程式 import tensorflow as tf import numpy as np import matplotlib.pyplot as plt # numpy生成200個隨機點，下面這麼寫可以得到200行1列的矩陣 x_data = np.linspace(-0.5,

神經網路實現Mnist手寫數字識別筆記

目錄 1.Mnist手寫數字識別介紹 Mnist手寫數字識別是Kaggle上一個很經典的機器學習資料集，裡邊包括55000張訓練資料和10000張圖片的測試資料，每張圖片大小為28*28畫素的單通圖片。該任務為通過機器學習來識別圖片中的

MNIST手寫數字識別---My way of AI 19

手寫數字的識別相當於是深度學習的helloworld 首先這是一個流行資料集可以從網路下載，也可以直接import from tensorflow.examples.tutorials.mnist import input_data 學這個簡單的神經網路之前我

tensorflow實戰：MNIST手寫數字識別的優化2-代價函式優化，準確率98%

最簡單的tensorflow的手寫識別模型，這一節我們將會介紹其簡單的優化模型。我們會從代價函式，多層感知器，防止過擬合，以及優化器的等幾個方面來介紹優化過程。 1.代價函式的優化：我們可以這樣將代價函式理解為真實值與預測值的差距，我們神經

pytorch 利用lstm做mnist手寫數字識別分類

相關推薦