1. 程式人生 > >MNIST資料集簡介

MNIST資料集簡介

MNIST Dataset Introduction

大多數示例使用手寫數字的MNIST資料集。 該資料集包含60,000個用於培訓的示例和10,000個用於測試的示例。 這些數字已經標準化,並以固定大小的影象(28x28畫素)為中心,其值為0到1.為簡單起見,每個影象都被展平並轉換為784個特徵(28 * 28)的一維 numpy陣列)。

Overview

MNIST Digits

Usage

在我們的示例中,我們使用TensorFlow input_data.py指令碼來載入該資料集。 它對於管理和處理我們的資料非常有用:

  • 資料集下載

  • 將整個資料集載入到numpy陣列中:

# Import MNIST
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/tmp/data/", one_hot=True)

# Load data
X_train = mnist.train.images
Y_train = mnist.train.labels
X_test = mnist.test.images
Y_test = mnist.test.labels
  • next_batch函式,可以遍歷整個資料集並僅返回所需的資料集樣本部分(以節省記憶體並避免載入整個資料集)。
# Get the next 64 images array and labels
batch_X, batch_Y = mnist.train.next_batch(64)

Link: http://yann.lecun.com/exdb/mnist/