MNIST資料集簡介
阿新 • • 發佈:2018-12-27
MNIST Dataset Introduction
大多數示例使用手寫數字的MNIST資料集。 該資料集包含60,000個用於培訓的示例和10,000個用於測試的示例。 這些數字已經標準化,並以固定大小的影象(28x28畫素)為中心,其值為0到1.為簡單起見,每個影象都被展平並轉換為784個特徵(28 * 28)的一維 numpy陣列)。
Overview
Usage
在我們的示例中,我們使用TensorFlow input_data.py指令碼來載入該資料集。 它對於管理和處理我們的資料非常有用:
-
資料集下載
-
將整個資料集載入到numpy陣列中:
# Import MNIST from tensorflow.examples.tutorials.mnist import input_data mnist = input_data.read_data_sets("/tmp/data/", one_hot=True) # Load data X_train = mnist.train.images Y_train = mnist.train.labels X_test = mnist.test.images Y_test = mnist.test.labels
- next_batch函式,可以遍歷整個資料集並僅返回所需的資料集樣本部分(以節省記憶體並避免載入整個資料集)。
# Get the next 64 images array and labels
batch_X, batch_Y = mnist.train.next_batch(64)