Mnist手寫數字識別之CNN實現

阿新 • • 發佈：2019-01-10

Mnist手寫數字識別之CNN實現

最近有點閒，想整一下機器學習，本以為自己程式設計還不錯，想想機器學習也不難，結果被自己啪啪啪的打臉，還疼的不行。

廢話不多說，開始搞事情。

本部落格的主要內容是：通過TF一步一步用卷積神經網路（CNN）實現手寫Mnist數字識別

如果你很牛逼，就不用看我嗶嗶了，我菜鳥一隻，本部落格中涉及到多個方面的知識，有的是引用其他部落格的知識，會給出相應的連線，我就做一個知識的整理者。（ps：應該沒有人整理的有我這麼清楚明瞭吧。）

實驗環境：本程式碼是在win10系統上執行得出的結果，python版本3.6，其他相關的依賴庫和檔案均為2019/1/10截止前最新版本。

目錄結構：

一、TF相關函式的使用介紹；
二、CNN網路模型以及相關實現；
三、執行結果展示；
四、Tensor圖；
五、程式碼實現。

一、TF相關函式使用介紹：

注：下面相關函式的解釋均來自TF的官方文件，配套中文翻譯帶示例。

1.tf.reshape()
在這裡插入圖片描述

在這裡插入圖片描述
2. tf.layers.conv2d()
注：此函式實際上是卷積層函式，對張量進行卷積，此函式對應的是CNN中的卷積層。具體的引數如下：

3. tf.layers.max_pooling2d()
注：此函式的輸入是經過 tf.layers.conv2d() 卷積後的張量，此函式對應的是CNN中的池化層

。

4.tf.layers.dense()
在這裡插入圖片描述

5. tf.layers.dropout()
在這裡插入圖片描述

6. tf.losses.softmax_cross_entropy()
在這裡插入圖片描述

7. tf.metrics.accuracy()
在這裡插入圖片描述

二、CNN網路模型以及相關實現

首先在開始CNN之前，請把這張圖死記硬背記住，因為所有的一切都是圍繞著這張圖來實現的。
在這裡插入圖片描述

接下來就是你需要自己去看著三篇部落格的內容：很重要對後續的程式碼理解，而且圖文並茂，生動形象，逼真到你不要不要的。按照這個順序看，容易理解一些。

1、深入學習卷積神經網路中卷積層和池化層的意義

2、卷積神經網路（一）——卷積、邊緣化與池化層

3、卷積神經網路中卷積、反捲積、池化解析

三、執行結果展示

此結果是訓練了5000次後的模型，準確率還是蠻高的。最後從測試資料集中選取位置在20的影象進行測試。
在這裡插入圖片描述
從上圖可以看出，採用Relu這個啟用函式，剛開始的時候收斂速度非常快，經過幾百步的訓練就可以得到相對於比較高的識別率了。

最後的執行結果如下所示，都預測正確了，準確率達到了96%，你要是有強迫症，你可以訓練20000次，估計正確率能達到98左右，但是前提是你的電腦要牛掰，不然就是漫長的等待：
在這裡插入圖片描述

四、Tensor圖

在這裡插入圖片描述

五、程式碼實現

下面的程式碼寫的很詳細，每一步是幹啥的都寫了，結合上面所說的知識，理解應該不是很難

# -*- coding: UTF-8 -*-
import numpy as np
import tensorflow as tf

# down load and load Mnist library(55000 * 28 * 28)
from tensorflow.examples.tutorials.mnist import input_data

mnist = input_data.read_data_sets('mnist_data', one_hot=True)

# 代表訓練資料, /255. 的目的是其取值範圍在【0,255】
input_x = tf.placeholder(tf.float32, [None, 28 * 28]) / 255.

# 代表的是10個標籤，0,1,2,3....9
output_y = tf.placeholder(tf.int32, [None, 10])

# shape 前面使用-1,能夠自動的對其形狀進行推導
input_x_image = tf.reshape(input_x, [-1, 28, 28, 1])

# 從測試資料集中選取3000個測試資料進行驗證模型,
# 每次都使用這一批相同的測試資料進行測試,能夠保證唯一性
test_x = mnist.test.images[:3000]  # picture
test_y = mnist.test.labels[:3000]  # label

# 建立 CNN 模型
# 構建第一層 CNN 模型,卷積層
cover1 = tf.layers.conv2d(
	inputs=input_x_image,  # shape is [28, 28, 1]
	filters=32,            # 設定卷積深度為32,意思也就是說有32個卷積核
	kernel_size=[5, 5],    # 設定卷積核的大小
	strides=1,             # 設定卷積的步長
	padding="same",        # 進行卷積後,大小不變
	activation=tf.nn.relu  # 使用 Relu 這個啟用函式
)   # [28, 28, 32]

# 構建第一層池化層,作用是對第一層卷積後的結果進行降維,獲得池化大小區域內的單個數據進行填充
pool1 = tf.layers.max_pooling2d(
	inputs=cover1,          # shape [28,28,32]
	pool_size=[2, 2],       # 設定池化層的大小
	strides=2               # 設定池化層的步長
)    # shape [14, 14, 32]

# 構建第二層 CNN 模型,卷積層
cover2 = tf.layers.conv2d(
	inputs=pool1,          # shape is [14, 14, 32]
	filters=64,            # 採用64個卷積核
	kernel_size=[5, 5],    # 設定卷積核的大小
	strides=1,             # 設定卷積的步長
	padding="same",        # 進行卷積後,大小不變
	activation=tf.nn.relu  # 使用 Relu 這個啟用函式
)   # shape [14, 14, 64]

# 構建第二層池化層,作用是對第二層卷積後的結果進行降維,獲得池化大小區域內的單個數據進行填充
pool2 = tf.layers.max_pooling2d(
	inputs=cover2,          # shape [14,14,64]
	pool_size=[2, 2],       # 設定池化層的大小
	strides=2               # 設定池化層的步長
)    # shape [7, 7, 64]

# 展開第二層池化後的資料,使得其維度為一維陣列
flat = tf.reshape(pool2, [-1, 7 * 7 * 64])  # shape [7*7*64]

# 設定全連線層網路,共有 1024 個神經元,並且採用Relu這個啟用函式
dense = tf.layers.dense(inputs=flat, units=1024, activation=tf.nn.relu)

# 為了避免1024個全連線網路神經元出現過擬合,採用Dropout丟棄掉一半的連線,即rate = 0.5
dropout = tf.layers.dropout(inputs=dense, rate=0.5, training=True)

# 定義最後輸出10個節點,因為是0-9的數字,一共10個
logites = tf.layers.dense(inputs=dropout, units=10)  # shape [1*1*10]

# 通過使用 softmax 對所有的預測結果和正確結果進行比較並計算概率,
# 然後再使用交叉熵計算概率密度誤差,也就是我們的損失函式
loss = tf.losses.softmax_cross_entropy(onehot_labels=output_y, logits=logites)

# 採用 Adam 優化器去優化誤差,設定學習率為0.001,能夠更好的進行優化
train_op = tf.train.AdamOptimizer(learning_rate=0.001).minimize(loss)

# 計算正確率,正確率的計算步驟:
# 1、對所有的待檢測資料進行識別並與正確的結果進行判斷,返回bool型別;
# 2、將所有的bool結果進行float操作然後求均值,這個均值就是正確率;
# tf.metrics.accuracy() will return (accuracy,update_op)
accuracy = tf.metrics.accuracy(
	labels=tf.argmax(output_y, axis=1),  # 正確的數字(label)
	predictions=tf.argmax(logites, axis=1)  # 預測的數字(label)
)[1]

with tf.Session() as sess:
	# 初始化區域性和全域性變數
	init = tf.group(tf.global_variables_initializer(), tf.local_variables_initializer())
	sess.run(init)

	# 儲存tensor圖
	tf.summary.FileWriter('./log', sess.graph)

	# 定義一共訓練10000次
	for i in range(5000):
		# 每次的資料從mnist訓練資料集中選取 50 份出來訓練
		batch = mnist.train.next_batch(50)  # get 50 sample

		train_loss, train_op_ = sess.run([loss, train_op], {input_x: batch[0], output_y: batch[1]})

		# 每訓練100次列印一次訓練模型的識別率
		if i % 100 == 0:
			test_accuracy = sess.run(accuracy, {input_x: test_x, output_y: test_y})
			print('Step=%d, Train loss=%.6f, [Test accuracy=%.6f]' % (i, train_loss, test_accuracy))
	
	# 最後一次測試:從測試資料集中選取前 20 張圖片進行識別
	# 1.利用現在的模型進行預測數字,test_output 形狀是[20,10]
	test_output = sess.run(logites, {input_x: test_x[:20]})
	# 2.獲取最大可能性的數字,一維直接返回具體值,二維以上返回下標索引
	inferenced = np.argmax(test_output, 1)
	# 3.列印預測的數字和實際對應的數字
	print('inferenced number:')
	print(inferenced)
	print('Real number:')
	print(np.argmax(test_y[:20], 1))

最後你執行可能需要mnist這個資料集，你自己去百度或者官網下載下來，解壓一下就可以。最後附上我的工程結構圖。
在這裡插入圖片描述

Mnist手寫數字識別之CNN實現

Mnist手寫數字識別之CNN實現最近有點閒，想整一下機器學習，本以為自己程式設計還不錯，想想機器學習也不難，結果被自己啪啪啪的打臉，還疼的不行。廢話不多說，開始搞事情。本部落格的主要內容是：通過TF一步一步用卷積神經網路（CNN）實現手寫Mnist數字識別如果你

Pytorch 快速入門（六）MNIST 手寫數字識別之CNN

接觸過深度學習的朋友對MNIST資料集肯定不陌生。基本上算是玩神經網路裡的“hello,world！”本節基於MNIST資料集，實現CNN學習過程。下面是一個 CNN 最後一層的學習過程, 我們先視覺化看看:MNIST手寫資料首先是資料集下載，為了看看資料集裡究竟是長什麼樣

CNN實現MNIST手寫數字識別

關鍵詞：CNN、TensorFlow、卷積、池化、特徵圖一. 前言本文用TensorFlow實現了CNN(卷積神經網路)的經典結構LeNet-5, 具體CNN的LeNet-5模型原理見《深度學習（四）卷積神經網路入門學習(1)》，講得還是比較清楚的。

Android+TensorFlow+CNN+MNIST 手寫數字識別實現

SkySeraph 2018 Overview 本文系“SkySeraph AI 實踐到理論系列”第一篇，咱以AI界的HelloWord 經典MNIST資料集為基礎，在Android平臺，基於TensorFlow，實現CNN的手寫數字識別。Code here~ Practice Env

MNIST手寫數字識別——CNN

參考：http://www.tensorfly.cn/tfdoc/tutorials/mnist_pros.html 網上已經有很多相關內容的部落格、資料，有很多也寫得挺好的，我也是參考別人的，這裡就不再寫原理上的東西了。附一下我做實驗的程式碼，簡單記錄一下遇到的問題。實

Tensorflow之MNIST手寫數字識別：分類問題（1）

一、MNIST資料集讀取 one hot 獨熱編碼獨熱編碼是一種稀疏向量，其中：一個向量設為1，其他元素均設為0.獨熱編碼常用於表示擁有有限個可能值的字串或識別符號優點： 1、將離散特徵的取值擴充套件到了歐式空間，離散特徵的某個取值就對應歐式空間的某個點　　　　2、機器學習演算法中，

Tensorflow之MNIST手寫數字識別：分類問題（2）

整體程式碼： #資料讀取 import tensorflow as tf import matplotlib.pyplot as plt import numpy as np from tensorflow.examples.tutorials.mnist import input_data mnis

神經網路實現Mnist手寫數字識別筆記

目錄 1.Mnist手寫數字識別介紹 Mnist手寫數字識別是Kaggle上一個很經典的機器學習資料集，裡邊包括55000張訓練資料和10000張圖片的測試資料，每張圖片大小為28*28畫素的單通圖片。該任務為通過機器學習來識別圖片中的

Tensorflow案例5：CNN演算法-Mnist手寫數字識別

學習目標目標應用tf.nn.conv2d實現卷積計算應用tf.nn.relu實現啟用函式計算應用tf.nn.max_pool實現池化層的計算應用卷積神經網路實現影象分類識別應用

OpenCV機器學習：SVM分類器實現MNIST手寫數字識別

0. 開發環境最近機器學習隨著AI人工智慧的興起越來越火，博主想找一些ML的庫來練手。突然想起之前在看Opencv的doc時發現有ML的component，於是心血來潮就開始寫程式碼試試。話不多說，直接進正題。以下我的開發環境配置： -Windows7

TensorFlow程式碼實現（一）[MNIST手寫數字識別]

最簡單的神經網路結構：資料來源準備：資料在之前的文章中分析過了在這裡我們就構造一層神經網路：前提準備：引數： train images：因為圖片是28*28的個數，換算成一維陣列就是784，因此我們定義x = tf.placeholder(tf

TensorFlow實現機器學習的“Hello World”--Mnist手寫數字識別

TensorFlow實現機器學習的“Hello World” 上一篇部落格我們已經說了TensorFlow大概怎麼使用，這次來說說機器學習中特別經典的案例，也相當於是機器學習的“Hello World”，他就是Mnist手寫數字識別，也就是通過訓練機器讓他能看

Tensorflow手寫數字識別之簡單神經網路分類與CNN分類效果對比

用Tensorflow進行深度學習和人工智慧具有開發簡單，建模速度快，準確度高的優點。作為學習影象識別分類的入門，手寫輸入數字識別是個很好的例子。 MNIST包中共有60000個手寫數字筆跡灰度影象作為訓練集，每張手寫數字筆跡圖片均已儲存為28*28畫素，同時還有一個la

PyTorch基礎入門六：PyTorch搭建卷積神經網路實現MNIST手寫數字識別

1）卷積神經網路(CNN)簡介關於什麼是卷積神經網路(CNN)，請自行查閱資料進行學習。如果是初學者，這裡推薦一下臺灣的李巨集毅的深度學習課程。連結就不給了，這些資料網站上隨處可見。值得一提的是，CNN雖然在影象處理的領域具有不可阻擋的勢頭，但是它絕對不僅僅只能用來影

Tensorflow深度學習之七：再談mnist手寫數字識別程式

之前學習的第一個深度學習的程式就是mnist手寫字型的識別，那個時候對於很多概念不是很理解，現在回過頭再看當時的程式碼，理解了很多，現將加了註釋的程式碼貼上，與大家分享。（本人還是在學習Tensorflow的初始階段，如果有什麼地方理解有誤，還請大家不吝指出。）

深度學習之mnist手寫數字識別入門

使用tensorflow框架和python，學習實現簡單的神經網路，並進行調參，程式碼如下： #! /usr/bin/python # -*- coding:utf-8 -*- """ a simple mnist classifier """ from __fut

深度學習入門——利用卷積神經網路實現MNIST手寫數字識別

MNIST（Modified National Institute of Standards and Technology）資料庫是一個大型手寫數字資料庫，通常用於訓練各種影象處理系統。該資料庫還廣泛用於機器學習領域的培訓和測試。它是通過重新打亂來自NIST原始資料集的樣本而

Kaggle競賽丨入門手寫數字識別之KNN、CNN、降維

引言這段時間來，看了西瓜書、藍皮書，各種機器學習演算法都有所瞭解，但在實踐方面卻缺乏相應的鍛鍊。於是我決定通過Kaggle這個平臺來提升一下自己的應用能力，培養自己的資料分析能力。我個人的計劃是先從簡單的資料集入手如手寫數字識別、泰坦尼克號、房價預測，這些目前已經有豐富且成熟的方案可以參考，之後關注未來

Tensorflow實踐 mnist手寫數字識別

model 損失函數兩層最簡 sin test http gif bat minst數據集　　　　tensorflow的文檔中就自帶了mnist手寫數字識別的例子，是一個很經典也比較簡單

tensorflow 基礎學習五：MNIST手寫數字識別

truncate averages val flow one die correct 表示 data MNIST數據集介紹： from tensorflow.examples.tutorials.mnist import input_data # 載入MNIST數據集，

Mnist手寫數字識別之CNN實現