python3下tensorflow練習（五）之CNN下的MNIST識別

阿新 • • 發佈：2019-02-07

1. 資料準備

import tensorflow as tf
import tensorflow.examples.tutorials.mnist.input_data as input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

2.建立共享函式

def weight(shape):
    return tf.Variable(tf.truncated_normal(shape, stddev=0.1),
                       name ='W')

def bias(shape):
    return tf.Variable(tf.constant(0.1, shape=shape)
                       , name = 'b')

def conv2d(x, W):
    return tf.nn.conv2d(x, W, strides=[1,1,1,1], 
                        padding='SAME')

def max_pool_2x2(x):
    return tf.nn.max_pool(x, ksize=[1,2,2,1], 
                          strides=[1,2,2,1], 
                          padding='SAME')

tf.truncated_normal(shape, mean=0.0, stddev=1.0, dtype=tf.float32, seed=None, name=None)
引用：https://blog.csdn.net/u013713117/article/details/65446361
從截斷的正態分佈中輸出隨機值。 
生成的值服從具有指定平均值和標準偏差的正態分佈，如果生成的值大於平均值2個標準偏差的值則丟棄重新選擇。

在正態分佈的曲線中，橫軸區間（μ-σ，μ+σ）內的面積為68.268949%。 
橫軸區間（μ-2σ，μ+2σ）內的面積為95.449974%。 
橫軸區間（μ-3σ，μ+3σ）內的面積為99.730020%。 
X落在（μ-3σ，μ+3σ）以外的概率小於千分之三，在實際問題中常認為相應的事件是不會發生的，基本上可以把區間（μ-3σ，μ+3σ）看作是隨機變數X實際可能的取值區間，這稱之為正態分佈的“3σ”原則。 
在tf.truncated_normal中如果x的取值在區間（μ-2σ，μ+2σ）之外則重新進行選擇。這樣保證了生成的值都在均值附近。

引數:
shape: 一維的張量，也是輸出的張量。
mean: 正態分佈的均值。
stddev: 正態分佈的標準差。
dtype: 輸出的型別。
seed: 一個整數，當設定之後，每次生成的隨機數都一樣。
name: 操作的名字。

3.輸入層 Input Layer

with tf.name_scope('Input_Layer'):
    x = tf.placeholder("float",shape=[None, 784]
                       ,name="x")    
    x_image = tf.reshape(x, [-1, 28, 28, 1])

4.卷積層1

with tf.name_scope('C1_Conv'):
    W1 = weight([5,5,1,16])
    b1 = bias([16])
    Conv1=conv2d(x_image, W1)+ b1
    C1_Conv = tf.nn.relu(Conv1 )

with tf.name_scope('C1_Pool'):
    C1_Pool = max_pool_2x2(C1_Conv)

5.卷積層2

with tf.name_scope('C2_Conv'):
    W2 = weight([5,5,16,36])
    b2 = bias([36])
    Conv2=conv2d(C1_Pool, W2)+ b2
    C2_Conv = tf.nn.relu(Conv2)

with tf.name_scope('C2_Pool'):
    C2_Pool = max_pool_2x2(C2_Conv)

6.全連線層

with tf.name_scope('D_Flat'):
    D_Flat = tf.reshape(C2_Pool, [-1, 1764])#7*7*56=1766

with tf.name_scope('D_Hidden_Layer'):
    W3= weight([1764, 128])
    b3= bias([128])
    D_Hidden = tf.nn.relu(
                  tf.matmul(D_Flat, W3)+b3)
    D_Hidden_Dropout= tf.nn.dropout(D_Hidden, ####若在結構上不定義keep_prob,則需要在結構中定義keep_prob = tf.placeholder(tf.float32)，###在session()中用feed_dict()喂引數進去
                                keep_prob=0.8)####在結構上直接定義引數大小，直接賦值

7.輸出層Output

with tf.name_scope('Output_Layer'):
    W4 = weight([128,10])
    b4 = bias([10])
    y_predict= tf.nn.softmax(
                 tf.matmul(D_Hidden_Dropout,
                           W4)+b4)

8.設定訓練模型最優化步驟（反向傳播更新引數）

with tf.name_scope("optimizer"):
    
    y_label = tf.placeholder("float", shape=[None, 10], 
                              name="y_label")
    
    loss_function = tf.reduce_mean(
                      tf.nn.softmax_cross_entropy_with_logits
                         (logits=y_predict , 
                          labels=y_label))
    
    optimizer = tf.train.AdamOptimizer(learning_rate=0.0001) \
                    .minimize(loss_function)
    saver_path=saver.save(sess, "saveModel/CNN_model1)##儲存模型

9.評估模型準確率

with tf.name_scope("evaluate_model"):
    correct_prediction = tf.equal(tf.argmax(y_predict, 1),
                                  tf.argmax(y_label, 1))
    accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))

10.訓練模型

trainEpochs = 30##30個週期，每個週期對訓練的樣本55000樣本進行訓練
batchSize = 100#批尺寸100
totalBatchs = int(mnist.train.num_examples/batchSize)##55000/100=550
epoch_list=[];accuracy_list=[];loss_list=[];
from time import time
startTime=time()
sess = tf.Session()
sess.run(tf.global_variables_initializer())

for epoch in range(trainEpochs):

    
    for i in range(totalBatchs):
        batch_x, batch_y = mnist.train.next_batch(batchSize)
        sess.run(optimizer,feed_dict={x: batch_x,
                                      y_label: batch_y})
        
    
    loss,acc = sess.run([loss_function,accuracy],
                        feed_dict={x: mnist.validation.images, 
                                   y_label: mnist.validation.labels})

    epoch_list.append(epoch)
    loss_list.append(loss);accuracy_list.append(acc)    
    
    print("Train Epoch:", '%02d' % (epoch+1), \
          "Loss=","{:.9f}".format(loss)," Accuracy=",acc)
    
duration =time()-startTime
print("Train Finished takes:",duration)

訓練結果：

11.視覺化cost和acc:

%matplotlib inline
import matplotlib.pyplot as plt
plt.plot(epoch_list, accuracy_list,label="accuracy" )
fig = plt.gcf()
fig.set_size_inches(4,2)
plt.ylim(0.8,1)
plt.ylabel('accuracy')
plt.xlabel('epoch')
plt.legend()
plt.show()

fig = plt.gcf()
fig.set_size_inches(4,2)
plt.plot(epoch_list, loss_list, label = 'loss')
plt.ylabel('loss')
plt.xlabel('epoch')
plt.legend(['loss'], loc='upper left')

12.儲存模型

saver = tf.train.Saver()##session()上面
#save_path = saver.save(sess, "saveModel/CNN_model1")這句話寫在session()裡面
merged = tf.summary.merge_all()
train_writer = tf.summary.FileWriter('log/CNN',sess.graph)

13.載入模型和做出預測

saver = tf.train.Saver()
  with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    saver.restore(sess,"saveModel/CNN_model1")
    y_predict=sess.run(y_predict, feed_dict={x: xxxxx})###做出預測傳入要預測的圖片xxxxx
    print('test accuracy %g' % accuracy.eval(feed_dict={###列印訓練好的模型和測試集相比的準確率
        x: mnist.test.images, y_label: mnist.test.labels, keep_prob: 1.0}))

python3下tensorflow練習（五）之CNN下的MNIST識別

1. 資料準備import tensorflow as tf import tensorflow.examples.tutorials.mnist.input_data as input_data mnist = input_data.read_data_sets("MNIS

python3下tensorflow練習（一）

1.瞭解tensorflow基本架構2.用梯度下降的方法訓練處模型3.視覺化樣本資料，視覺化訓練出的模型以及視覺化損失函式""" Created on Wed May 2 09:40:08 2018 @author: jiangcheng """ import tens

python3下tensorflow練習（二）

MNIST手寫字識別流程：1、將要識別的圖片轉為灰度圖，並且轉化為784矩陣（單通道，每個畫素範圍0-255，0為黑色，255為白色，這一點與MNIST中的正好相反）2、將28*28的矩陣轉換成1維矩陣[[784]]（也就是把第2,3,4,5....行矩陣紛紛接入到第一行的後

Tensorflow（五）使用CNN對MNIST資料集進行分類

在tensorflow（二）中對MNIST資料集進行分類使用單層神經網路，梯度下降法以0.2的學習因子迭代了100次取得了92%的準確率，這個網路很簡單，使用較大的學習因子也不會出現梯度爆炸或者梯度消失的情況，但是在複雜些的網路，比如這裡用到的三層CNN網路使用0.2的學習因

Maven（五）之Maven配置阿裏雲鏡像飛快下jar包

png 技術分享 jar包世界包導入 ont 全世界需要 XML 用過Maven的人都知道Maven對於依賴的管理讓我們程序員從此遠離了自己去在項目中把需要的jar包導入到項目中，但是因為中央倉庫是在國外的，所以在我們從中央倉庫下載依賴的時候，我們發現下載速度真的

Tensorflow實戰（五）經典卷積神經網路之實現VGGNet

演算法原理： VGGNet探索了卷積神經網路深度與其效能之間的關係，通過反覆的堆疊3*3的小型卷積核和2*2的最大池化層，VGGNet成功的構建了16-19層深的卷積神經網路。。 VGGNet擁有5段卷積，每一段內有2-3個卷積層，同時尾部會連線一

Java多執行緒知識點總結——進階篇（五）之多執行緒下的單例模式

餓漢式餓漢式多執行緒和單執行緒的程式碼是一樣的，如下： class Single { private static final Single s = new Single(); p

python爬蟲從入門到放棄（五）之正則的基本使用

語言代碼例子 name 添加 iter ima 制表符 imp things 什麽是正則表達式正則表達式是對字符串操作的一種邏輯公式，就是事先定義好的一些特定字符、及這些特定字符的組合，組成一個“規則字符”，這個“規則字符” 來表達對字符的一種過濾邏輯。正則並不是

mysql基礎（五）之pymysql

none set python 導入 char span import mysql pre pymysql模塊： pip3 install pymysql -i https://pypi.douban.com/simple Python模塊：對數據庫進行

tensorflow筆記（一）之基礎知識

Python練習（五）

階乘Python練習（五）求1到5的階乘之和，即求1的階乘、2的階乘、3的階乘、4的階乘、5的階乘，最後加起來求和。1的階乘：1*1=12的階乘：1*2=23的階乘：1*2*3=64的階乘：1*2*3*4=245的階乘：1*2*3*4*5=120最後之和應為153程序實現代碼：n = 5 sum = 1 co

JavaWeb（五）之JSTL標簽庫

ron 數據庫連接導入jar 作用域 .text 字符串操作 p標簽異常讀取前言　　前面介紹了EL表達式，其實EL表達式基本上是和JSTL核心標簽庫搭配一起使用才能發揮效果的。接下來讓我們一起來認識一下吧！　　在之前我們學過在JSP頁面上為了不使用腳本，所以

【轉】Spring MVC系列（五）之自定義數據綁定---HandlerMethodArgumentResolver

開閉 src pat 獲取參數 mvc .net 定義開閉原則淺析介紹前面幾節我們介紹了Spring MVC的幾種常見的數據綁定的方法，可以靈活地獲取用戶請求中的參數，例如@PathVariable，@ModelAttribute，@RequestPar

Java常用類（五）之集合工具類Collections

可變集合並發 nts oid element 出現的次數 ole 最小概述前言　　　Java提供了一個操作Set、List和Map等集合的工具類：Collections，該工具類提供了大量方法對集合進行排序、查詢和修改等操作，　　　　還提供了將集合對象置為不可

Pyhton編程（五）之基本數據類型-列表、元組、字典

rem 返回 type for tro 重復 class 數字循環一：列表（list）　　列表是由一系列按特定順序排列的元素組成，可以創建包含字母表中的所有字母、數字、或中文的列表，也可以將任何東西加入列表中，其中的元素之間可以沒有任何關系。　　在Python中，用

linux壓縮命令（五）之tar總結

tar linux tar linux壓縮 tar支持打包和壓縮，支持目錄和文件，使用linux上使用比較廣泛的壓縮工具tar打包：tar -cvf 171210.tar ? ../d6z/打包一個目錄，格式是先打包後的文件名，打包的目錄，如果打包後的文件名存在，會直接覆蓋而不提示tar -xvf

Shell練習（五）

strong -c shell 打印 color 單詞 root 參考答案 sed 習題1：刪除文本中的字母要求：把一個文本文檔的前5行中包含字母的行刪除掉，同時把6到10行中的全部字母刪除掉（文件1.txt，行數大於10行）參考答案：#!/bin/bash #date:2

Python入門篇（五）之文件操作和字符編碼

Python 文件操作和字符編碼 1、文件操作 1、文件操作流程：打開文件，得到文件句柄並賦值給一個變量===> file = open("yesterday",encoding="utf-8") 通過句柄對文件進行操作關閉文件 ==> file.close() 1.2、打開文件的

04_web基礎（五）之cookie與session

blog 輸出 import inter 會話跟蹤問題 odi close 成功 29.Http協議無記憶帶來的問題　　什麽是會話:可簡單理解為：用戶開一個瀏覽器，訪問某一個web站點，在這個站點點擊多個超鏈接，訪問服務器多個web資源，然後關閉瀏覽器，整個過程稱之為一

PHP常見概念混淆（五）之PHP類常量、靜態屬性和屬性的區別

sta 支持 php5 中英文對照 ext static block 簡介無法最近在看手冊的時候發現PHP有好些個坑，一不註意就會掉進去，邊看邊將這些容易混淆的內容記載下來。 tips:看手冊的時候最好中英文對照著看，因為英文手冊上有好些個中文手冊沒有的東西（最新的P

python3下tensorflow練習（五）之CNN下的MNIST識別

相關推薦