TensorFlow之MNIST 分類以及Dropout的使用

阿新 • • 發佈：2018-11-10

一、簡單的一層神經網路

import tensorflow as tf
#下載MNIST資料集（28*28，輸入維度為784）
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets('MNIST_data', one_hot=True)

#構建簡單的一層神經網路，包括常見引數weights、biases和activation_function
#首先定義新增神經層的函式def add_layer(),它有四個引數：輸入值、輸入的大小、輸出的大小和激勵函式
def add_layer(inputs,in_size,out_size,activation_function = None): 
#定義weights和biases，weight為隨機變數(variable)
    Weights = tf.Variable(tf.random_normal([in_size,out_size]))#矩陣大小為in_size*out_size
    biases = tf.Variable(tf.zeros([1,out_size])+0.1)#biases不為0，加上任意一個小數值
#定義Wx_plus_b, 即神經網路未啟用的值
    Wx_plus_b = tf.matmul(inputs,Weights) + biases
    if activation_function is None:
        outputs = Wx_plus_b
    else:
        outputs = activation_function(Wx_plus_b)
    return outputs

#定義一個計算準確率的函式
def compute_accuracy(v_xs, v_ys):
    global prediction
    y_pre = sess.run(prediction, feed_dict={xs: v_xs})
    correct_prediction = tf.equal(tf.argmax(y_pre,1), tf.argmax(v_ys,1))
    accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))
    result = sess.run(accuracy, feed_dict={xs: v_xs, ys: v_ys})
    return result



# 定義placeholder存放資料
xs = tf.placeholder(tf.float32, [None, 784])
ys = tf.placeholder(tf.float32, [None, 10])



#用add_layer函式搭建一個最簡單的訓練網路結構，只有輸入層和輸出層
prediction = add_layer(xs, 784, 10, activation_function=tf.nn.softmax)



#損失函式(cross_entropy)和優化方法
cross_entropy = tf.reduce_mean(-tf.reduce_sum(ys*tf.log(prediction),
                     reduction_indices=[1]))
train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)



#session會話控制
sess = tf.Session()
sess.run(tf.global_variables_initializer())
#訓練1000次，每訓練50次輸出測試資料的訓練精度
for i in range(1000):
    #開始訓練，訓練集中每次取100個數據（batch_xs, batch_ys）
    batch_xs, batch_ys = mnist.train.next_batch(100)
    sess.run(train_step, feed_dict={xs: batch_xs, ys: batch_ys})#placeholder和feed_dict同時出現
    if i%50 == 0:
        print(compute_accuracy( mnist.test.images, mnist.test.labels))

結果為：

二、Dropout的使用

1.Dropout指部分神經元的啟用值以一定的概率p暫停工作，在這次訓練過程中不更新權值，但它的權值仍保留。

2. tf.nn.dropout

tf.nn.dropout(x, keep_prob, noise_shape=None, seed=None,name=None)

keep_prob為保留概率，即我們要保留的結果所佔比例

它作為一個placeholder，在run時傳入，一般用於全連線層。

下面在前面的程式碼的基礎上加上dropout，需要改動的地方如下

import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets('MNIST_data', one_hot=True)

在def layer時增加一行 Wx_plus_b = tf.nn.dropout(Wx_plus_b, keep_prob)

其餘不變

def add_layer(inputs,in_size,out_size,activation_function = None): 
    Weights = tf.Variable(tf.random_normal([in_size,out_size]))
    biases = tf.Variable(tf.zeros([1,out_size])+0.1)
    Wx_plus_b = tf.matmul(inputs,Weights) + biases
#這裡增加一行dropout
    Wx_plus_b = tf.nn.dropout(Wx_plus_b, keep_prob)
    if activation_function is None:
        outputs = Wx_plus_b
    else:
        outputs = activation_function(Wx_plus_b)
    return outputs

注意：因為keep_prob作為一個placeholder，所以在feed_dict中傳入！

keep_prob: 1（保留全部神經元） keep_prob: 0.5（保留50%神經元）

dropout僅在train中使用，在驗證和test中keep_prob為1

#定義一個計算準確率的函式
def compute_accuracy(v_xs, v_ys):
    global prediction
    #keep_prob為1
    y_pre = sess.run(prediction, feed_dict={xs: v_xs,keep_prob: 1})
    correct_prediction = tf.equal(tf.argmax(y_pre,1), tf.argmax(v_ys,1))
    accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))
    result = sess.run(accuracy, feed_dict={xs: v_xs, ys: v_ys,keep_prob: 1})
    return result

keep_prob作為一個placeholder，在run時傳入

增加一行：keep_prob = tf.placeholder(tf.float32)

#keep_prob作為一個placeholder，在run時傳入
keep_prob = tf.placeholder(tf.float32)
# 定義placeholder存放資料
xs = tf.placeholder(tf.float32, [None, 784])
ys = tf.placeholder(tf.float32, [None, 10])


#用add_layer函式搭建一個簡單的訓練網路結構
layer1 = add_layer(xs, 784, 50, activation_function=tf.nn.tanh)
prediction = add_layer(layer1, 50, 10, activation_function=tf.nn.softmax)


#損失函式(cross_entropy)和優化方法
cross_entropy = tf.reduce_mean(-tf.reduce_sum(ys*tf.log(prediction),
                     reduction_indices=[1]))
train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)

在run時傳入keep_prob

#session會話控制
sess = tf.Session()
sess.run(tf.global_variables_initializer())
#訓練1000次，每訓練50次輸出測試資料的訓練精度
for i in range(1000):
    #開始訓練，訓練集中每次取100個數據（batch_xs, batch_ys）
    batch_xs, batch_ys = mnist.train.next_batch(100)
    sess.run(train_step, feed_dict={xs: batch_xs, ys: batch_ys, keep_prob: 0.5})#placeholder和feed_dict同時出現
    if i%50 == 0:
        print(compute_accuracy( mnist.test.images, mnist.test.labels))

結果：（變差了，我只是隨便試一試）

TensorFlow之MNIST 分類以及Dropout的使用

一、簡單的一層神經網路 import tensorflow as tf #下載MNIST資料集（28*28，輸入維度為784） from tensorflow.examples.tutorials.mnist import input_data mnist = input_data.read_d

Tensorflow之MNIST手寫數字識別：分類問題（1）

一、MNIST資料集讀取 one hot 獨熱編碼獨熱編碼是一種稀疏向量，其中：一個向量設為1，其他元素均設為0.獨熱編碼常用於表示擁有有限個可能值的字串或識別符號優點： 1、將離散特徵的取值擴充套件到了歐式空間，離散特徵的某個取值就對應歐式空間的某個點　　　　2、機器學習演算法中，

Tensorflow之MNIST手寫數字識別：分類問題（2）

整體程式碼： #資料讀取 import tensorflow as tf import matplotlib.pyplot as plt import numpy as np from tensorflow.examples.tutorials.mnist import input_data mnis

TensorFlow(四)——MNIST分類之CNN

import input_data import tensorflow as tf import numpy as np mnist = input_data.read_data_sets('data/', one_hot=True) trX, trY, teX, teY

tensorflow學習筆記之使用tensorflow進行MNIST分類（3）

在載入MNIST資料集時候用到了Input_data.py。這段程式碼其實非常重要，現在和大家一起分享一下我的學習理解 #coding=utf-8 #input_data.py的詳解 #學習讀取資料檔案的方法，以便讀取自己需要的資料庫檔案（二進位制檔案） """Funct

tensorflow學習筆記之使用tensorflow進行MNIST分類（2）

接著上一篇：http://blog.csdn.net/IEEE_FELLOW/article/details/53012351 本文參考Yann LeCun的LeNet5經典架構，稍加ps得到下面適用於本手寫識別的cnn結構，構造一個兩層卷積神經網路，神經網路的結構如下圖

Tensorflow之MNIST解析

浪潮每一個 col dir html 相關操作 ros 復雜老師要說2017年什麽技術最火爆，無疑是google領銜的深度學習開源框架Tensorflow。本文簡述一下深度學習的入門例子MNIST。深度學習簡單介紹首先要簡單區別幾個概念：人工智能，機器學習，深

TensorFlow(三)——MNIST分類

import input_data import tensorflow as tf mnist = input_data.read_data_sets('data/', one_hot=True) #定義迴歸模型 x = tf.placeholder(tf.float32

TensorFlow(五)——MNIST分類值RNN

import input_data import tensorflow as tf import numpy as np mnist = input_data.read_data_sets('data/', one_hot=True) #設定訓練超引數 lr = 0.00

筆記︱金融風險之欺詐分類以及銀行防控體系簡述

每每以為攀得眾山小，可、每每又切實來到起點，大牛們，緩緩腳步來俺筆記葩分享一下吧，please~———————————————————————————本筆記源於CDA-DSC課程，由常國珍老師主講。該訓練營第一期為風控主題，培訓內容十分緊湊，非常好，推薦：CDA資料科學家訓練

TensorFlow之神經網路簡單實現MNIST資料集分類

import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data mnist=input_data.read_data_sets("MNIST_data",one_hot=True) ba

TensorFlow之卷積神經網路(CNN)實現MNIST資料集分類

import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data mnist=input_data.read_data_sets('MNIST_data',one_hot=True) #每

TensorFlow之tf.nn.dropout()：防止模型訓練過程中的過擬合問題

AC -- 輸出 array 全連接 spa () 激活 odin 一：適用範圍：　　tf.nn.dropout是TensorFlow裏面為了防止或減輕過擬合而使用的函數，它一般用在全連接層二：原理：　　dropout就是在不同的訓練過程中隨機扔掉一部分神經元。也就是

非常精簡的Mnist分類，基於tensorflow框架

一、介紹基於tensorflow框架實現的Mnist資料分類。程式碼主要包括網路結構的搭建，訓練超引數的匯入和儲存，損失函式地繪製等。不足之處是在網路結尾沒用使用softmax函式，而直接使用了tanh輸出了分類結果。下面請看程式碼的詳細介紹二、程式

Tensorflow編程基礎之Mnist手寫識別實驗+關於cross_entropy的理解

ast 大學時光 default ice red con graph cast utf-8 好久沒有靜下心來寫點東西了，最近好像又回到了高中時候的狀態，休息不好，無法全心學習，惡性循環，現在終於調整的好一點了，聽著純音樂突然非常傷感，那些曾經快樂的大學時光啊，突然又慢慢的一

TensorFlow之tf.keras的文字分類

這段時間在學習TensorFlow，這些都是一些官網上的例子，在這裡和大家分享記錄一下。此教程使用評論文字將電影評論分類為正面或負面。這是二元或兩類分類的一個例子，這是一種重要且廣泛適用的機器學習問題。我們將使用包含來自Internet電影資料庫的50

tensorflow匯入mnist資料集之超時解決辦法

首先下載：下載連結下載右邊4個檔案，並存在新建的MNIST_data資料夾中。注意⚠️千萬不要解壓！否則就會不停報錯超時！（mac safari瀏覽器下載檔案後會自動解壓，在safari-偏好設定-通用-反選下載後開啟“安全的”檔案即可）匯入mnist

tensorflow之第一個專案MNIST資料集

首先登陸網址： http://yann.lecun.com/exdb/mnist/ 下載4個檔案下載完之後，解壓出來到資料夾耐心等待，網上好慢。放到當前的路徑下：檢視資料集驗證圖片檢視資料集的驗證標籤檢視資料集的測試圖片

SVM原理以及Tensorflow 實現SVM分類(附程式碼)

1.1. SVM介紹 SVM（Support Vector Machines）——支援向量機是在所有知名的資料探勘演算法中最健壯，最準確的方法之一，它屬於二分類演算法，可以支援線性和非線性的分類。發展到今天，SVM已經可以支援多分類了，但在這一章裡，我們著重講支援向量機在二分類問題中的工作原理。假設

TensorFlow 實現多層 LSTM 的 MNIST 分類 + 視覺化

前言迴圈神經網路（recurrent neural networks, RNNs）及其改進演算法長短期記憶網路（Long Short-Term Memory, LSTM）能夠很好地對時序資料進行建模，其的相關基礎不進行介紹，需要了解可以參考以下文章： Un

TensorFlow之MNIST 分類以及Dropout的使用

相關推薦