Tensorflow BatchNormalization詳解：2_使用tf.layers高階函式來構建神經網路

阿新 • • 發佈：2019-02-10

Batch Normalization: 使用tf.layers高階函式來構建神經網路

覺得有用的話,歡迎一起討論相互學習~Follow Me

# Batch Normalization – Solutions
# Batch Normalization 解決方案
"""
批量標準化在構建深度神經網路時最為有用。為了證明這一點，我們將建立一個具有20個卷積層的卷積神經網路，然後是一個完全連線的層。
我們將使用它來對MNIST資料集中的手寫數字進行分類，現在您應該熟悉這一點。這不是劃分MNIST數字的最好網路。您可以建立更簡單的網路並獲得更好的結果。
但是，為了給您批量標準化的實踐經驗，我們將使用這個作為一個例子:
1:這個網路足夠複雜，可以保證體現BN演算法對深層神經網路進行訓練時的優勢
2:這個例子比較簡單，你可以很快獲得訓練的結果，這個簡短的練習只是為了給你一次向深度神經玩過中新增BN演算法的機會
3:足夠簡單，無需額外資源即可輕鬆理解架構。
""" 

# 這個教程中有兩種你可以自行編輯的在CNN中實現Batch Normalization的方法,
# 第一個是使用高階函式'tf.layers.batch_normalization',
# 第二個使用低階函式'tf.nn.batch_normalization'

# 下載MNIST手寫數字識別資料集
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data

mnist = input_data.read_data_sets("MNIST_data/", one_hot=True, reshape=False 
)

# Batch Normalization using tf.layers.batch_normalization
# 使用tf.layers.batch_normalization實現Batch Normalization
"""
這個版本的神經網路程式碼使用tf.layers包來編寫，也推薦你使用tf.layers包函式來實現CNN和Batch Normalization演算法。
我們將使用以下函式在我們的網路中建立完全連線的層。我們將用指定數量的神經元和ReLU啟用函式來建立它們。
PS：這個版本的函式不包括批量標準化。
"""


def fully_connected(prev_layer, num_units) 
:
    """
    num_units引數傳遞該層神經元的數量，根據prev_layer引數傳入值作為該層輸入建立全連線神經網路。
    :param prev_layer: Tensor
        該層神經元輸入
    :param num_units: int
        該層神經元結點個數
    :returns Tensor
        一個新的全連線神經網路層
    """
    layer = tf.layers.dense(prev_layer, num_units, activation=tf.nn.relu)
    return layer


"""
我們會運用以下方法來構建神經網路的卷積層，這個卷積層很基本，我們總是使用3x3核心，ReLU啟用函式，
在具有奇數深度的圖層上步長為1x1，在具有偶數深度的圖層上步長為2x2。在這個網路中，我們並不打算使用池化層。
PS：該版本的函式不包括批量標準化操作。
"""


def conv_layer(prev_layer, layer_depth):
    """
    Create a convolutional layer with the given layer as input.
    使用給定的引數作為輸入建立卷積層
    :param prev_layer: Tensor
        傳入該層神經元作為輸入
    :param layer_depth: int
        我們將根據網路中圖層的深度設定特徵圖的步長和數量。
        這不是實踐CNN的好方法，但它可以幫助我們用很少的程式碼建立這個示例。
    :returns Tensor
        一個新的卷積層
    """
    strides = 2 if layer_depth%3 == 0 else 1
    conv_layer = tf.layers.conv2d(prev_layer, layer_depth*4, 3, strides, 'same', activation=tf.nn.relu)
    return conv_layer


# 建立沒有批量標準化的網路，然後在MNIST資料集上進行訓練。它在訓練期間定期顯示Loss值和準確性資料


def train(num_batches, batch_size, learning_rate):
    # 為輸入的樣本和標籤建立佔位符
    inputs = tf.placeholder(tf.float32, [None, 28, 28, 1])
    labels = tf.placeholder(tf.float32, [None, 10])

    # Feed the inputs into a series of 20 convolutional layers
    # 將輸入資料填充到20個卷積層
    layer = inputs
    for layer_i in range(1, 20):
        layer = conv_layer(layer, layer_i)

    # Flatten the output from the convolutional layers
    # 將卷積層輸出扁平化處理
    orig_shape = layer.get_shape().as_list()
    layer = tf.reshape(layer, shape=[-1, orig_shape[1]*orig_shape[2]*orig_shape[3]])

    # Add one fully connected layer
    # 新增一個具有100個神經元的全連線層
    layer = fully_connected(layer, 100)

    # Create the output layer with 1 node for each
    # 為每一個類別新增一個輸出節點
    logits = tf.layers.dense(layer, 10)

    # 定義
    model_loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=logits, labels=labels))

    train_opt = tf.train.AdamOptimizer(learning_rate).minimize(model_loss)

    correct_prediction = tf.equal(tf.argmax(logits, 1), tf.argmax(labels, 1))
    accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

    # Train and test the network
    # 訓練和測試神經網路
    with tf.Session() as sess:
        sess.run(tf.global_variables_initializer())
        for batch_i in range(num_batches):
            batch_xs, batch_ys = mnist.train.next_batch(batch_size)

            # train this batch
            # 訓練批資料
            sess.run(train_opt, {inputs: batch_xs,
                                 labels: batch_ys})

            # Periodically check the validation or training loss and accuracy
            # 定期檢查訓練或驗證集上的loss和精確度
            if batch_i%100 == 0:
                loss, acc = sess.run([model_loss, accuracy], {inputs: mnist.validation.images,
                                                              labels: mnist.validation.labels})
                print(
                    'Batch: {:>2}: Validation loss: {:>3.5f}, Validation accuracy: {:>3.5f}'.format(batch_i, loss, acc))
            elif batch_i%25 == 0:
                loss, acc = sess.run([model_loss, accuracy], {inputs: batch_xs, labels: batch_ys})
                print('Batch: {:>2}: Training loss: {:>3.5f}, Training accuracy: {:>3.5f}'.format(batch_i, loss, acc))

        # At the end, score the final accuracy for both the validation and test sets
        # 最後在驗證集和測試集上對模型準確率進行評分
        acc = sess.run(accuracy, {inputs: mnist.validation.images,
                                  labels: mnist.validation.labels})
        print('Final validation accuracy: {:>3.5f}'.format(acc))
        acc = sess.run(accuracy, {inputs: mnist.test.images,
                                  labels: mnist.test.labels})
        print('Final test accuracy: {:>3.5f}'.format(acc))

        # Score the first 100 test images individually, just to make sure batch normalization really worked
        # 對100個獨立的測試圖片進行評分,對比驗證Batch Normalization的效果

        correct = 0
        for i in range(100):
            correct += sess.run(accuracy, feed_dict={inputs: [mnist.test.images[i]],
                                                     labels: [mnist.test.labels[i]]})

        print("Accuracy on 100 samples:", correct/100)


num_batches = 800  # 迭代次數
batch_size = 64  # 批處理數量
learning_rate = 0.002  # 學習率

tf.reset_default_graph()
with tf.Graph().as_default():
    train(num_batches, batch_size, learning_rate)

"""
有了這麼多的層次，這個網路需要大量的迭代來學習。在您完成800個批次的培訓時，您的最終測試和驗證準確度可能不會超過10％。
(每次都會有所不同，但很可能會低於15％)使用批量標準化，您可以在相同數量的批次中訓練同一網路達到90％以上
使用tf.layers包構建帶有BN層的卷積神經網路。
"""

# Extracting MNIST_data/train-images-idx3-ubyte.gz
# Extracting MNIST_data/train-labels-idx1-ubyte.gz
# Extracting MNIST_data/t10k-images-idx3-ubyte.gz
# Extracting MNIST_data/t10k-labels-idx1-ubyte.gz
# Batch:  0: Validation loss: 0.69079, Validation accuracy: 0.10700
# Batch: 25: Training loss: 0.33298, Training accuracy: 0.10938
# Batch: 50: Training loss: 0.32532, Training accuracy: 0.07812
# Batch: 75: Training loss: 0.32597, Training accuracy: 0.09375
# Batch: 100: Validation loss: 0.32531, Validation accuracy: 0.11260
# Batch: 125: Training loss: 0.32369, Training accuracy: 0.15625
# Batch: 150: Training loss: 0.32454, Training accuracy: 0.12500
# Batch: 175: Training loss: 0.32519, Training accuracy: 0.14062
# Batch: 200: Validation loss: 0.32540, Validation accuracy: 0.10700
# Batch: 225: Training loss: 0.32509, Training accuracy: 0.06250
# Batch: 250: Training loss: 0.32508, Training accuracy: 0.10938
# Batch: 275: Training loss: 0.32465, Training accuracy: 0.14062
# Batch: 300: Validation loss: 0.32541, Validation accuracy: 0.11260
# Batch: 325: Training loss: 0.32266, Training accuracy: 0.15625
# Batch: 350: Training loss: 0.32408, Training accuracy: 0.06250
# Batch: 375: Training loss: 0.32685, Training accuracy: 0.10938
# Batch: 400: Validation loss: 0.32567, Validation accuracy: 0.10020
# Batch: 425: Training loss: 0.32492, Training accuracy: 0.12500
# Batch: 450: Training loss: 0.32439, Training accuracy: 0.12500
# Batch: 475: Training loss: 0.32574, Training accuracy: 0.12500
# Batch: 500: Validation loss: 0.32554, Validation accuracy: 0.09860
# Batch: 525: Training loss: 0.32668, Training accuracy: 0.03125
# Batch: 550: Training loss: 0.32549, Training accuracy: 0.03125
# Batch: 575: Training loss: 0.32473, Training accuracy: 0.12500
# Batch: 600: Validation loss: 0.32628, Validation accuracy: 0.11260
# Batch: 625: Training loss: 0.32547, Training accuracy: 0.09375
# Batch: 650: Training loss: 0.32518, Training accuracy: 0.17188
# Batch: 675: Training loss: 0.32284, Training accuracy: 0.15625
# Batch: 700: Validation loss: 0.32541, Validation accuracy: 0.10700
# Batch: 725: Training loss: 0.32801, Training accuracy: 0.06250
# Batch: 750: Training loss: 0.32847, Training accuracy: 0.06250
# Batch: 775: Training loss: 0.32251, Training accuracy: 0.20312
# Final validation accuracy: 0.11260
# Final test accuracy: 0.11350
# Accuracy on 100 samples: 0.14

Tensorflow BatchNormalization詳解：2_使用tf.layers高階函式來構建神經網路

Batch Normalization: 使用tf.layers高階函式來構建神經網路覺得有用的話,歡迎一起討論相互學習~Follow Me # Batch Normalization – Solutions # Batch Normaliza

《快學Scala》習題詳解第12章高階函式

1 編寫函式values(fun: (Int) => Int, low: Int, high: Int),該函式輸出一個集合，對應給定區間內給定函式的輸入和輸出。比如，values(x => x * x, -5, 5)應該產出一個對偶的集合(-5,

斯坦福大學(吳恩達) 機器學習課後習題詳解第四周程式設計題多分類和神經網路

作業下載地址：https://download.csdn.net/download/wwangfabei1989/103008901. 邏輯迴歸代價函式 lrCostFuctionfunction [J, grad] = lrCostFunction(theta, X, y,

TensorFlow 從入門到精通（六）：tensorflow.nn 詳解

ThinkPHP函數詳解：F方法

過濾 thinkphp 子目錄讀取數據緩存文件快速由於寫入我們已體味了ThinkPHP中的S編制的用法，F編制其實是S編制的一個子集功用，僅用於復雜數據緩存，而且只能支撐文件方式，不支撐緩存有用期，由於采取的是PHP前往編制，所以其效率較S編制較高，是以我

【轉載】瀏覽器緩存詳解：expires cache-control last-modified

導致 lang -c csdn 判斷屬性 lan -m load 最近在對CDN進行優化，對瀏覽器緩存深入研究了一下，記錄一下，方便後來者畫了一個草圖：每個狀態的詳細說明如下： 1、Last-Modified 在瀏覽器第一次請求某一個URL時，服務器端的返回

PHP面向對象詳解：繼承、封裝與多態

gets key copy nes col 成員變量 ret 封裝文字首先，在解釋面向對象之前先解釋下什麽是面向對象？ [面向對象]1、什麽是類？具有相同屬性(特征)和方法(行為)的一系列個體的集合，類是一個抽象的概念2、什麽是對象？從類中拿到的具有具體屬性值得個體，

ES6的箭頭函數詳解：

() nbsp console set 箭頭 settime argument style 生成箭頭函數是ES6中新增一個函數表達形式，它是對函數的一種簡化ES6允許使用“箭頭”（=>）定義函數。 Eg: var f = v => v; 等同於之前 var f

Spring Boot 配置文件詳解：Properties和YAML

列表 config 其他操作系統 des num mat 變量 onf 一.配置文件的生效順序，會對值進行覆蓋： 1. @TestPropertySource 註解 2. 命令行參數 3. Java系統屬性（System.getProperties

redis 下key的過期時間詳解：expire

編寫抽樣通過字符串 n) 開發包有序集合 memcache jedis Redis是一個開源的Key-Value數據緩存，和Memcached類似。 Redis多種類型的value，包括string(字符串)、list(鏈表)、set(集合)、zset(sort

PHP函數詳解：call_user_func()使用方法

func instead 實例 div style bsp color can this call_user_func函數類似於一種特別的調用函數的方法，使用方法如下： <?php function nowamagic($a,$b) { echo

15年資深架構師詳解：一個大型互聯網公司的微服務轉型實踐

微服務架構單片服務微服務是一個比較大的話題，基於我的過往經歷，本文將以 Netflix 為例，分享一個大型互聯網公司如何從一個 Monolithic 的 APP 成功轉型到微服務。文章主要涉及微服務的產生歷史，應用場景，與單片服務區別，微服務帶來的技術、企業組織結構等方面挑戰，以及如何合

IP地址的分類及範圍詳解：A、B、C、D、E五類是如何劃分的？

網絡地址分類 IP地址分類 IP地址劃分 IP地址類型 IP地址範圍 IP地址的分類及範圍詳解：A、B、C、D、E五類是如何劃分的？最近在考證，有一項內容是網絡IP地址劃分的題目，一直從事IT的猛然發現回答這個問題時產生了懷疑，於是習慣百度了一下，發現網上廣泛流傳的有關IP地址劃分的文章居

dva.js 用法詳解：列表展示

def bpa clas 開發 cal switch lan 點擊 code 本教程案例github：https://github.com/axel10/dva_demo-Counter-and-list/tree/master 這次主要通過在線獲取用戶數據並且渲染成列

zabbix_agentd.conf zabbix客戶端配置文件的相關參數的詳解：(二)

Zabbix客戶端配置文件zabbix_agentd.conf zabbix客戶端配置文件的相關參數的詳解：Aliaskey的別名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用戶ID

UX術語幸運飛艇源碼下載詳解：任務流，用戶流，流程圖以及其它全新術語

希望演示重要職位 flow 重新生成 img 所有用戶幸運飛艇源碼下載【大神源碼論壇】dsluntan.com 【布丁源碼論壇】budingbbs.com 企娥3393756370 體驗擁有一長串專業的術語和可交付內容。當在線查看UX相關職位描述時，所羅列的這類

Sql 註入詳解：寬字節註入+二次註入

.com 主動一個 from 攻擊過濾分享圖片 size 就是 sql註入漏洞原理：由於開發者在編寫操作數據庫代碼時，直接將外部可控參數拼接到sql 語句中，沒有經過任何過濾就直接放入到數據庫引擎中執行了。攻擊方式：（1）權限較大時，直接寫入webshell

第20講 | 區塊鏈項目詳解：比特股BTS

代理服 work 直接使用代碼 for doc 地址投資者　　前面兩篇我們都聊了智能合約的話題，智能合約可以說是當下區塊鏈最熱的概念了，在多數人眼裏，沒有智能合約的區塊鏈價值幾乎就大打折扣。　　那麽說，實際上是不是這樣呢，我們今天就來聊聊一個並沒有開放式智能合約

magento快取系列詳解：實施正確的快取策略及不同快取結構分析

本篇文章主要介紹一下在maegnto裡cache(File System, APC, Memcached, Redis)的使用，及在不同的伺服器環境中改怎麼使用讓其效能達到最佳。理解magento的Two-Level Caching magento預設使用zend framework的

詳解：Linux Chrony 設置服務器集群同步時間

mar led ack www 我們 num lld 註意 orm 導讀： Chrony是一個開源的自由軟件，像CentOS 7或基於RHEL 7操作系統，已經是默認服務，默認配置文件在 /etc/chrony.conf 它能保持系統時間與時間服務器（NTP）同步，讓時間

Tensorflow BatchNormalization詳解：2_使用tf.layers高階函式來構建神經網路

Batch Normalization: 使用tf.layers高階函式來構建神經網路

覺得有用的話,歡迎一起討論相互學習~Follow Me

相關推薦