TensorFlow學習筆記（7）--實現卷積神經網路（同(5),不同的程式風格）

阿新 • • 發佈：2019-02-02

import tensorflow as tf
import numpy as np
import input_data

mnist = input_data.read_data_sets('data/', one_hot=True)
print("MNIST ready")

n_input  = 784 # 28*28的灰度圖，畫素個數784
n_output = 10  # 是10分類問題

# 權重項
weights = {
    # conv1,引數[3, 3, 1, 32]分別指定了filter的h、w、所連線輸入的維度、filter的個數即產生特徵圖個數
    'wc1': tf.Variable(tf.random_normal([3 
, 3, 1, 32], stddev=0.1)),   
    # conv2，這裡引數3，3同上，32是當前連線的深度是32，即前面特徵圖的個數，64為輸出的特徵圖的個數
    'wc2': tf.Variable(tf.random_normal([3, 3, 32, 64], stddev=0.1)), 
    # fc1，將特徵圖轉換為向量，1024由自己定義
    'wd1': tf.Variable(tf.random_normal([7*7*64, 1024], stddev=0.1)), 
    # fc2，做10分類任務，前面連1024，輸出10分類
    'wd2': tf.Variable(tf.random_normal([1024 
, n_output], stddev=0.1)) 
}
"""
特徵圖大小計算：
f_w = (w-f+2*pad)/s + 1 = (28-3+2*1)/1 + 1 = 28 # 說明經過卷積層並沒有改變圖片的大小
f_h = (h-f+2*pad)/s + 1 = (28-3+2*1)/1 + 1 = 28
# 特徵圖的大小是經過池化層後改變的
第一次pooling後28*28變為14*14
第二次pooling後14*14變為7*7，即最終是一個7*7*64的特徵圖

"""
# 偏置項
biases = {
    'bc1': tf.Variable(tf.random_normal([32 
], stddev=0.1)),      # conv1，對應32個特徵圖
    'bc2': tf.Variable(tf.random_normal([64], stddev=0.1)),      # conv2，對應64個特徵圖
    'bd1': tf.Variable(tf.random_normal([1024], stddev=0.1)),    # fc1，對應1024個向量
    'bd2': tf.Variable(tf.random_normal([n_output], stddev=0.1)) # fc2，對應10個輸出
}

def conv_basic(_input, _w, _b, _keep_prob):
    # INPUT
    # 對影象做預處理，轉換為tf支援的格式，即[n, h, w, c],-1是確定好其它3維後，讓tf去推斷剩下的1維
    _input_r = tf.reshape(_input, shape=[-1, 28, 28, 1]) 

    # CONV LAYER 1
    _conv1 = tf.nn.conv2d(_input_r, _w['wc1'], strides=[1, 1, 1, 1], padding='SAME') 
    # [1, 1, 1, 1]分別代表batch_size、h、w、c的stride
    # padding有兩種選擇：'SAME'（視窗滑動時，畫素不夠會自動補0）或'VALID'（不夠就跳過）兩種選擇
    _conv1 = tf.nn.relu(tf.nn.bias_add(_conv1, _b['bc1'])) # 卷積層後連啟用函式
    # 最大值池化，[1, 2, 2, 1]其中1,1對應batch_size和channel，2,2對應2*2的池化
    _pool1 = tf.nn.max_pool(_conv1, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')
    # 隨機殺死一些神經元,_keepratio為保留神經元比例，如0.6 
    _pool_dr1 = tf.nn.dropout(_pool1, _keep_prob) 

    # CONV LAYER 2
    _conv2 = tf.nn.conv2d(_pool_dr1, _w['wc2'], strides=[1, 1, 1, 1], padding='SAME')
    _conv2 = tf.nn.relu(tf.nn.bias_add(_conv2, _b['bc2']))
    _pool2 = tf.nn.max_pool(_conv2, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')
    _pool_dr2 = tf.nn.dropout(_pool2, _keep_prob) # dropout

    # VECTORIZE向量化
    # 定義全連線層的輸入，把pool2的輸出做一個reshape，變為向量的形式
    _densel = tf.reshape(_pool_dr2, [-1, _w['wd1'].get_shape().as_list()[0]]) 

    # FULLY CONNECTED LAYER 1
    _fc1 = tf.nn.relu(tf.add(tf.matmul(_densel, _w['wd1']), _b['bd1'])) # w*x+b，再通過relu
    _fc_dr1 = tf.nn.dropout(_fc1, _keep_prob) # dropout

    # FULLY CONNECTED LAYER 2
    _out = tf.add(tf.matmul(_fc_dr1, _w['wd2']), _b['bd2']) # w*x+b，得到結果

    # RETURN
    out = {'input_r': _input_r, 'conv1': _conv1, 'pool1': _pool1, 'pool_dr1': _pool_dr1,
           'conv2': _conv2, 'pool2': _pool2, 'pool_dr2': _pool_dr2, 'densel': _densel,
           'fc1': _fc1, 'fc_dr1': _fc_dr1, 'out': _out
           }
    return out
print("CNN READY")


x = tf.placeholder(tf.float32, [None, n_input]) # 用placeholder先佔地方，樣本個數不確定為None
y = tf.placeholder(tf.float32, [None, n_output]) # 用placeholder先佔地方，樣本個數不確定為None
keep_prob = tf.placeholder(tf.float32)

_pred = conv_basic(x, weights, biases, keep_prob)['out'] # 前向傳播的預測值
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(_pred, y)) # 交叉熵損失函式
optm = tf.train.AdamOptimizer(0.001).minimize(cost) # 梯度下降優化器
_corr = tf.equal(tf.argmax(_pred, 1), tf.argmax(y, 1)) # 對比預測值索引和實際label索引，相同返回True，不同返回False
accr = tf.reduce_mean(tf.cast(_corr, tf.float32)) # 將True或False轉換為1或0,並對所有的判斷結果求均值

init = tf.global_variables_initializer()
print("FUNCTIONS READY")

# 上面神經網路結構定義好之後，下面定義一些超引數
training_epochs = 1000 # 所有樣本迭代1000次
batch_size = 100 # 每進行一次迭代選擇100個樣本
display_step = 1
# LAUNCH THE GRAPH
sess = tf.Session() # 定義一個Session
sess.run(init) # 在sess裡run一下初始化操作
# OPTIMIZE
for epoch in range(training_epochs):
    avg_cost = 0.
    total_batch = int(mnist.train.num_examples/batch_size)
    for i in range(total_batch):
        batch_xs, batch_ys = mnist.train.next_batch(batch_size) # 逐個batch的去取資料
        sess.run(optm, feed_dict={x: batch_xs, y: batch_ys, keep_prob:0.5})
        avg_cost += sess.run(cost, feed_dict={x: batch_xs, y: batch_ys, keep_prob:1.0})/total_batch
    if epoch % display_step == 0:
        train_accuracy = sess.run(accr, feed_dict={x: batch_xs, y: batch_ys, keep_prob: 1.0})
        test_accuracy = sess.run(accr, feed_dict={x: mnist.test.images, y: mnist.test.labels, keep_prob:1.0})
        print("Epoch: %03d/%03d cost: %.9f TRAIN ACCURACY: %.3f TEST ACCURACY: %.3f"
              % (epoch, training_epochs, avg_cost, train_accuracy, test_accuracy))
print("DONE")

我用的顯示卡是GTX960，在跑這個卷積神經網路的時候，第一次filter分別設的是64和128，結果報蜜汁錯誤了，反正就是我視訊記憶體不足，所以改成了32和64，讓特徵圖少一點。所以，是讓我換1080的意思嘍

I c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\common_runtime\gpu\gpu_device.cc:885] Found device 0 with properties: 
name: GeForce GTX 960
major: 5 minor: 2 memoryClockRate (GHz) 1.304
pciBusID 0000:01:00.0
Total memory: 4.00GiB
Free memory: 3.33GiB
I c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\common_runtime\gpu\gpu_device.cc:906] DMA: 0 
I c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\common_runtime\gpu\gpu_device.cc:916] 0:   Y 
I c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\common_runtime\gpu\gpu_device.cc:975] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GTX 960, pci bus id: 0000:01:00.0)
W c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\common_runtime\bfc_allocator.cc:217] Ran out of memory trying to allocate 2.59GiB. The caller indicates that this is not a failure, but may mean that there could be performance gains if more memory is available.
W c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\common_runtime\bfc_allocator.cc:217] Ran out of memory trying to allocate 1.34GiB. The caller indicates that this is not a failure, but may mean that there could be performance gains if more memory is available.
W c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\common_runtime\bfc_allocator.cc:217] Ran out of memory trying to allocate 2.10GiB. The caller indicates that this is not a failure, but may mean that there could be performance gains if more memory is available.
W c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\common_runtime\bfc_allocator.cc:217] Ran out of memory trying to allocate 3.90GiB. The caller indicates that this is not a failure, but may mean that there could be performance gains if more memory is available.
Epoch: 000/1000 cost: 0.517761162 TRAIN ACCURACY: 0.970 TEST ACCURACY: 0.967
Epoch: 001/1000 cost: 0.093012387 TRAIN ACCURACY: 0.960 TEST ACCURACY: 0.979
.
.
.
省略

TensorFlow學習筆記（7）--實現卷積神經網路（同(5),不同的程式風格）

import tensorflow as tf import numpy as np import input_data mnist = input_data.read_data_sets('data/', one_hot=True) print("MNIST

TensorFlow學習筆記（5）--實現卷積神經網路（MNIST資料集）

這裡使用TensorFlow實現一個簡單的卷積神經網路，使用的是MNIST資料集。網路結構為：資料輸入層–卷積層1–池化層1–卷積層2–池化層2–全連線層1–全連線層2（輸出層），這是一個簡單但非常有代表性的卷積神經網路。 import tensorflow

吳恩達深度學習筆記（deeplearning.ai）之卷積神經網路（CNN）（上）

1. Padding 在卷積操作中，過濾器（又稱核）的大小通常為奇數，如3x3，5x5。這樣的好處有兩點：在特徵圖（二維卷積）中就會存在一箇中心畫素點。有一箇中心畫素點會十分方便，便於指出過濾器的位置。在沒有padding的情況下，經過卷積操作，輸出的資

深度學習筆記（基礎）——（六）全卷積神經網路（FCN）

通常CNN在卷積層之後會接上若干個全連線層，將卷積層產生的特徵圖（Feature Map）對映成一個固定長度的特徵向量進行分類。以AlexNet為代表的經典CNN結構適合於影象級的分類和迴歸任務，因為它們最後都期望得到整個輸入影象的一個數值描述，如AlexN

TensorFlow實現卷積神經網路（進階）

此模型中如果使用100k個batch，並結合學習速率的decay（即每隔一段時間將學習速率下降一個比率），正確率可以高達86%。模型中需要訓練的引數約為100萬個，而預測時需要進行的四則運算總量在2000萬次左右。所以這個卷積神經網路模型中，使用一些技巧。（

TensorFlow實戰：Chapter-4（CNN-2-經典卷積神經網路（AlexNet、VGGNet））

引言 AlexNet AlexNet 簡介 AlexNet的特點 AlexNet論文分析引言

深度學習基礎（二）—— 從多層感知機（MLP）到卷積神經網路（CNN）

經典的多層感知機（Multi-Layer Perceptron）形式上是全連線（fully-connected）的鄰接網路（adjacent network）。 That is, every neuron in the network is connec

TensorFlow實戰：Chapter-6（CNN-4-經典卷積神經網路（ResNet）)

ResNet ResNet簡介 ResNet(Residual Neural Network)由微軟研究院的何凱明大神等4人提出，ResNet通過使用Residual Unit成功訓練152層神經網路，在ILSCRC2015年比賽中獲得3.75%的

TensorFlow實戰：Chapter-5（CNN-3-經典卷積神經網路（GoogleNet）)

GoogleNet GoogleNet 簡介本節講的是GoogleNet，這裡面的Google自然代表的就是科技界的老大哥Google公司。 Googe Inceptio

學習筆記之——基於pytorch的卷積神經網路

本博文為本人的學習筆記。參考材料為《深度學習入門之——PyTorch》 pytorch中文網：https://www.pytorchtutorial.com/ 關於反捲積：https://github.com/vdumoulin/conv_arithmetic/blob/ma

深度學習筆記-CNN(Convelutional Neural Network; 卷積神經網路)

什麼是卷積神經網路？我的理解就是將影象與filter進行乘積得到一個特徵map，多個特徵map進行疊加。卷積神經網路的過程？卷積->池化->卷積->池化->扁平. 卷積

機器學習筆記（十二）：TensorFlow實現四（影象識別與卷積神經網路）

1 - 卷積神經網路常用結構 1.1 - 卷積層我們先來介紹卷積層的結構以及其前向傳播的演算法。一個卷積層模組，包含以下幾個子模組：使用0擴充邊界(padding) 卷積視窗過濾器（filter）前向卷積反向卷積（可選） 1.1.2 - 邊界填充

tensorflow學習筆記（第一天）-深度卷積神經網路

一、在這裡首先需要了解一些概念性的東西，當然我是才接觸，還不太熟悉： 1.numpy NumPy系統是Python的一種開源的數值計算擴充套件。這種工具可用來儲存和處理大型矩陣，比Python自身的巢狀列表（nested l

機器學習筆記（十三）：TensorFlow實戰五（經典卷積神經網路： LeNet -5 ）

1 - 引言之前我們介紹了一下卷積神經網路的基本結構——卷積層和池化層。通過這兩個結構我們可以任意的構建各種各樣的卷積神經網路模型，不同結構的網路模型也有不同的效果。但是怎樣的神經網路模型具有比較好的效果呢？下圖展示了CNN的發展歷程。經過人們不斷的嘗試，誕生了許多有

機器學習筆記（十二）：TensorFlow實戰四（影象識別與卷積神經網路）

1 - 卷積神經網路常用結構 1.1 - 卷積層我們先來介紹卷積層的結構以及其前向傳播的演算法。一個卷積層模組，包含以下幾個子模組：使用0擴充邊界(padding) 卷積視窗過濾器（filter）前向卷積反向卷積（可選） 1.1

續（利用tensorflow實現簡單的卷積神經網路-對程式碼中相關函式介紹）——遷移學習小記（三）

上篇文章對cnn進行了一些介紹，附了完整小例子程式碼，介紹了一部分函式概念，但是對我這樣的新手來說，程式碼中涉及的部分函式還是無法一下子全部理解。於是在本文中將對程式碼中使用的函式繼續進行一一介紹。具體程式碼見上一篇（二）一、 #定義輸入的placehoder，x是特徵

tensorflow 學習專欄（六）：使用卷積神經網路（CNN）在mnist資料集上實現分類

卷積神經網路（Convolutional Neural Network, CNN）是一種前饋神經網路，它的人工神經元可以響應一部分覆蓋範圍內的周圍單元，對於大型影象處理有出色表現。卷積神經網路CNN的結構一般包含這幾個層：輸入層：用於資料的輸入卷積層：使用卷積核進行特徵提取和

機器學習實驗（四）：用tensorflow實現卷積神經網路識別人類活動

在近幾年，越來越多的使用者在智慧手機上安裝加速度感測器等一些裝置，這就為做一些應用需要收集相關的資料提供了方便。人類活動識別(human activity recognition (HAR))是其中的一個應用。對於HAR，有很多的方法可以去嘗試，方法的performance很大程度上依賴於特徵工程。傳統的機

吳恩達深度學習系列課程筆記：卷積神經網路（一）

本系列文章將對吳恩達在網易公開課“深度學習工程師”微專業內容進行筆記總結，這一部分介紹的是“卷積神經網路”部分。 1、計算機視覺計算機視覺在我們還是生活中有非常廣泛的應用，以下幾個是最常見的例子：影象分類：可以對影象中的物體種類進行判斷，如確定影象中

機器學習筆記：tensorflow實現卷積神經網路經典案例--識別手寫數字

從識別手寫數字的案例開始認識神經網路，並瞭解如何在tensorflow中一步步建立卷積神經網路。安裝tensorflow 資料來源 kaggle新手入門的數字識別案例，包含手寫0-9的灰度值影象的csv檔案，下載地址：https://www.

TensorFlow學習筆記（7）--實現卷積神經網路（同(5),不同的程式風格）

相關推薦