【基於tensorflow的學習】經典卷積神經網路、模型的儲存和讀取

阿新 • • 發佈：2018-12-02

CNN發展史：

1.經典卷積神經網路

以下僅列出關於CNN的深層次理解：

卷積層

tensorflow中卷積層的建立函式：_conv1 = tf.nn.conv2d(_input_r, tf.Variable(tf.random_normal([3, 3, 1, 64], stddev=0.1)), strides=[1, 1, 1, 1], padding='SAME') 引數說明：

輸入影象
tensor變數建立(正態分佈初始化(filter_height,fileter_width,in_channels,out_channels],方差))

stride=[1,stride,stride,1]
padding='SAME'or'VALID'(same是圈圈取零包裹)

卷積核的通道數必須與輸入的一致，但可以有多個卷積核，如此輸出通道數便增多了
經過卷積核之後的輸出影象大小：以高為例： $\mathbf{h_{o}=\frac{h_{i}-h_{kernal}+2*padding}{stride}+1}$
卷積核的意義，其實就跟影象處理當中的“影象分割”裡線檢測、邊緣檢測用的運算元一般：線檢測運算元--水平、+45°、-45°、垂直；邊緣檢測運算元：sobel、prewitt、Laplacian等，這些是基於影象的突變性和連續性，從“一階導數”、“二階導數”等數學原理所推匯出來的幾何特徵的提取運算元。而我們利用神經網路的BP反饋對卷積核進行訓練，則這個運算元則能夠幫助我們提取我們所需要的特徵。

卷積核的分類--擴張卷積、轉置卷積、可分離卷積：http://www.sohu.com/a/159591827_390227
padding邊緣填充是為了不讓一些邊界消失，分為full、same、valid。
“區域性連線”--每個神經元（卷積層的一個畫素）僅與輸入神經元的一塊區域（輸入影象的一個區域性區域）連線，這塊區域性區域稱作感受野。如此保證了學習後的過濾器能夠對於區域性的輸入特徵有最強的響應。區域性連線的思想，也是受啟發於生物學裡面的視覺系統結構，視覺皮層的神經元就是區域性接受資訊的；而且區域性連線使得引數大量減少。
“權值共享”--計算同一個深度切片的神經元時採用的濾波器是共享的。共享權重在一定程度上講是有意義的，例如圖片的底層邊緣特徵與特徵在圖中的具體位置無關。但是在一些場景中是無意的，比如輸入的圖片是人臉，眼睛和頭髮位於不同的位置，希望在不同的位置學到不同的特徵 (參考斯坦福大學公開課)。請注意權重只是對於同一深度切片的神經元是共享的，在卷積層，通常採用多組卷積核提取不同特徵，即對應不同深度切片的特徵，不同深度切片的神經元權重是不共享，如此組成的特徵即為Feature map。另外，偏重對同一深度切片的所有神經元都是共享的。

“分散式表徵”--神經網路的重要性質，即如“編碼”一般，可將樣本從原始空間投影到一個更好的特徵空間中。

池化層

tensorflow中池化層的建立函式：_pool1 = tf.nn.max_pool(_conv1, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')

池化層的作用：通過池化來降低卷積層輸出的特徵向量，同時改善結果（不易出現過擬合）。
池化層的操作：max、mean。
“區域不變形”--pooling 這步綜合了局部特徵，失去了每個特徵的位置資訊。這很適合基於影象的任務，比如要判斷一幅圖裡有沒有貓這種生物，你可能不會去關心這隻貓出現在影象的哪個區域。但是在 NLP 裡，詞語在句子或是段落裡出現的位置，順序，都是很重要的資訊。

一個經典卷積神經網路的實現：input-conv1-relu-pooling1-conv2-relu-pooling2-dc1-output

n_input  = 784
n_output = 10
weights  = {
        'wc1': tf.Variable(tf.random_normal([3, 3, 1, 64], stddev=0.1)),
        'wc2': tf.Variable(tf.random_normal([3, 3, 64, 128], stddev=0.1)),
        'wd1': tf.Variable(tf.random_normal([7*7*128, 1024], stddev=0.1)),
        'wd2': tf.Variable(tf.random_normal([1024, n_output], stddev=0.1))
    }
biases   = {
        'bc1': tf.Variable(tf.random_normal([64], stddev=0.1)),
        'bc2': tf.Variable(tf.random_normal([128], stddev=0.1)),
        'bd1': tf.Variable(tf.random_normal([1024], stddev=0.1)),
        'bd2': tf.Variable(tf.random_normal([n_output], stddev=0.1))
    }

def conv_basic(_input, _w, _b, _keepratio):
        # INPUT
        _input_r = tf.reshape(_input, shape=[-1, 28, 28, 1])
        # CONV LAYER 1
        _conv1 = tf.nn.conv2d(_input_r, _w['wc1'], strides=[1, 1, 1, 1], padding='SAME')
        #_mean, _var = tf.nn.moments(_conv1, [0, 1, 2])
        #_conv1 = tf.nn.batch_normalization(_conv1, _mean, _var, 0, 1, 0.0001)
        _conv1 = tf.nn.relu(tf.nn.bias_add(_conv1, _b['bc1']))
        _pool1 = tf.nn.max_pool(_conv1, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')
        _pool_dr1 = tf.nn.dropout(_pool1, _keepratio)
        # CONV LAYER 2
        _conv2 = tf.nn.conv2d(_pool_dr1, _w['wc2'], strides=[1, 1, 1, 1], padding='SAME')
        #_mean, _var = tf.nn.moments(_conv2, [0, 1, 2])
        #_conv2 = tf.nn.batch_normalization(_conv2, _mean, _var, 0, 1, 0.0001)
        _conv2 = tf.nn.relu(tf.nn.bias_add(_conv2, _b['bc2']))
        _pool2 = tf.nn.max_pool(_conv2, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')
        _pool_dr2 = tf.nn.dropout(_pool2, _keepratio)
        # VECTORIZE
        _dense1 = tf.reshape(_pool_dr2, [-1, _w['wd1'].get_shape().as_list()[0]])
        # FULLY CONNECTED LAYER 1
        _fc1 = tf.nn.relu(tf.add(tf.matmul(_dense1, _w['wd1']), _b['bd1']))
        _fc_dr1 = tf.nn.dropout(_fc1, _keepratio)
        # FULLY CONNECTED LAYER 2
        _out = tf.add(tf.matmul(_fc_dr1, _w['wd2']), _b['bd2'])
        # RETURN
        out = { 'input_r': _input_r, 'conv1': _conv1, 'pool1': _pool1, 'pool1_dr1': _pool_dr1,
            'conv2': _conv2, 'pool2': _pool2, 'pool_dr2': _pool_dr2, 'dense1': _dense1,
            'fc1': _fc1, 'fc_dr1': _fc_dr1, 'out': _out
        }
        return out
print ("CNN READY")

x = tf.placeholder(tf.float32, [None, n_input])
y = tf.placeholder(tf.float32, [None, n_output])
keepratio = tf.placeholder(tf.float32)

# FUNCTIONS

_pred = conv_basic(x, weights, biases, keepratio)['out']
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y, logits=_pred))
#使用了最先進的adam優化演算法，其中包含了正則化的思想，但不像傳統的正則化那樣。
optm = tf.train.AdamOptimizer(learning_rate=0.001).minimize(cost)
_corr = tf.equal(tf.argmax(_pred,1), tf.argmax(y,1)) 
accr = tf.reduce_mean(tf.cast(_corr, tf.float32)) 
init = tf.global_variables_initializer()
    
# SAVER
print ("GRAPH READY")

sess = tf.Session()
sess.run(init)

training_epochs = 30
batch_size      = 10
display_step    = 5
time1=time.time()
for epoch in range(training_epochs):
    avg_cost = 0.
    total_batch = int(mnist.train.num_examples/batch_size)
    #total_batch = 10
    # Loop over all batches
    for i in range(total_batch):
        batch_xs, batch_ys = mnist.train.next_batch(batch_size)
        # Fit training using batch data
        sess.run(optm, feed_dict={x: batch_xs, y: batch_ys, keepratio:0.7})
        # Compute average loss
        avg_cost += sess.run(cost, feed_dict={x: batch_xs, y: batch_ys, keepratio:1.})/total_batch

    # Display logs per epoch step
    if epoch % display_step == 0: 
        print ("Epoch: %03d/%03d cost: %.9f" % (epoch, training_epochs, avg_cost))
        train_acc = sess.run(accr, feed_dict={x: batch_xs, y: batch_ys, keepratio:1.})
        print (" Training accuracy: %.3f" % (train_acc))
        test_acc = sess.run(accr, feed_dict={x: testimg, y: testlabel, keepratio:1.})
        print (" Test accuracy: %.3f" % (test_acc))

print ("OPTIMIZATION FINISHED")
time_waste=time.time()-time1
print("The time wasting is:%dh %dm %ds"%(time_waste//(60*24),time_waste%(60*24)//60,time_waste%(60*24)%60))

Epoch: 000/030 cost: 0.122792258
 Training accuracy: 0.900
 Test accuracy: 0.986
Epoch: 005/030 cost: 0.012638518
 Training accuracy: 1.000
 Test accuracy: 0.993
Epoch: 010/030 cost: 0.006675720
 Training accuracy: 1.000
 Test accuracy: 0.992
Epoch: 015/030 cost: 0.005300980
 Training accuracy: 1.000
 Test accuracy: 0.992
Epoch: 020/030 cost: 0.003683299
 Training accuracy: 1.000
 Test accuracy: 0.990
Epoch: 025/030 cost: 0.003249645
 Training accuracy: 1.000
 Test accuracy: 0.993
OPTIMIZATION FINISHED
The time wasting is:0h 13m 54s

2.Alexnet

以上程式很多地方其實已經用到了Alexnet的特點了：像是RELU、dropout。

Alexnet的特點實際上就是：

採用了三個連結層：2048、2048、1000
啟用函式採用relu
全連結層採用dropout
在relu和pool之間採用區域性相應歸一化LRN，但是當net的層數到達11層時，這個lrn沒有作用，反而起了副作用；而且因為lrn在池化層前的計算會不經濟，所以後面的alexnet改進有把lrn放在了pool後面
conv-pool數更多了，達到5個
GPUS分散式計算，如圖所示
擴充套件資料：隨機裁剪、旋轉......

LRN的介紹：

引數可以百度LRN看看，這裡講講它的含義--來源於《深度學習與計算機視覺》

區域性相應歸一化模擬的是動物神經中的橫向抑制效應（將相似的記憶分開），從公式可以看出，如果在該位置，該通道和臨近通道的絕對值都比較大的話，歸一化之後值會有變得更小的趨勢。

3.模型的儲存和讀取

#儲存模型
saver = tf.train.Saver(max_to_keep=3)#最多儲存三個模型，再存入則會按照first delete
saver.save(sess, "save/nets/cnn_mnist_basic.ckpt-" + str(epoch))#將訓練好的計算圖存入該檔案

#讀取模型
epoch = training_epochs-1
saver.restore(sess, "save/nets/cnn_mnist_basic.ckpt-" + str(epoch))

test_acc = sess.run(accr, feed_dict={x: testimg, y: testlabel, keepratio:1.})
print (" TEST ACCURACY: %.3f" % (test_acc))

參考資料：https://github.com/scutan90/DeepLearning-500-questions

【基於tensorflow的學習】經典卷積神經網路、模型的儲存和讀取

CNN發展史： 1.經典卷積神經網路以下僅列出關於CNN的深層次理解：卷積層 tensorflow中卷積層的建立函式：_conv1 = tf.nn.conv2d(_input_r, tf.Variable(tf.random_normal([3, 3, 1, 6

Tensorflow學習教程------利用卷積神經網路對mnist資料集進行分類_利用訓練好的模型進行分類

#coding:utf-8 import tensorflow as tf from PIL import Image,ImageFilter from tensorflow.examples.tutorials.mnist import input_data def imageprepare(ar

Tensorflow學習筆記(五)——卷積神經網路實現

今天來實現tensorflow架構下的卷積神經網路，首先了解清楚我們要構建的網路架構，資料集還是用mnist，所以輸入還是28X28。建立的卷積神經網路架構是：卷積層->pooling層->卷積層->pooling層->全連線層1->全連線層2。全連線層

TensorFlow學習筆記(7) 卷積神經網路簡介

前面所提到的MNIST是一個相對簡單的資料集，而在其他更復雜的影象識別資料集上，卷積神經網路有更好的表現。比如Cifar資料集和ImageNet資料集。Cifar分為Cifar-10和Cifar-100兩個問題，都是32*32的彩色圖片，Cifar-10問題收集了來自10個不同種類的60000張圖片

TensorFlow實戰：經典卷積神經網路（AlexNet、VGGNet）

下面表格是兩個網路的簡單比較: 特點 AlexNet VGGNet 論文貢獻介紹完整CNN架構模型(近些年的許多CNN模型都是依據此模型變種來的)和多種訓練技巧 CNN模型復興的開山之作使用GPU加速

《TensorFlow學習筆記》卷積神經網路CNN實戰-cifar10資料集（tensorboard視覺化）

IDE：pycharm Python: Python3.6 OS: win10 tf : CPU版本程式碼可在github中下載，歡迎star，謝謝 CNN-CIFAR-10 一、CIFAR10資料集資料集程式碼下載 from te

TensorFlow學習－－卷積神經網路訓練CIFAR-10資料集

CIFAR-10資料集 CIFAR-10資料集包含10個類的60000張32x32的彩色影象，每個類有6000張影象。有50000張訓練影象和10000張測試影象。 10個分類明細及對應的部分圖片：卷積神經網路訓練CIFAR-10資料集

tensorflow學習筆記：卷積神經網路最終筆記

　　這已經是我的第四篇部落格學習卷積神經網路了。之前的文章分別是：　　1，Keras深度學習之卷積神經網路（CNN），這是開始學習Keras，瞭解到CNN，其實不懂的還是有點多，當然第一次筆記主要是給自己心中留下一個印象，知道什麼是卷積神經網路，當然主要是學習Keras，順便走一下CNN的過程。　　2，深

寫給程式設計師的機器學習入門 (八) - 卷積神經網路 (CNN) - 圖片分類和驗證碼識別

這一篇將會介紹卷積神經網路 (CNN)，CNN 模型非常適合用來進行圖片相關的學習，例如圖片分類和驗證碼識別，也可以配合其他模型實現 OCR。 ## 使用 Python 處理圖片在具體介紹 CNN 之前，我們先來看看怎樣使用 Python 處理圖片。Python 處理圖片最主要使用的類庫是 Pillow

機器學習筆記（十五）：TensorFlow實戰七（經典卷積神經網路：VGG）

1 - 引言之前我們介紹了LeNet-5和AlexNet，在AlexNet發明之後，卷積神經網路的層數開始越來越複雜，VGG-16就是一個相對前面2個經典卷積神經網路模型層數明顯更多了。 VGGNet是牛津大學計算機視覺組（Visual Geometry Group）和Google

機器學習筆記（十四）：TensorFlow實戰六（經典卷積神經網路：AlexNet ）

1 - 引言 2012年，Imagenet比賽冠軍的model——Alexnet [2]（以第一作者alex命名）。這個網路算是一個具有突破性意義的模型首先它證明了CNN在複雜模型下的有效性，然後GPU實現使得訓練在可接受的時間範圍內得到結果，讓之後的網路模型構建變得更加複雜，並且通過

機器學習筆記（十三）：TensorFlow實戰五（經典卷積神經網路： LeNet -5 ）

1 - 引言之前我們介紹了一下卷積神經網路的基本結構——卷積層和池化層。通過這兩個結構我們可以任意的構建各種各樣的卷積神經網路模型，不同結構的網路模型也有不同的效果。但是怎樣的神經網路模型具有比較好的效果呢？下圖展示了CNN的發展歷程。經過人們不斷的嘗試，誕生了許多有

機器學習筆記（十七）：TensorFlow實戰九（經典卷積神經網路：ResNet）

1 - 引言我們可以看到CNN經典模型的發展從 LeNet -5、AlexNet、VGG、再到Inception，模型的層數和複雜程度都有著明顯的提高，有些網路層數更是達到100多層。但是當神經網路的層數過高時，這些神經網路會變得更加難以訓練。一個特別大的麻煩就在於訓練的時候會產

機器學習筆記（十六）：TensorFlow實戰八（經典卷積神經網路：GoogLeNet）

1 - 引言 GoogLeNet, 在2014年ILSVRC挑戰賽獲得冠軍，將Top5 的錯誤率降低到6.67%. 一個22層的深度網路論文地址：http://arxiv.org/pdf/1409.4842v1.pdf 題目為：Going deeper with convolu

【TensorFlow實戰】用TensorFlow實現簡單的卷積神經網路

#本次將練習實現一個簡單的卷積神經網路，使用的資料集依然是MNIST， #預期可以達到99.2%左右的準確性 #使用兩個卷積層加上一個全連線蹭構建一個簡單但是非常具有代表性的卷積神經網路 #載入MNIST資料集，並且建立預設的Interactive Sessio

【6年人工智慧開發】簡述卷積神經網路（CNN）

在百度做了6年人工智慧方面的程式設計開發，也有很多這方面的經驗吧，從古至今，機器人一直承載著人類巨大的夢想。隨著各類感測器、語音互動、機器識別、SLAM等技術的蓬勃發展，機器人開始從科幻作品中走出

TensorFlow實戰：Chapter-4（CNN-2-經典卷積神經網路（AlexNet、VGGNet））

引言 AlexNet AlexNet 簡介 AlexNet的特點 AlexNet論文分析引言

續（利用tensorflow實現簡單的卷積神經網路-對程式碼中相關函式介紹）——遷移學習小記（三）

上篇文章對cnn進行了一些介紹，附了完整小例子程式碼，介紹了一部分函式概念，但是對我這樣的新手來說，程式碼中涉及的部分函式還是無法一下子全部理解。於是在本文中將對程式碼中使用的函式繼續進行一一介紹。具體程式碼見上一篇（二）一、 #定義輸入的placehoder，x是特徵

利用tensorflow實現簡單的卷積神經網路——遷移學習小記（二）

一、什麼是神經網路（CNN）卷積神經網路（Convolutional Neural Network，簡稱CNN），是一種前饋神經網路，人工神經元可以影響周圍單元，可以進行大型影象處理。卷積神經網路包括卷積層和池化層。卷積神經網路是受到生物思考方式的啟發的MLPs（多

TensorFlow實戰之實現AlexNet經典卷積神經網路

本文根據最近學習TensorFlow書籍網路文章的情況,特將一些學習心得做了總結,詳情如下.如有不當之處,請各位大拿多多指點,在此謝過。一、AlexNet模型及其基本原理闡述 1、關於AlexNet 2012年，AlexKrizhevsky提出

【基於tensorflow的學習】經典卷積神經網路、模型的儲存和讀取

1.經典卷積神經網路

卷積層

池化層

2.Alexnet

3.模型的儲存和讀取

相關推薦