用tensorflow實現AlexNet網路

阿新 • • 發佈：2018-12-22

AlexNet網路：

2012年，Alex...提出了深度學習卷積神經網路模型Alexnet，其中包含了幾個當時新穎的技術點。獲得了2012年ILSVRC比賽第一名。Alexnet主要使用的技術點如下：

1.成功使用ReLU作為卷積神經網路的啟用函式，驗證了在深層卷積神經網路的效果超過Sigmoid，成功解決Sigmoid在網路較深層神經網路的梯度消失問題。

2.訓練使用dropout，忽略一部分神經元，以避免過擬合。主要是在最後的幾個全連線層使用了dropout。

3.LRN層（Local Response Normalization），提升泛化能力。實際上好像沒什麼用。而且還降低訓練速度。

4.使用最大池化，避免了平均池化的模糊效果，另外提出了讓步長比池化核小的最大池化方法。可以保證池化出的特徵有重疊，提升特徵的豐富性。

5.資料增強，隨機從256*256的原始影象中隨機擷取224*224大小的區域（並進行水平翻轉）這個操作相當於把資料量曾加了（256-224）*（256*224）*2倍=2048倍。如果沒有資料增強，只靠原始的資料量，眾多的引數會陷入過擬閤中。使用資料增強同業可以提高泛化能力。

額

第一個卷積層使用了較大的卷積核尺寸11*11，步長為4，有96個卷積核；然後是有個3*3步長為2的池化層。只有第一層卷積核比較大，後面的幾層卷積核都比較小，都是5*5或者3*3的卷積核。

#首先匯入幾個需要使用的庫
from datetime import datetime
import math
import time
import tensorflow as tf
#這裡設定一個batch為30，共100個batch的資料
batch_size = 32
num_batch  = 100
#定義了一個可以列印每一層的名稱(t.op.name)並以列表的方式列印輸入尺寸資訊
def print_activation(t):
    print(t.op.name,'\n',t.get_shape().as_list())

#設計網路結構，以圖片作為輸入，返回pool5和所有需要訓練的模型引數
def Alexnet_structure(images):
    #定義一個列表
    parameters = []
    #定義第一層卷積層
    #可以將scope段內所有定義的變數自動命名為conv1/xxx
    with tf.name_scope('conv1') as scope:
        #第一層的卷積核，11*11*3，共64個，tf.truncated_normal一種設定正態分佈的方法
        kernel = tf.Variable(tf.truncated_normal([11,11,3,64],dtype=tf.float32,stddev=1e-1),name='weigths')
        #設定第一層卷積層，卷積核是上面初始化後的卷積核，步長為4,4，填充為SAME
        conv   = tf.nn.conv2d(images,kernel,[1,4,4,1],padding='SAME')
        #設定第一層的偏置，初始值為0
        biases = tf.Variable(tf.constant(0.0,shape=[64],dtype=tf.float32),trainable=True,name='biases')
        #設定w*x+b，之後用啟用函式處理。作為第一層的輸出
        W_x_plus_b   = tf.nn.bias_add(conv,biases)
        conv1  = tf.nn.relu(W_x_plus_b,name=scope)
        #啟用最開始定義的列印層資訊的函式，把輸出尺寸打印出來
        print_activation(conv1)
        parameters += [kernel,biases]
        #LRN層個人感覺與PCA的效果差不多，PCA實現的是降維，把主要的特徵保留
        # LRN實現的是將主要特徵的貢獻放大，將不重要的特徵縮小
        #由於效果並不明顯，且執行速度回慢三倍，很多神經網路已經放棄了加入LRN層
        #lrn1=tf.nn.lrn(conv1,4,bias=1.0,alpha=0.001/9,beta=0.75,name='lrn1')
        #pool1=tf.nn.max_pool(lrn1,ksize=[1,3,3,1],strides=[1,2,2,1],padding='VALID',name='pool1')
        pool1=tf.nn.max_pool(conv1,ksize=[1,3,3,1],strides=[1,2,2,1],padding='VALID',name='pool1')
        print_activation(pool1)

    #定義第二個網路層
    with tf.name_scope('conv2')as scope:
        #定義卷積核5*5，192個，
        kernel = tf.Variable(tf.truncated_normal([5,5,64,192],dtype=tf.float32,stddev=1e-1),name='weigtths')
        #定義了一個卷積操作，步長為1，經過這次卷積後圖像尺寸大小沒有改變
        conv   = tf.nn.conv2d(pool1, kernel, [1, 1, 1, 1], padding='SAME')
        biases = tf.Variable(tf.constant(0.0,shape=[192],dtype=tf.float32),trainable=True,name='biases')
        W_x_plus_b   = tf.nn.bias_add(conv, biases)
        #同樣用了relu啟用函式
        conv2  = tf.nn.relu(W_x_plus_b, name=scope)
        parameters += [kernel, biases]
        print_activation(conv2)
        #lrn2  = tf.nn.lrn(conv2, 4, bias=1.0, alpha=0.001 / 9, beta=0.75, name='lrn2')
        #pool2 = tf.nn.max_pool(lrn2, ksize=[1, 3, 3, 1], strides=[1, 2, 2, 1], padding='VALID', name='pool2')
        #池化層，3*3，步長為2,2，池化後由 [32, 27, 27, 192]--->[32, 13, 13, 192]
        #這個每一層第一個引數歐式32，這個是batch_size，即每次送入的圖片的數目
        pool2 = tf.nn.max_pool(conv2, ksize=[1, 3, 3, 1], strides=[1, 2, 2, 1], padding='VALID', name='pool2')
        print_activation(pool2)

    #定義第三層卷積層
    with tf.name_scope('conv3')as scope:
        kernel = tf.Variable(tf.truncated_normal([3, 3, 192, 384], dtype=tf.float32, stddev=1e-1), name='weigtths')
        conv   = tf.nn.conv2d(pool2, kernel, [1, 1, 1, 1], padding='SAME')
        biases =tf.Variable(tf.constant(0.0,shape=[384],dtype=tf.float32),trainable=True,name='biases')
        W_x_plus_b   = tf.nn.bias_add(conv, biases)
        conv3  = tf.nn.relu(W_x_plus_b, name=scope)
        parameters += [kernel, biases]
        print_activation(conv3)

    #定義第四層卷積層
    with tf.name_scope('conv4')as scope:
        kernel = tf.Variable(tf.truncated_normal([3, 3, 384, 256], dtype=tf.float32, stddev=1e-1), name='weigtths')
        conv   = tf.nn.conv2d(conv3, kernel, [1, 1, 1, 1], padding='SAME')
        biases = tf.Variable(tf.constant(0.0,shape=[256],dtype=tf.float32),trainable=True,name='biases')
        W_x_plus_b   = tf.nn.bias_add(conv, biases)
        conv4  = tf.nn.relu(W_x_plus_b, name=scope)
        parameters += [kernel, biases]
        print_activation(conv4)

    #定義第五層卷積層
    with tf.name_scope('conv5')as scope:
        kernel = tf.Variable(tf.truncated_normal([3, 3, 256, 256], dtype=tf.float32, stddev=1e-1), name='weigtths')
        conv   = tf.nn.conv2d(conv4, kernel, [1, 1, 1, 1], padding='SAME')
        biases = tf.Variable(tf.constant(0.0,shape=[256],dtype=tf.float32),trainable=True,name='biases')
        W_x_plus_b   = tf.nn.bias_add(conv, biases)
        conv5  = tf.nn.relu(W_x_plus_b, name=scope)
        parameters += [kernel, biases]
        print_activation(conv5)
        #根據原網路設計，第五層卷積層後緊跟一個池化層
        pool5  = tf.nn.max_pool(conv5, ksize=[1, 3, 3, 1], strides=[1, 2, 2, 1], padding='VALID', name='pool5')
        print_activation(pool5)
        return pool5,parameters

#評估Alexnet每輪計算時間的函式
def time_Alexnet_run(session,target,info_string):
    num_steps_burn_in = 10
    total_duration    = 0.0
    total_duration_squared = 0.0
    for i in range(num_batch+num_steps_burn_in):
        start_time = time.time()
        tar = session.run(target)
        duration = time.time()-start_time
        if i >= num_steps_burn_in:
            if not i%10:
                print('%s:step %d,duration=%.3f'%(datetime.now(),i-num_steps_burn_in,duration))
            total_duration+=duration
            total_duration_squared+=duration*duration
    mn=total_duration/num_batch
    vr=total_duration_squared/num_batch-mn*mn
    sd=math.sqrt(vr)
    print('%s:s% accoss %d steps,%.3f +/-%.3f sec/batch ' % (datetime.now(), info_string,num_batch,mn,sd))

#主函式
def main():
    with tf.Graph().as_default():
        image_size = 224
        images = tf.Variable(tf.random_normal([batch_size,image_size,image_size,3],dtype=tf.float32,stddev=1e-1))
        pool5 , parmeters = Alexnet_structure(images)
        #初始化所有變數
        init   =  tf.global_variables_initializer()
        sess   =  tf.Session()
        sess.run(init)
        #統計計算時間
        time_Alexnet_run(sess,pool5,"Forward")
        objective = tf.nn.l2_loss(pool5)
        grad      = tf.gradients(objective,parmeters)
        time_Alexnet_run(sess,grad,"Forward-backward")
        print(len(parmeters))

main()

參考書籍：《Tensorflow實戰》黃文堅，唐源，電子工業出版社，第六章。

用tensorflow實現AlexNet網路

AlexNet網路： 2012年，Alex...提出了深度學習卷積神經網路模型Alexnet，其中包含了幾個當時新穎的技術點。獲得了2012年ILSVRC比賽第一名。Alexnet主要使用的技術點如下： 1.成功使用ReLU作為卷積神經網路的啟用函式，驗證了在深層卷積神經

教你用TensorFlow實現神經網路（附程式碼）

來源：雲棲社群作者：Pavel Surmenok 本文長度為2600字，建議閱讀5分鐘本文幫助你理解神經網路的應用，並使用TensorFlow解決現實生活中的問題。如果你一直關注資料科學

用tensorflow實現一個卷積神經網路

學了一段深度學習，最近學了tensorflow，所以想自己去根據教程寫一個簡單的卷積神經網路。 CNN：卷積神經網路的實現一個卷積神經網路的結構一般是由輸入-->卷積-->池化-->卷積-->池化-->............-->全連線-->全連

用TensorFlow基於神經網路實現井字棋（含程式碼）

為了展示如何應用神經網路演算法模型，我們將使用神經網路來學習優化井字棋（Tic Tac Toe）。明確井字棋是一種決策性遊戲，並且走棋步驟優化是確定的。開始為了訓練神經網路模型，我們有一系列優化的不同的走棋棋譜，棋譜基於棋盤位置列表和對應的最佳落子點。考慮到棋盤的對稱性，通

【TensorFlow實戰】用TensorFlow實現簡單的卷積神經網路

#本次將練習實現一個簡單的卷積神經網路，使用的資料集依然是MNIST， #預期可以達到99.2%左右的準確性 #使用兩個卷積層加上一個全連線蹭構建一個簡單但是非常具有代表性的卷積神經網路 #載入MNIST資料集，並且建立預設的Interactive Sessio

《tensorflow實戰》之實現AlexNet網路（六）

一 AlexNet網路結構及特點 1.AlexNet網路結構 AlexNet有8個需要訓練的層(不包括池化層和LRN層)，前5層為卷積層後3層為全連線層。AlexNet最後一層是有1000類輸出的softmax層用做分類。其中LRN層出現在第1個和第2個

機器學習實驗（四）：用tensorflow實現卷積神經網路識別人類活動

在近幾年，越來越多的使用者在智慧手機上安裝加速度感測器等一些裝置，這就為做一些應用需要收集相關的資料提供了方便。人類活動識別(human activity recognition (HAR))是其中的一個應用。對於HAR，有很多的方法可以去嘗試，方法的performance很大程度上依賴於特徵工程。傳統的機

TensorFlow(三) 用TensorFlow實現L2正則損失函數線性回歸算法

glob ini upper ace arr 算法 var 增加初始化 import tensorflow as tf import numpy as np import matplotlib.pyplot as plt from sklearn import dat

tensorflow(三)用tensorflow實現詞嵌入

一為什麼用向量來對單詞進行表示以前對單詞的表示都是離散的，比如用one-hot方式來表示單詞。這種方式的表示不利於計算，也無法揭示單詞之間的關聯性。假如我們計算兩個句子的相似度，簡單的方式是，計算出兩個句子中單詞之間最高的相似度然後累加，可計算出句子的相似度。那麼，單詞的相似度如何計

tensorflow實現神經網路

tensorflow實現神經網路 1、全部步驟實現前向傳播宣告學習率引數進行正則化計算計算損失函式反向傳播引數進行滑動平均 2、各個步驟解釋前向傳播：主要是定義這個網路的結構，網路是幾層的，以及每層使用的啟用函式是

tensorflow實戰——tensorflow實現AlexNet

教你用TensorFlow搭建AlexNet

勿滿足於眼前的小小成就。你要問自己，我這輩子只有這樣嗎。 AlexNet模式是在2012年提出來的，並且在當年獲得了ILSVRC的冠軍，top-5的錯誤率為16.4%，比第二名的成績26.2%高出許多，也從此開始確立了深度學習在計算機視覺的統治地位，是一塊重要的里程碑。該

教你用TensorFlow實現手寫數字識別

弱者用淚水安慰自己，強者用汗水磨練自己。這段時間因為專案中有一塊需要用到影象識別，最近就一直在煉丹，寶寶心裡苦，但是寶寶不說。。。能點開這篇文章的朋友估計也已經對TensorFlow有了一定了解，至少知道這是個什麼東西，我也就不過多介紹了。沒安裝TensorFlo

教你用TensorFlow實現VGGNet

勿滿足於眼前的小小成就。你要問自己，我這輩子只有這樣嗎。 VGGNet 是牛津大學計算機視覺組（ Visual Geometry Group〉和 Google DeepMind公司的研究員一起研發的的深度卷積神經網路。VGGNet探索了卷積神經網路的深度與其效能之間的關係，通過

例子：tensorflow實現神經網路

add_layer 功能首先，我們匯入本次所需的模組。 import tensorflow as tf import numpy as np 構造新增一個神經層的函式 def add_layer(inputs, in_size, out_size, activation_

用tensorflow實現svm的線性和非線性分類

線性分割：# coding: utf-8 # In[1]: import matplotlib.pyplot as plt import numpy as np from sklearn import datasets import tensorflow as tf

tensorflow實現AlexNet

AlexNet是Hinton的學生Alex Krizhevsky在2012年提出的深度卷積神經網路，它是LeNet一種更深更寬的版本。在AlexNet上首次應用了幾個trick，ReLU、Dropout和LRN。AlexNet包含了6億3000萬個連線，6000萬個引數和65

先讀懂CapsNet架構然後用TensorFlow實現：全面解析Hinton的提出的Capsule

上週 Geoffrey Hinton 等人公開了那篇備受關注的 NIPS 論文，而後很多研究者與開發者都閱讀了該論文並作出了一定的程式碼實現。機器之心在本文中將詳細解釋該論文提出的結構與過程，並藉助 GitHub 上熱烈討論的專案完成了 CapsNet 的 TensorFlow 實現，並提供了主體架構的程

識別MNIST資料集之（二）：用Python實現神經網路

在這篇文章當中，我們將會用根據MNIST的資料集，跟大家介紹神經網路進行分類的基本原理和方法。 1.神經網路的正向計算如果我們把神經網路當作一個黑盒來看，它的結構大概是這樣的：輸入（層）：一張圖片計算過程：神經網路輸出（層）：這張圖

用matlab實現神經網路識別數字

Andrew Ng機器學習第四周的程式設計練習是用matlab實現一個神經網路對一幅圖中的數字進行識別，有待識別的數字全集如下：其中每一個數字都是一個大小為20*20畫素的影象，如果把每個畫素作為一個輸入單元，那有400個輸入。考慮到神經網路還需要增加一個額外輸入單元

用tensorflow實現AlexNet網路

AlexNet網路：

相關推薦