Tensorflow實戰（五）經典卷積神經網路之實現VGGNet

阿新 • • 發佈：2019-01-03

演算法原理：

VGGNet探索了卷積神經網路深度與其效能之間的關係，通過反覆的堆疊3*3的小型卷積核和2*2的最大池化層，VGGNet成功的構建了16-19層深的卷積神經網路。。

VGGNet擁有5段卷積，每一段內有2-3個卷積層，同時尾部會連線一個最大池化

實驗程式碼：

# -*- coding: utf-8 -*-
"""
Created on Tue Jan 23 18:57:20 2018

@author: Administrator
"""

from datetime import datetime
import math
import time
import tensorflow as tf
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
batch_size=32
num_batches=100

def conv_op(input_op,name,kh,kw,n_out,dh,dw,p):
    n_in=input_op.get_shape()[-1].value
    
    with tf.name_scope(name) as scope:
        kernel=tf.get_variable(scope+"w",shape=[kh,kw,n_in,n_out],dtype=tf.float32,
                               initializer=tf.contrib.layers.xavier_initializer_conv2d())
        conv=tf.nn.conv2d(input_op,kernel,(1,dh,dw,1),padding='SAME')
        biases_init_val=tf.constant(0.0,shape=[n_out],dtype=tf.float32)
        biases=tf.Variable(biases_init_val,trainable=True,name='b')
        z=tf.nn.bias_add(conv,biases)
        activtion=tf.nn.relu(z,name=scope)
        p+=[kernel,biases]
        return activtion
    #全連線層
def fc_op(input_op,name,n_out,p):
    n_in=input_op.get_shape()[-1].value

    with tf.name_scope(name) as scope:
        kernel=tf.get_variable(scope+"w",shape=[n_in,n_out],dtype=tf.float32,
                               initializer=tf.contrib.layers.xavier_initializer_conv2d())
       
        biases_init_val=tf.constant(0.1,shape=[n_out],dtype=tf.float32)
        biases=tf.Variable(biases_init_val,trainable=True,name='b')
      
        activtion=tf.nn.relu_layer(input_op,kernel,biases,name=scope)
        p+=[kernel,biases]
        return activtion    
def mpool_op(inout_op,name,kh,kw,dh,dw):
    return tf.nn.max_pool(inout_op,ksize=[1,kh,kw,1],
                          strides=[1,dh,dw,1],padding='SAME',name=name)
def interfence_op(input_op,keep_prob):
    p=[]
    
    conv1_1=conv_op(input_op,name="conv1_1",kh=3,kw=3,n_out=64,dh=1,dw=1,p=p)
    conv1_2=conv_op(conv1_1,name="conv1_2",kh=3,kw=3,n_out=64,dh=1,dw=1,p=p)
    pool1=mpool_op(conv1_2,name="pool1",kh=2,kw=2,dh=2,dw=2)
    
    conv2_1=conv_op(pool1,name="conv2_1",kh=3,kw=3,n_out=128,dh=1,dw=1,p=p)
    conv2_2=conv_op(conv2_1,name="conv2_2",kh=3,kw=3,n_out=128,dh=1,dw=1,p=p)
    pool2=mpool_op(conv2_2,name="pool2",kh=2,kw=2,dh=2,dw=2)

    conv3_1=conv_op(pool2,name="conv3_1",kh=3,kw=3,n_out=256,dh=1,dw=1,p=p)
    conv3_2=conv_op(conv3_1,name="conv3_2",kh=3,kw=3,n_out=256,dh=1,dw=1,p=p)
    conv3_3=conv_op(conv3_2,name="conv3_3",kh=3,kw=3,n_out=256,dh=1,dw=1,p=p)
    pool3=mpool_op(conv3_3,name="pool3",kh=2,kw=2,dh=2,dw=2)

    conv4_1=conv_op(pool3,name="conv4_1",kh=3,kw=3,n_out=512,dh=1,dw=1,p=p)
    conv4_2=conv_op(conv4_1,name="conv4_2",kh=3,kw=3,n_out=512,dh=1,dw=1,p=p)
    conv4_3=conv_op(conv4_2,name="conv4_3",kh=3,kw=3,n_out=512,dh=1,dw=1,p=p)
    pool4=mpool_op(conv4_3,name="pool4",kh=2,kw=2,dh=2,dw=2)
        
    conv5_1=conv_op(pool4,name="conv5_1",kh=3,kw=3,n_out=512,dh=1,dw=1,p=p)
    conv5_2=conv_op(conv5_1,name="conv5_2",kh=3,kw=3,n_out=512,dh=1,dw=1,p=p)
    conv5_3=conv_op(conv5_2,name="conv5_3",kh=3,kw=3,n_out=512,dh=1,dw=1,p=p)
    pool5=mpool_op(conv5_3,name="pool5",kh=2,kw=2,dh=2,dw=2)    
    
    shp=pool5.get_shape()
    flattened_shape=shp[1].value*shp[2].value*shp[3].value
    resh1=tf.reshape(pool5,[-1,flattened_shape],name="resh1")
    
    
    #全連線層
    fc6=fc_op(resh1,name='fc6',n_out=4096,p=p)
    fc6_drop=tf.nn.dropout(fc6,keep_prob,name='fc6_drop')
    
    #全連線層
    fc7=fc_op(fc6_drop,name='fc7',n_out=4096,p=p)
    fc7_drop=tf.nn.dropout(fc7,keep_prob,name='fc7_drop')
    
    fc8=fc_op(fc7_drop,name='fc8',n_out=1000,p=p)
    softmax=tf.nn.softmax(fc8)
    predictions=tf.argmax(softmax,1)
    return predictions,softmax,fc8,p

def time_tensorflow_run(session,target,feed,info_string):
        num_steps_brun_in=10
        total_duration=0.0
        total_duration_squared=0.0
        for i in range(num_batches+num_steps_brun_in):
            start_time=time.time()
            _=session.run(target,feed_dict=feed)
            duration=time.time()-start_time
            if i>=num_steps_brun_in:
                if not i%10:
                    print('%s:step %d,duration=%3f'%(datetime.now(),
                                                     i-num_steps_brun_in,
                                                     duration))
                total_duration+=duration
                total_duration_squared+=duration*duration
        mn=total_duration/num_batches
        vr=total_duration_squared/num_batches-mn*mn
        sd=math.sqrt(vr)
        print('%s: %s across %d steps,%.3f+-%.3f sec/batch'%(datetime.now(),
                                                                     info_string,
                                                                     num_batches,
                                                                     mn,
                                                                     sd))
def run_benchmark():
        with tf.Graph().as_default():
            image_size=224
            images=tf.Variable(tf.random_normal([batch_size,image_size,image_size,3],
                                                dtype=tf.float32,stddev=1e-1))
            keep_prob=tf.placeholder(tf.float32)
            predictions,softmax,fc8,p=interfence_op(images,keep_prob)
            init=tf.global_variables_initializer()
            sess=tf.Session()
            sess.run(init)
            time_tensorflow_run(sess,predictions,{keep_prob:1.0},"forward")
            objective=tf.nn.l2_loss(fc8)
            grad=tf.gradients(objective,p)
            time_tensorflow_run(sess,grad,"forward-backward")            
    
run_benchmark()

遇到的錯誤：

Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX AVX2
Found device 0 with properties:
name: GeForce 820M major: 2 minor: 1 memoryClockRate(GHz): 1.25
pciBusID: 0000:01:00.0
totalMemory: 2.00GiB freeMemory: 1.94GiB
Ignoring visible gpu device (device: 0, name: GeForce 820M, pci bus id: 0000:01:00.0, compute capability: 2.1) with Cuda compute capability 2.1. The minimum required Cuda capability is 3.0.

Tensorflow實戰（五）經典卷積神經網路之實現VGGNet

演算法原理： VGGNet探索了卷積神經網路深度與其效能之間的關係，通過反覆的堆疊3*3的小型卷積核和2*2的最大池化層，VGGNet成功的構建了16-19層深的卷積神經網路。。 VGGNet擁有5段卷積，每一段內有2-3個卷積層，同時尾部會連線一

深度學習方法（五）：卷積神經網路CNN經典模型整理Lenet，Alexnet，Googlenet，VGG，Deep Residual Learning

歡迎轉載，轉載請註明：本文出自Bin的專欄blog.csdn.net/xbinworld。技術交流QQ群：433250724，歡迎對演算法、技術感興趣的同學加入。關於卷積神經網路CNN，網路和文獻中有非常多的資料，我在工作/研究中也用了好一段時間各種常見的model了，就想著

TensorFlow實戰：Chapter-4（CNN-2-經典卷積神經網路（AlexNet、VGGNet））

引言 AlexNet AlexNet 簡介 AlexNet的特點 AlexNet論文分析引言

TensorFlow實戰：Chapter-6（CNN-4-經典卷積神經網路（ResNet）)

ResNet ResNet簡介 ResNet(Residual Neural Network)由微軟研究院的何凱明大神等4人提出，ResNet通過使用Residual Unit成功訓練152層神經網路，在ILSCRC2015年比賽中獲得3.75%的

TensorFlow實戰：Chapter-5（CNN-3-經典卷積神經網路（GoogleNet）)

GoogleNet GoogleNet 簡介本節講的是GoogleNet，這裡面的Google自然代表的就是科技界的老大哥Google公司。 Googe Inceptio

Keras學習（四）——CNN卷積神經網路

本文主要介紹使用keras實現CNN對手寫資料集進行分類。示例程式碼： import numpy as np from keras.datasets import mnist from keras.utils import np_utils from keras.models impo

DeepLearning tutorial（4）CNN卷積神經網路原理簡介+程式碼詳解

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

深度學習基礎（二）—— 從多層感知機（MLP）到卷積神經網路（CNN）

經典的多層感知機（Multi-Layer Perceptron）形式上是全連線（fully-connected）的鄰接網路（adjacent network）。 That is, every neuron in the network is connec

深度學習進階（六）--CNN卷積神經網路除錯，錯誤歷程總結

總結一下今天的學習過程（注：我此刻的心情與剛剛三分鐘前的心情是完全不一樣的）（昨天在想一些錯誤，今天又重拾信心重新配置GPU環境，結果很失敗，不過現在好了，在尋思著今天干了什麼的時候，無意間想到是不是自己方法入口不對啊。結果果然很幸運的被我猜到了，，，哈哈哈，我的心情又

深度學習筆記（基礎）——（六）全卷積神經網路（FCN）

通常CNN在卷積層之後會接上若干個全連線層，將卷積層產生的特徵圖（Feature Map）對映成一個固定長度的特徵向量進行分類。以AlexNet為代表的經典CNN結構適合於影象級的分類和迴歸任務，因為它們最後都期望得到整個輸入影象的一個數值描述，如AlexN

《Tensorflow實戰》 cifar10進階卷積神經網路

#1.cifar10 資料集 CIFAR-10資料集包含10個類的60000張32x32的彩色影象，每個類有6000張影象．有50000張訓練影象和10000張測試影象. 圖如下： #2.模型訓練 import cifar10 import cifar10_input import

卷積神經網路學習（一）——基本卷積神經網路搭建

#!/usr/bin/env python # -*- coding:utf-8 -*- import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data # numb

深度學習（6）——基於卷積神經網路的影象樣式轉換

基於卷積神經網路的影象樣式轉換摘要以不同風格呈現影象的語義內容是困難的影象處理任務。可以說，先前方法的主要限制因素是缺乏明確表示語義資訊的影象表示，不能將影象內容與樣式分離。在這裡，我們使用從針對物件識別優化的卷積神經網路匯出的影象表示，這使得高

卷積神經網路（三）：卷積神經網路CNN的簡單實現（部分Python原始碼）

上週末利用python簡單實現了一個卷積神經網路，只包含一個卷積層和一個maxpooling層，pooling層後面的多層神經網路採用了softmax形式的輸出。實驗輸入仍然採用MNIST影象使用10個feature map時，卷積和pooling的結果分別如下所示。

機器學習筆記（十五）：TensorFlow實戰七（經典卷積神經網路：VGG）

1 - 引言之前我們介紹了LeNet-5和AlexNet，在AlexNet發明之後，卷積神經網路的層數開始越來越複雜，VGG-16就是一個相對前面2個經典卷積神經網路模型層數明顯更多了。 VGGNet是牛津大學計算機視覺組（Visual Geometry Group）和Google

機器學習筆記（十三）：TensorFlow實戰五（經典卷積神經網路： LeNet -5 ）

1 - 引言之前我們介紹了一下卷積神經網路的基本結構——卷積層和池化層。通過這兩個結構我們可以任意的構建各種各樣的卷積神經網路模型，不同結構的網路模型也有不同的效果。但是怎樣的神經網路模型具有比較好的效果呢？下圖展示了CNN的發展歷程。經過人們不斷的嘗試，誕生了許多有

機器學習筆記（十四）：TensorFlow實戰六（經典卷積神經網路：AlexNet ）

1 - 引言 2012年，Imagenet比賽冠軍的model——Alexnet [2]（以第一作者alex命名）。這個網路算是一個具有突破性意義的模型首先它證明了CNN在複雜模型下的有效性，然後GPU實現使得訓練在可接受的時間範圍內得到結果，讓之後的網路模型構建變得更加複雜，並且通過

機器學習筆記（十七）：TensorFlow實戰九（經典卷積神經網路：ResNet）

1 - 引言我們可以看到CNN經典模型的發展從 LeNet -5、AlexNet、VGG、再到Inception，模型的層數和複雜程度都有著明顯的提高，有些網路層數更是達到100多層。但是當神經網路的層數過高時，這些神經網路會變得更加難以訓練。一個特別大的麻煩就在於訓練的時候會產

機器學習筆記（十六）：TensorFlow實戰八（經典卷積神經網路：GoogLeNet）

1 - 引言 GoogLeNet, 在2014年ILSVRC挑戰賽獲得冠軍，將Top5 的錯誤率降低到6.67%. 一個22層的深度網路論文地址：http://arxiv.org/pdf/1409.4842v1.pdf 題目為：Going deeper with convolu

TensorFlow實戰：經典卷積神經網路（AlexNet、VGGNet）

下面表格是兩個網路的簡單比較: 特點 AlexNet VGGNet 論文貢獻介紹完整CNN架構模型(近些年的許多CNN模型都是依據此模型變種來的)和多種訓練技巧 CNN模型復興的開山之作使用GPU加速

Tensorflow實戰（五）經典卷積神經網路之實現VGGNet

演算法原理：

實驗程式碼：

遇到的錯誤：

相關推薦