用cifar10訓練一個卷積神經網路

阿新 • • 發佈：2018-12-23

今天按照教程搭建了一個神經網路，這裡總結一下。搭建神經網路的結構如下所示：

我們搭建自己的網路時，一般先確定自己的網路架構，然後計算個層引數，做好這些預備工作之後就可以開始寫程式碼了。

#匯入所需要的包
import cifar10,cifar10_input
import tensorflow as tf
import numpy as np
import time
import math


max_step=3000#迭代3000次
batch_size=128#每次迭代使用128張圖片
#下載cifar10的預設路徑
data_dir='/tmp/cifar10_data/cifar-10-batches-bin'

#定義權重函式
def variable_with_weight_loss(shape,stddev,w1):
    var=tf.Variable(tf.truncated_normal(shape,stddev=stddev))
    if w1 is not None:
        weight_loss=tf.multiply(tf.nn.l2_loss(var),w1,name='weight_loss')
        # 我們使用tf.add_to_collection把weight loss統一存到一個collection，這個collection名為"losses"，它會在後面計算神經網路總體loss時被用上
        tf.add_to_collection("losses", weight_loss)

    return var

# 下載cifar10類的資料集，並解壓，展開到其預設位置
cifar10.maybe_download_and_extract()
#按每一批次來讀取資料
images_train,labels_train=cifar10_input.distorted_inputs(
    data_dir=data_dir,
    batch_size=batch_size)
images_test,labels_test=cifar10_input.inputs(eval_data=True,
                                             data_dir=data_dir,
                                             batch_size=batch_size)
# 因為batch_size在之後定義網路結構時被用到了，所以資料尺寸中的第一個值即樣本條數需要被預先設定，而不能像以前那樣設定為None
# 而資料尺寸中的圖片尺寸為24*24即是剪裁後的大小，顏色通道數則設為3
# 這裡寫batch_size而不是None 因為後面程式碼中get_shape會拿到這裡面的batch_size
#訓練集多少行，就有多少個Label
image_holder=tf.placeholder(tf.float32,[batch_size,24,24,3])
labels_holder=tf.placeholder(tf.int32,[batch_size])

#第一個卷積層,64個卷積核，卷積核大小是5*5，3通道
weight1=variable_with_weight_loss(shape=[5,5,3,64],stddev=5e-2,
                                  w1=0.0)#初始化引數
kernel1=tf.nn.conv2d(image_holder,weight1,[1,1,1,1],padding='SAME')#卷積
bias1=tf.Variable(tf.constant(0.0,shape=[64]))#初始化引數
conv1=tf.nn.relu(tf.nn.bias_add(kernel1,bias1))#使用啟用函式啟用
# 使用尺寸3*3步長2*2的最大池化層處理資料，這裡最大池化的尺寸和步長不一樣，可以增加資料的豐富性
pool1=tf.nn.max_pool(conv1,ksize=[1,3,3,1],strides=[1,2,2,1],padding='SAME')
# 使用LRN對結果進行處理
norm1=tf.nn.lrn(pool1,4,bias=0.1,alpha=0.001/9.0,beta=0.75)


#第二個卷積層
weight2=variable_with_weight_loss(shape=[5,5,64,64],stddev=5e-2,
                                  w1=0.0)#初始化引數
kernel2=tf.nn.conv2d(norm1,weight2,[1,1,1,1],padding='SAME')#卷積
bias2=tf.Variable(tf.constant(0.1,shape=[64]))#初始化引數
conv2=tf.nn.relu(tf.nn.bias_add(kernel2,bias2))#使用啟用函式啟用
# 使用LRN對結果進行處理
norm2=tf.nn.lrn(conv2,4,bias=0.1,alpha=0.001/9.0,beta=0.75)
# 使用尺寸3*3步長2*2的最大池化層處理資料，這裡最大池化的尺寸和步長不一樣，可以增加資料的豐富性
pool2=tf.nn.max_pool(norm2,ksize=[1,3,3,1],strides=[1,2,2,1],padding='SAME')

#全連線層
#使用tf.reshape函式將每個樣本都變成一維向量，使用get_shape函式獲取資料扁平化之後的長度
reshape=tf.reshape(pool2,[batch_size,-1])
dim=reshape.get_shape()[1].value
# 接著初始化權值，隱含節點384個，正太分佈的標準差設為0.04，bias的值也初始化為0.1
# 注意這裡我們希望這個全連線層不要過擬合，因此設了一個非零的weight loss值0.04，讓這一層具有L2正則所約束。
weight3=variable_with_weight_loss(shape=[dim,384],stddev=0.04,w1=0.004)
bias3=tf.Variable(tf.constant(0.1,shape=[384]))#寫0.1是為了Relu小於0時全為0，所以給0.1不至於成為死亡神經元
# 最後我們依然使用ReLU啟用函式進行非線性化
local3=tf.nn.relu(tf.matmul(reshape,weight3)+bias3)

#第二個全連線層
weight4=variable_with_weight_loss(shape=[384,192],stddev=1/192.0,w1=0.0)
bias4=tf.Variable(tf.constant(0.0,shape=[192]))
local4=tf.nn.relu(tf.matmul(local3,weight4)+bias4)

#最後一層(輸出層)
weight5=variable_with_weight_loss(shape=[192,10],stddev=1/192.0,w1=0.0)
bias5=tf.Variable(tf.constant(0.0,shape=[10]))
logits=tf.add(tf.matmul(local4,weight5),bias5)

#定義loss函式
def loss(logits,labels):
    labels=tf.cast(labels,tf.int64)
    #把softmax的計算和cross_entropy的計算合在了一起
    cross_entropy=tf.nn.sparse_softmax_cross_entropy_with_logits(
        logits=logits,labels=labels,name='cross_entropy_per_example')
    #對 cross entropy計算均值
    cross_entropy_mean=tf.reduce_mean(cross_entropy,name='cross_entropy')
    #使用tf.add_n將整體losses的collection集合中的全部loss求和，得到最終的loss
    tf.add_to_collection('losses',cross_entropy_mean)

    return tf.add_n(tf.get_collection('losses'),name='total_loss')


loss=loss(logits,labels_holder)#logits輸出的結果
train_op=tf.train.AdamOptimizer(1e-3).minimize(loss)
# 使用 tf.nn.in_top_k()函式求輸出結果中 top k的準確率，預設使用top 1，也就是輸出分數最高的那一類的準確率
top_k_op=tf.nn.in_top_k(logits,labels_holder,1)

sess=tf.InteractiveSession()
tf.global_variables_initializer().run()
# 啟動圖片資料增強的執行緒佇列，這裡一共使用了16個執行緒來進行加速，如果不啟動執行緒，那麼後續inference以及訓練的操作都是無法開始的
tf.train.start_queue_runners()

#訓練
for step in range(max_step):
    start_time=time.time()
    image_batch,label_batch=sess.run([images_train,labels_train])
    _,loss_value=sess.run([train_op,loss],
                          feed_dict={image_holder:image_batch,labels_holder:label_batch})
    duration=time.time()-start_time

    if step %10 == 0:
        examples_per_sec=batch_size/duration
        sec_per_batch=float(duration)

        format_str=('step %d,loss=%.2f(%.1f examples/sec;%.3f sec/batch)')
        print(format_str%(step,loss_value,examples_per_sec,sec_per_batch))

#評測模型在測試集上的準確率
num_examples=10000

num_iter=int(math.ceil(num_examples/batch_size))
true_count=0
total_sample_count=num_iter*batch_size
step=0
while step<num_iter:
    image_batch,label_batch=sess.run([images_test,labels_test])#取測試集中的資料
    predictions=sess.run([top_k_op],feed_dict={image_holder:image_batch,labels_holder:label_batch})#有多少個相同的結果預測出的和真實的比較
    
    true_count+=np.sum(predictions)
    step+=1

precision=true_count/total_sample_count#預測對的和總的樣本數
print('precision @ 1=%.3f'%precision)

用cifar10訓練一個卷積神經網路

今天按照教程搭建了一個神經網路，這裡總結一下。搭建神經網路的結構如下所示：我們搭建自己的網路時，一般先確定自己的網路架構，然後計算個層引數，做好這些預備工作之後就可以開始寫程式碼了。 #匯入所需要的包 import cifar10,cifar10_input import tenso

用tensorflow實現一個卷積神經網路

學了一段深度學習，最近學了tensorflow，所以想自己去根據教程寫一個簡單的卷積神經網路。 CNN：卷積神經網路的實現一個卷積神經網路的結構一般是由輸入-->卷積-->池化-->卷積-->池化-->............-->全連線-->全連

用PyTorch實現一個卷積神經網路進行影象分類

1. 回顧在進入這一篇部落格的內容之前，我們先確保已經成功安裝好PyTorch，可以參考我之前的一篇部落格“Ubuntu12.04下PyTorch詳細安裝記錄”： http://blog.csdn.net/wblgers1234/article/details/729020161接下來，我們用設計一個簡單

用keras小試CNN卷積神經網路應用於人臉識別

Keras是一個簡約，高度模組化的神經網路庫。採用Python / Theano開發。使用Keras如果你需要一個深度學習庫：可以很容易和快速實現原型（通過總模組化，極簡主義，和可擴充套件性）同時支援卷積網路（vision）和複發性的網路（序列資料）。以及兩者的組合。

《Tensorflow實戰》 cifar10進階卷積神經網路

#1.cifar10 資料集 CIFAR-10資料集包含10個類的60000張32x32的彩色影象，每個類有6000張影象．有50000張訓練影象和10000張測試影象. 圖如下： #2.模型訓練 import cifar10 import cifar10_input import

用TensorFlow訓練卷積神經網路——識別驗證碼

需要用到的包：numpy、tensorflow、captcha、matplotlib、PIL、random import numpy as np import tensorflow as tf # 深度學習庫 from captcha.image import ImageCaptcha

Tensorflow（三）訓練一個簡單卷積神經網路

這是吳恩達老師第四課第一週的程式設計練習，題目是分析圖片中手勢得到手所表示的數字。特別要注意的是，如果你使用的是新版本的tensorflow，很有可能得到的結果和Coursera上的有所不同！ 1. 先簡單介紹一個CNN（直接看程式碼的請往下翻） CNN全程是

4用於cifar10的卷積神經網路-4.6設計模型訓練和評估的會話流程

在TensorFlow中實現這個網路模型 0、載入資料集 1、啟動會話 2、一輪一輪的訓練模型 2.1、在每一輪中分多個批次餵給資料 2.1.1在每個批次上執行訓練節點，訓練模型 2.1.2經過

MatConvNet卷積神經網路（四）——用自己的資料訓練

嘗試過從Matconvnet官網上下載的已經訓練好的神經網路之後，最近自己訓練了能夠識別果樹上紅蘋果的神經網路。先上圖。原始碼放在https://github.com/YunpengZhai/MATCONVNET 10/21/2016 更新：把滑動窗的程式碼放到了githu

TensorFlow官方文件樣例——三層卷積神經網路訓練MNIST資料

上篇部落格根據TensorFlow官方文件樣例實現了一個簡單的單層神經網路模型，在訓練10000次左右可以達到92.7%左右的準確率。但如果將神經網路的深度拓展，那麼很容易就能夠達到更高的準確率。官方中文文件中就提供了這樣的樣例，它的網路結構如

用卷積神經網路和自注意力機制實現QANet（問答網路）

歡迎大家關注我們的網站和系列教程：http://www.tensorflownews.com/，學習更多的機器學習、深度學習的知識！在這篇文章中，我們將解決自然語言處理（具體是指問答）中最具挑戰性但最有趣的問題之一。我們將在Tensorflow中實現Google的QANet。就像它

Tensorflow學習教程------利用卷積神經網路對mnist資料集進行分類_利用訓練好的模型進行分類

#coding:utf-8 import tensorflow as tf from PIL import Image,ImageFilter from tensorflow.examples.tutorials.mnist import input_data def imageprepare(ar

搭建簡單圖片分類的卷積神經網路（二）-- CNN模型與訓練

一、首先，簡單來說CNN卷積神經網路與BP神經網路主要區別在於： 1、網路的層數的多少（我這裡的CNN是比較簡單的，層數較少，真正應用的話，層數是很多的）。 2、CNN名稱來說，具有卷積運算的特點，對於大型的圖片或者數量多的圖片，卷積運算可以大量提高計算效能，而BP神經網路大都為全連線層，計

搭建簡單圖片分類的卷積神經網路（一）-- 訓練模型的圖片資料預處理

一、訓練之前資料的預處理主要包括兩個方面 1、將圖片資料統一格式，以標籤來命名並存到train資料夾中（假設原始圖片按類別存到資料夾中）。 2、對命名好的圖片進行訓練集和測試集的劃分以及圖片資料化。先對整個專案檔案進行說明：專案資料夾

《TensorFlow實戰》中AlexNet卷積神經網路的訓練中

TensorFlow實戰中AlexNet卷積神經網路的訓練 01 出錯 TypeError: as_default() missing 1 required positional argument: 'self' 經過百度、谷歌的雙重查詢，沒找到就具體原因。後面去TensorFlow官方文件中發現，tf

TensorFlow實現CNN卷積神經網路對手寫數字集mnist的模型訓練

mnist手寫數字集相當於是TensorFlow應用中的Helloworld。在學習了TensorFlow的卷積神經網路應用之後，今天就分步解析一下其應用過程一、mnist手寫數字資料集 MN

一步一步學用Tensorflow構建卷積神經網路

摘要：本文主要和大家分享如何使用Tensorflow從頭開始構建和訓練卷積神經網路。這樣就可以將這個知識作為一個構建塊來創造有趣的深度學習應用程式了。 0. 簡介在過去，我寫的主要都是“傳統類”的機器學習文章，如樸素貝葉斯分類、邏輯迴歸和Perceptron演算法。在過去的

官方卷積神經網路cifar10原始碼的學習筆記（多塊GPU）

先前只有自己的遊戲本有一塊GTX1050的GPU，所以對於官方的卷積神經網路教程，僅僅是按照自己的理解將教程簡單化，具體見部落格卷積神經網路：CIFAR-10訓練和測試（單塊GPU），現如今導師提供了具有兩塊GTX1080TiGPU 的工作站，硬體條件支援了，所以就將此教程完

TensorFlow訓練MNIST資料集（3） —— 卷積神經網路

　　前面兩篇隨筆實現的單層神經網路和多層神經網路，在MNIST測試集上的正確率分別約為90%和96%。在換用多層神經網路後，正確率已有很大的提升。這次將採用卷積神經網路繼續進行測試。 1、模型基本結構　　如下圖所示，本次採用的模型共有8層（包含dropout層）。其中卷積層和池化層各有兩層。　　在

cs231n斯坦福基於卷積神經網路的CV學習筆記（二）神經網路訓練細節

五，神經網路注意點part1 例項：邏輯迴歸二層神經網路訓練函式使用權重w和偏差值biase計算出第一個隱含層h，然後計算損失，評分，進行反向傳播回去多種常用啟用函式（一般預設max（0，x）），如sigmoid函式具有飽和區梯度0，非零點中心，計算x複

用cifar10訓練一個卷積神經網路

相關推薦