基於cifar10實現卷積神經網路影象識別

阿新 • • 發佈：2018-12-14

  1 import tensorflow as tf
  2 import numpy as np
  3 import math
  4 import time
  5 import cifar10
  6 import cifar10_input
  7 """
  8 Created on Tue Nov 27 17:31:35 2018
  9 @author: zhen
 10 """
 11 max_steps = 1000
 12 # 下載cifar10資料集的預設路徑
 13 batch_size = 128
 14 data_dir = "C:/Users/zhen/.spyder-py3/cifar/cifar-10/cifar-10-batches/cifar-10-batches-bin 
"
 15 
 16 def variable_with_weight_losses(shape, stddev, wl):
 17     # 定義初始化weights的函式
 18     var = tf.Variable(tf.truncated_normal(shape, stddev=stddev))
 19     if wl is not None:
 20         weight_loss = tf.multiply(tf.nn.l2_loss(var), wl, name='weight_loss')
 21         tf.add_to_collection(" 
losses", weight_loss)
 22     return var
 23 
 24 # 下載資料
 25 cifar10.maybe_download_and_extract()
 26 # 載入訓練資料
 27 images_train, labels_train = cifar10_input.distorted_inputs(data_dir=data_dir, batch_size=batch_size)
 28 # 生成測試資料
 29 images_test, labels_test = cifar10_input.inputs(eval_data=True, data_dir=data_dir, batch_size=batch_size)
 
 30 
 31 image_holder = tf.placeholder(tf.float32, [batch_size, 24, 24, 3])
 32 label_holder = tf.placeholder(tf.int32, [batch_size])
 33 
 34 # 設定第一層卷積層
 35 weight_1 = variable_with_weight_losses(shape=[5, 5, 3, 64], stddev=5e-2, wl=0.0)
 36 kernel_1 = tf.nn.conv2d(image_holder, filter=weight_1, strides=[1, 1, 1, 1], padding='SAME')
 37 bias_1 = tf.Variable(tf.constant(0.0, shape=[64]))
 38 # 卷積
 39 conv_1 = tf.nn.relu(tf.nn.bias_add(kernel_1, bias_1))
 40 # 池化
 41 pool_1 = tf.nn.max_pool(conv_1, ksize=[1, 3, 3, 1], strides=[1, 2, 2, 1], padding='SAME')
 42 norm_1 = tf.nn.lrn(pool_1, 4, bias=1.0, alpha=0.001 / 9.0, beta=0.75)
 43 
 44 # 設定第二層卷積層
 45 weight_2 = variable_with_weight_losses(shape=[5, 5, 64, 64], stddev=5e-2, wl=0.0)
 46 kernel_2 = tf.nn.conv2d(norm_1, weight_2, [1, 1, 1, 1], padding='SAME')
 47 bias_2 = tf.Variable(tf.constant(0.1, shape=[64]))
 48 
 49 conv_2 = tf.nn.relu(tf.nn.bias_add(kernel_2, bias_2))
 50 norm_2 = tf.nn.lrn(conv_2, 4, bias=1.0, alpha=0.001 / 9.0, beta=0.75)
 51 pool_2 = tf.nn.max_pool(norm_2, ksize=[1, 3, 3, 1], strides=[1, 2, 2, 1], padding='SAME')
 52 
 53 # 全連線層
 54 reshape = tf.reshape(pool_2, [batch_size, -1])
 55 dim = reshape.get_shape()[1].value
 56 
 57 weight_3 = variable_with_weight_losses(shape=[dim, 384], stddev=0.04, wl=0.004)
 58 bias_3 = tf.Variable(tf.constant(0.1, shape=[384]))
 59 local_3 = tf.nn.relu(tf.matmul(reshape, weight_3) + bias_3)
 60 
 61 # 第二層全連線層
 62 weight_4 = variable_with_weight_losses(shape=[384, 192], stddev=0.04, wl=0.004)
 63 bias_4 = tf.Variable(tf.constant(0.1, shape=[192]))
 64 local_4 = tf.nn.relu(tf.matmul(local_3, weight_4) + bias_4)
 65 
 66 # 結果層
 67 weight_5 = variable_with_weight_losses(shape=[192, 10], stddev=1/192.0, wl=0.0)
 68 bias_5 = tf.Variable(tf.constant(0.0, shape=[10]))
 69 logits = tf.add(tf.matmul(local_4, weight_5), bias_5)
 70 
 71 def loss(logits, labels):
 72     labels = tf.cast(labels, tf.int64)
 73     cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits(
 74         logits=logits,
 75         labels=labels,
 76         name="cross_entropy_per_example"
 77     )
 78     cross_entropy_mean = tf.reduce_mean(cross_entropy, name="cross_entropy")
 79     tf.add_to_collection("losses", cross_entropy_mean)
 80     return tf.add_n(tf.get_collection("losses"), name="total_loss")
 81 
 82 loss = loss(logits=logits, labels=label_holder)
 83 train_op = tf.train.AdamOptimizer(1e-3).minimize(loss)
 84 top_k_op = tf.nn.in_top_k(logits, label_holder, 1)
 85 sess = tf.InteractiveSession()
 86 tf.global_variables_initializer().run()
 87 tf.train.start_queue_runners()
 88 
 89 # 訓練
 90 for step in range(max_steps):
 91     start_time = time.time()
 92     image_batch, label_batch = sess.run([images_train, labels_train])
 93     _, loss_value = sess.run([train_op, loss], feed_dict={image_holder: image_batch, label_holder: label_batch})
 94     duration = time.time() - start_time
 95     
 96     if step % 10 == 0:
 97         examples_per_sec = batch_size / duration
 98         sec_per_batch = float(duration)
 99         
100         format_str = "step %d, loss =%.2f (%.1f examples/sec; %.3f sec/batch"
101         print(format_str % (step, loss_value, examples_per_sec, sec_per_batch))
102 
103 # 評估模型
104 num_examples = 10000
105 num_iter = int(math.ceil(num_examples / batch_size))
106 true_count = 0
107 total_sample_count = num_iter * batch_size
108 step = 0
109 while step < num_iter:
110     image_batch, label_batch = sess.run([images_test, labels_test])
111     predictions = sess.run([top_k_op], feed_dict={image_holder: image_batch, label_holder: label_batch})
112     true_count += np.sum(predictions)
113     step += 1
114     
115 precision = true_count / total_sample_count
116 print("precision @ 1 = %.3f" % precision)

過程：

Filling queue with 20000 CIFAR images before starting to train. This will take a few minutes.
step 0, loss =4.68 (19.0 examples/sec; 6.734 sec/batch
step 10, loss =3.58 (62.1 examples/sec; 2.062 sec/batch
step 20, loss =3.09 (62.5 examples/sec; 2.047 sec/batch
step 30, loss =2.77 (62.5 examples/sec; 2.047 sec/batch
step 40, loss =2.48 (62.5 examples/sec; 2.047 sec/batch
step 50, loss =2.36 (62.5 examples/sec; 2.047 sec/batch
step 60, loss =2.13 (60.2 examples/sec; 2.125 sec/batch
step 70, loss =1.95 (63.0 examples/sec; 2.031 sec/batch
step 80, loss =2.01 (62.1 examples/sec; 2.062 sec/batch
step 90, loss =1.90 (63.5 examples/sec; 2.016 sec/batch
step 100, loss =1.93 (62.5 examples/sec; 2.047 sec/batch
step 110, loss =1.96 (62.1 examples/sec; 2.062 sec/batch
step 120, loss =1.92 (62.3 examples/sec; 2.055 sec/batch
step 130, loss =1.81 (63.5 examples/sec; 2.016 sec/batch
step 140, loss =1.86 (59.8 examples/sec; 2.141 sec/batch
step 150, loss =1.88 (64.0 examples/sec; 2.000 sec/batch
step 160, loss =1.87 (62.5 examples/sec; 2.047 sec/batch
step 170, loss =1.73 (49.6 examples/sec; 2.578 sec/batch
step 180, loss =1.86 (62.1 examples/sec; 2.062 sec/batch
step 190, loss =1.71 (62.5 examples/sec; 2.047 sec/batch
step 200, loss =1.63 (63.0 examples/sec; 2.031 sec/batch
step 210, loss =1.63 (63.5 examples/sec; 2.016 sec/batch
step 220, loss =1.67 (62.1 examples/sec; 2.063 sec/batch
step 230, loss =1.72 (62.5 examples/sec; 2.047 sec/batch
step 240, loss =1.76 (62.1 examples/sec; 2.062 sec/batch
step 250, loss =1.67 (61.6 examples/sec; 2.078 sec/batch
step 260, loss =1.67 (62.5 examples/sec; 2.047 sec/batch
step 270, loss =1.59 (63.0 examples/sec; 2.031 sec/batch
step 280, loss =1.55 (62.5 examples/sec; 2.047 sec/batch
step 290, loss =1.64 (62.5 examples/sec; 2.047 sec/batch
step 300, loss =1.63 (62.1 examples/sec; 2.062 sec/batch
step 310, loss =1.49 (62.1 examples/sec; 2.062 sec/batch
step 320, loss =1.49 (62.5 examples/sec; 2.047 sec/batch
step 330, loss =1.61 (62.1 examples/sec; 2.062 sec/batch
step 340, loss =1.55 (61.1 examples/sec; 2.094 sec/batch
step 350, loss =1.63 (62.5 examples/sec; 2.047 sec/batch
step 360, loss =1.75 (61.6 examples/sec; 2.078 sec/batch
step 370, loss =1.54 (61.1 examples/sec; 2.094 sec/batch
step 380, loss =1.66 (61.6 examples/sec; 2.078 sec/batch
step 390, loss =1.66 (62.1 examples/sec; 2.062 sec/batch
step 400, loss =1.74 (62.1 examples/sec; 2.062 sec/batch
step 410, loss =1.60 (61.6 examples/sec; 2.078 sec/batch
step 420, loss =1.64 (62.5 examples/sec; 2.047 sec/batch
step 430, loss =1.59 (61.1 examples/sec; 2.094 sec/batch
step 440, loss =1.64 (59.8 examples/sec; 2.141 sec/batch
step 450, loss =1.67 (62.5 examples/sec; 2.047 sec/batch
step 460, loss =1.35 (60.7 examples/sec; 2.109 sec/batch
step 470, loss =1.45 (63.5 examples/sec; 2.016 sec/batch
step 480, loss =1.47 (62.5 examples/sec; 2.047 sec/batch
step 490, loss =1.37 (61.6 examples/sec; 2.078 sec/batch
step 500, loss =1.64 (63.0 examples/sec; 2.031 sec/batch
step 510, loss =1.58 (64.0 examples/sec; 2.000 sec/batch
step 520, loss =1.36 (63.5 examples/sec; 2.016 sec/batch
step 530, loss =1.30 (61.6 examples/sec; 2.078 sec/batch
step 540, loss =1.49 (62.5 examples/sec; 2.047 sec/batch
step 550, loss =1.46 (62.5 examples/sec; 2.047 sec/batch
step 560, loss =1.58 (63.0 examples/sec; 2.031 sec/batch
step 570, loss =1.46 (63.5 examples/sec; 2.016 sec/batch
step 580, loss =1.49 (64.5 examples/sec; 1.984 sec/batch
step 590, loss =1.30 (64.0 examples/sec; 2.000 sec/batch
step 600, loss =1.39 (64.5 examples/sec; 1.984 sec/batch
step 610, loss =1.62 (63.0 examples/sec; 2.031 sec/batch
step 620, loss =1.41 (62.1 examples/sec; 2.062 sec/batch
step 630, loss =1.29 (62.5 examples/sec; 2.047 sec/batch
step 640, loss =1.42 (63.5 examples/sec; 2.016 sec/batch
step 650, loss =1.36 (63.0 examples/sec; 2.031 sec/batch
step 660, loss =1.46 (63.5 examples/sec; 2.016 sec/batch
step 670, loss =1.26 (63.0 examples/sec; 2.031 sec/batch
step 680, loss =1.64 (62.1 examples/sec; 2.062 sec/batch
step 690, loss =1.39 (63.0 examples/sec; 2.031 sec/batch
step 700, loss =1.32 (61.6 examples/sec; 2.078 sec/batch
step 710, loss =1.36 (61.6 examples/sec; 2.078 sec/batch
step 720, loss =1.51 (62.1 examples/sec; 2.062 sec/batch
step 730, loss =1.48 (63.5 examples/sec; 2.016 sec/batch
step 740, loss =1.34 (61.1 examples/sec; 2.094 sec/batch
step 750, loss =1.44 (61.1 examples/sec; 2.094 sec/batch
step 760, loss =1.34 (60.7 examples/sec; 2.109 sec/batch
step 770, loss =1.46 (61.1 examples/sec; 2.094 sec/batch
step 780, loss =1.46 (60.7 examples/sec; 2.109 sec/batch
step 790, loss =1.42 (61.1 examples/sec; 2.094 sec/batch
step 800, loss =1.40 (63.0 examples/sec; 2.031 sec/batch
step 810, loss =1.46 (61.6 examples/sec; 2.078 sec/batch
step 820, loss =1.32 (62.1 examples/sec; 2.062 sec/batch
step 830, loss =1.46 (62.5 examples/sec; 2.047 sec/batch
step 840, loss =1.27 (64.0 examples/sec; 2.000 sec/batch
step 850, loss =1.38 (62.5 examples/sec; 2.047 sec/batch
step 860, loss =1.30 (63.0 examples/sec; 2.031 sec/batch
step 870, loss =1.18 (63.0 examples/sec; 2.031 sec/batch
step 880, loss =1.39 (62.5 examples/sec; 2.047 sec/batch
step 890, loss =1.17 (63.5 examples/sec; 2.016 sec/batch
step 900, loss =1.27 (62.1 examples/sec; 2.062 sec/batch
step 910, loss =1.38 (60.7 examples/sec; 2.109 sec/batch
step 920, loss =1.64 (60.2 examples/sec; 2.125 sec/batch
step 930, loss =1.45 (60.7 examples/sec; 2.109 sec/batch
step 940, loss =1.39 (61.6 examples/sec; 2.078 sec/batch
step 950, loss =1.40 (63.5 examples/sec; 2.016 sec/batch
step 960, loss =1.32 (62.1 examples/sec; 2.063 sec/batch
step 970, loss =1.32 (63.0 examples/sec; 2.031 sec/batch
step 980, loss =1.28 (61.6 examples/sec; 2.078 sec/batch
step 990, loss =1.20 (63.5 examples/sec; 2.016 sec/batch

View Code

結果：

分析：

　　cifar10資料集比mnist資料集更完整也更復雜，基於cifar資料集進行10分類比mnist有更高的難度，整體的準確率和召回率都普遍偏低，但適當的增加迭代次數和卷積核的大小有助於提升準確度，大概能到80%，要想獲得更高的準確度可以增加訓練集的數量！

基於cifar10實現卷積神經網路影象識別

1 import tensorflow as tf 2 import numpy as np 3 import math 4 import time 5 import cifar10 6 import cifar10_input 7 """ 8 Create

[原始碼和文件分享]基於CUDA的卷積神經網路演算法實現

摘要卷積神經網路是近年來人工智慧領域取得重大突破的一種重要手段，給出了影象識別、語音識別和自然語言處理領域中關鍵問題的優化解決方案，尤其適合處理影象方面的任務，如人臉識別和手寫體識別。手寫數字識別是用卷積神經網路解決的經典問題，採用一般方法訓練出來的神經網路達到了97%的識別率，幾乎與人類的

全卷積神經網路影象分割(U-net)-keras實現

最近在研究全卷積神經網路在影象分割方面的應用，因為自己是做醫學影象處理方面的工作，所以就把一個基於FCN（全卷積神經網路）的神經網路用 keras 實現了，並且用了一個醫學影象的資料集進行了影象分割。全卷積神經網路大名鼎鼎的FCN就不多做介紹了，這裡有一篇很好的博文 http://www.c

學習筆記之——基於pytorch的卷積神經網路

本博文為本人的學習筆記。參考材料為《深度學習入門之——PyTorch》 pytorch中文網：https://www.pytorchtutorial.com/ 關於反捲積：https://github.com/vdumoulin/conv_arithmetic/blob/ma

基於FPGA的卷積神經網路加速器_餘子健

文章目錄 1. 神經網路計算模型 2. 卷積計算並行性分析 2.1 卷積視窗內部並行 2.2 相同特徵圖卷積視窗間並行實現分析 2.3 不同輸入特徵圖卷積視窗並行

基於一維卷積神經網路的增強效率BPSK解調器《翻譯》

參考文獻：Zhang M, Liu Z, Li L, et al. Enhanced Efficiency BPSK Demodulator Based on One-Dimensional Convolutional Neural Network[J]. IEEE Access, 2018, PP

字元型圖片驗證碼，使用tensorflow實現卷積神經網路，進行驗證碼識別CNN

本專案使用卷積神經網路識別字符型圖片驗證碼，其基於 TensorFlow 框架。它封裝了非常通用的校驗、訓練、驗證、識別和呼叫 API，極大地減低了識別字符型驗證碼花費的時間和精力。專案地址： https://github.com/nickliqian/cnn_captcha

利用Python實現卷積神經網路的視覺化（附Python程式碼）

對於深度學習這種端到端模型來說，如何說明和理解其中的訓練過程是大多數研究者關注熱點之一，這個問題對於那種高風險行業顯得尤為重視，比如醫療、軍事等。在深度學習中，這個問題被稱作“黑匣子（Black Box）”。如果不能解釋模型的工作過程，我們怎麼能夠就輕易相信模型的輸出結果呢？以深度學習模型檢測

[深度學習] Python實現卷積神經網路- Convolution

[深度學習] Python實現卷積神經網路- Convolution 作者 sunsided github 地址： https://github.com/sunsided/python-conv2d import cv2 import numpy as np # load the

基於Python的卷積神經網路和特徵提取

基於Python的卷積神經網路和特徵提取發表於2015-08-27 21:39| 4577次閱讀| 來源blog.christianperone.com/| 13 條評論| 作者Christian S.Peron 深度學習特徵提取神經網路Pythonnolea

基於Pytorch的卷積神經網路剪枝

本篇部落格對網路剪枝的實現方法主要在https://jacobgil.github.io/deeplearning/pruning-deep-learning的基礎上進行了相應修改而完成，所參考的論文為https://arxiv.org/abs/

Tensorflow實現卷積神經網路

如果不明白什麼是卷積神經網路,請參考:計算機視覺與卷積神經網路下面基於開源的實現簡單梳理如何用tensorflow實現卷積神經網路. 實現卷積神經網路載入資料集 # 載入資料集 impor

TensorFlow學習筆記（5）--實現卷積神經網路（MNIST資料集）

這裡使用TensorFlow實現一個簡單的卷積神經網路，使用的是MNIST資料集。網路結構為：資料輸入層–卷積層1–池化層1–卷積層2–池化層2–全連線層1–全連線層2（輸出層），這是一個簡單但非常有代表性的卷積神經網路。 import tensorflow

深度學習（十五）基於級聯卷積神經網路的人臉特徵點定位

基於級聯卷積神經網路的人臉特徵點定位作者：hjimce一、相關理論本篇博文主要講解2013年CVPR的一篇利用深度學習做人臉特徵點定位的經典paper：《Deep Convolutional Netwo

機器學習筆記：tensorflow實現卷積神經網路經典案例--識別手寫數字

從識別手寫數字的案例開始認識神經網路，並瞭解如何在tensorflow中一步步建立卷積神經網路。安裝tensorflow 資料來源 kaggle新手入門的數字識別案例，包含手寫0-9的灰度值影象的csv檔案，下載地址：https://www.

深度學習筆記5-tensorflow實現卷積神經網路

深度學習筆記5-tensorflow實現卷積神經網路在股票等預測模型中，可以從原始資料提取金融因子等特徵。而影象則無有效特徵，只能藉助SIFT、HOG等提取有效特徵，再集合SVM等機器學習演算法進行影象識別。卷積神經網路（CNN）提取的特徵則可以達到更好的效果，同時它不需要將特徵提取和

手動實現卷積神經網路中的卷積操作（conv2d）

寫這個的原因：一來好像沒怎麼搜到別人手動實現，作為補充；二來鞏固一下基礎。卷積操作示意先從一張示意圖說起，卷積基礎概念和操作步驟就不囉嗦了，只講這張圖，大意就是，有in-channel，有out-channel，你需要把in-channel都做卷積操作，然

吳恩達深度學習：基於Matlab完成卷積神經網路第四課第一週程式設計任務

這兩三個月通過吳恩達老師的課程學習了深度學習，從零開始學理論，做程式設計任務。感覺學了很多知識。現在學到卷積神經網路，想把第一週的程式設計任務、其中的要點上傳和編寫，方便自己以後鞏固。（注：吳恩達老師課程的程式設計任務是用Python來完成的，而我是用ma

Pytorch實現卷積神經網路CNN

Pytorch是torch的Python版本，對TensorFlow造成很大的衝擊，TensorFlow無疑是最流行的，但是Pytorch號稱在諸多效能上要優於TensorFlow，比如在RNN的訓練上，所以Pytorch也吸引了很多人的關注。之前有一篇關於TensorF

【Deep Learning】tensorflow實現卷積神經網路(AlexNet)

一、實驗要求 1.使用卷積神經網路實現圖片分類，資料集為OxFlowers17；二、實驗環境 Anaconda2-4.3.1（Python2.7），tensorflow-cpu。三、實驗原理 3.1 資料讀取已知資料集

基於cifar10實現卷積神經網路影象識別

相關推薦