利用tensorflow訓練自己的圖片資料（3）——建立網路模型

阿新 • • 發佈：2019-01-09

一. 說明

在上一部落格——利用tensorflow訓練自己的圖片資料（2）中，我們已經獲得了神經網路的訓練輸入資料：image_batch，label_batch。接下就是建立神經網路模型，筆者的網路模型結構如下：

輸入資料：（batch_size，IMG_W，IMG_H，col_channel）= （20, 64, 64, 3）

卷積層1：（conv_kernel，num_channel，num_out_neure）= （3, 3, 3, 64）

池化層1：（ksize，strides，padding）= （[1,3,3,1]， [1,2,2,1]， 'SAME'）

卷積層2：（conv_kernel，num_channel，num_out_neure）= （3, 3, 64, 16）

池化層2：（ksize，strides，padding）= （[1,3,3,1]， [1,1,1,1]， 'SAME'）

全連線1：（out_pool2_reshape，num_out_neure）= （dim， 128）

全連線2：（fc1_out，num_out_neure）= （128，128）

softmax層：（fc2_out，num_classes） = （128, 4）

啟用函式： tf.nn.relu

損失函式： tf.nn.sparse_softmax_cross_entropy_with_logits

二. 程式設計實現

#=========================================================================
import tensorflow as tf
#=========================================================================
#網路結構定義
    #輸入引數：images，image batch、4D tensor、tf.float32、[batch_size, width, height, channels]
    #返回引數：logits, float、 [batch_size, n_classes]
def inference(images, batch_size, n_classes):
#一個簡單的卷積神經網路，卷積+池化層x2，全連線層x2，最後一個softmax層做分類。
#卷積層1
#64個3x3的卷積核（3通道），padding=’SAME’，表示padding後卷積的圖與原圖尺寸一致，啟用函式relu()
    with tf.variable_scope('conv1') as scope:
        
        weights = tf.Variable(tf.truncated_normal(shape=[3,3,3,64], stddev = 1.0, dtype = tf.float32), 
                              name = 'weights', dtype = tf.float32)
        
        biases = tf.Variable(tf.constant(value = 0.1, dtype = tf.float32, shape = [64]),
                             name = 'biases', dtype = tf.float32)
        
        conv = tf.nn.conv2d(images, weights, strides=[1,1,1,1], padding='SAME')
        pre_activation = tf.nn.bias_add(conv, biases)
        conv1 = tf.nn.relu(pre_activation, name= scope.name)
        
#池化層1
#3x3最大池化，步長strides為2，池化後執行lrn()操作，區域性響應歸一化，對訓練有利。
    with tf.variable_scope('pooling1_lrn') as scope:
        pool1 = tf.nn.max_pool(conv1, ksize=[1,3,3,1],strides=[1,2,2,1],padding='SAME', name='pooling1')
        norm1 = tf.nn.lrn(pool1, depth_radius=4, bias=1.0, alpha=0.001/9.0, beta=0.75, name='norm1')

#卷積層2
#16個3x3的卷積核（16通道），padding=’SAME’，表示padding後卷積的圖與原圖尺寸一致，啟用函式relu()
    with tf.variable_scope('conv2') as scope:
        weights = tf.Variable(tf.truncated_normal(shape=[3,3,64,16], stddev = 0.1, dtype = tf.float32), 
                              name = 'weights', dtype = tf.float32)
        
        biases = tf.Variable(tf.constant(value = 0.1, dtype = tf.float32, shape = [16]),
                             name = 'biases', dtype = tf.float32)
        
        conv = tf.nn.conv2d(norm1, weights, strides = [1,1,1,1],padding='SAME')
        pre_activation = tf.nn.bias_add(conv, biases)
        conv2 = tf.nn.relu(pre_activation, name='conv2')

#池化層2
#3x3最大池化，步長strides為2，池化後執行lrn()操作，
    #pool2 and norm2
    with tf.variable_scope('pooling2_lrn') as scope:
        norm2 = tf.nn.lrn(conv2, depth_radius=4, bias=1.0, alpha=0.001/9.0,beta=0.75,name='norm2')
        pool2 = tf.nn.max_pool(norm2, ksize=[1,3,3,1], strides=[1,1,1,1],padding='SAME',name='pooling2')

#全連線層3
#128個神經元，將之前pool層的輸出reshape成一行，啟用函式relu()
    with tf.variable_scope('local3') as scope:
        reshape = tf.reshape(pool2, shape=[batch_size, -1])
        dim = reshape.get_shape()[1].value
        weights = tf.Variable(tf.truncated_normal(shape=[dim,128], stddev = 0.005, dtype = tf.float32),
                             name = 'weights', dtype = tf.float32)
        
        biases = tf.Variable(tf.constant(value = 0.1, dtype = tf.float32, shape = [128]), 
                             name = 'biases', dtype=tf.float32)
        
        local3 = tf.nn.relu(tf.matmul(reshape, weights) + biases, name=scope.name)
        
#全連線層4
#128個神經元，啟用函式relu() 
    with tf.variable_scope('local4') as scope:
        weights = tf.Variable(tf.truncated_normal(shape=[128,128], stddev = 0.005, dtype = tf.float32),
                              name = 'weights',dtype = tf.float32)
        
        biases = tf.Variable(tf.constant(value = 0.1, dtype = tf.float32, shape = [128]),
                             name = 'biases', dtype = tf.float32)
        
        local4 = tf.nn.relu(tf.matmul(local3, weights) + biases, name='local4')

#dropout層        
#    with tf.variable_scope('dropout') as scope:
#        drop_out = tf.nn.dropout(local4, 0.8)
            
        
#Softmax迴歸層
#將前面的FC層輸出，做一個線性迴歸，計算出每一類的得分，在這裡是2類，所以這個層輸出的是兩個得分。
    with tf.variable_scope('softmax_linear') as scope:
        weights = tf.Variable(tf.truncated_normal(shape=[128, n_classes], stddev = 0.005, dtype = tf.float32),
                              name = 'softmax_linear', dtype = tf.float32)
        
        biases = tf.Variable(tf.constant(value = 0.1, dtype = tf.float32, shape = [n_classes]),
                             name = 'biases', dtype = tf.float32)
        
        softmax_linear = tf.add(tf.matmul(local4, weights), biases, name='softmax_linear')

    return softmax_linear

#-----------------------------------------------------------------------------
#loss計算
    #傳入引數：logits，網路計算輸出值。labels，真實值，在這裡是0或者1
    #返回引數：loss，損失值
def losses(logits, labels):
    with tf.variable_scope('loss') as scope:
        cross_entropy =tf.nn.sparse_softmax_cross_entropy_with_logits(logits=logits, labels=labels, name='xentropy_per_example')
        loss = tf.reduce_mean(cross_entropy, name='loss')
        tf.summary.scalar(scope.name+'/loss', loss)
    return loss

#--------------------------------------------------------------------------
#loss損失值優化
    #輸入引數：loss。learning_rate，學習速率。
    #返回引數：train_op，訓練op，這個引數要輸入sess.run中讓模型去訓練。
def trainning(loss, learning_rate):
    with tf.name_scope('optimizer'):
        optimizer = tf.train.AdamOptimizer(learning_rate= learning_rate)
        global_step = tf.Variable(0, name='global_step', trainable=False)
        train_op = optimizer.minimize(loss, global_step= global_step)
    return train_op

#-----------------------------------------------------------------------
#評價/準確率計算
    #輸入引數：logits，網路計算值。labels，標籤，也就是真實值，在這裡是0或者1。
    #返回引數：accuracy，當前step的平均準確率，也就是在這些batch中多少張圖片被正確分類了。
def evaluation(logits, labels):
    with tf.variable_scope('accuracy') as scope:
        correct = tf.nn.in_top_k(logits, labels, 1)
        correct = tf.cast(correct, tf.float16)
        accuracy = tf.reduce_mean(correct)
        tf.summary.scalar(scope.name+'/accuracy', accuracy)
    return accuracy

#========================================================================

3 . 補充

tensorflow下的區域性相應歸一化函式：tf.nn.lrn

tf.nn.lrn = （input，depth_radius=None，bias=None，alpha=None，beta=None，name=None）

input是一個4D的tensor，型別必須為float。

depth_radius是一個型別為int的標量，表示囊括的kernel的範圍。

bias是偏置。

alpha是乘積係數，是在計算完囊括範圍內的kernel的啟用值之和之後再對其進行乘積。

beta是指數係數。

LRN是normalization的一種，normalizaiton的目的是抑制，抑制神經元的輸出。而LRN的設計借鑑了神經生物學中的一個概念，叫做“側抑制”。

側抑制：相近的神經元彼此之間發生抑制作用，即在某個神經元受到刺激而產生興奮時，再側記相近的神經元，則後者所發生的興奮對前產生的抑制作用。也就是說，抑制側是指相鄰的感受器之間能夠相互抑制的現象。

注：可參考部落格http://blog.csdn.net/gzhermit/article/details/75389130

利用tensorflow訓練自己的圖片資料（3）——建立網路模型

一. 說明在上一部落格——利用tensorflow訓練自己的圖片資料（2）中，我們已經獲得了神經網路的訓練輸入資料：image_batch，label_batch。接下就是建立神經網路模型，筆者的網路模型結構如下：輸入資料：（batch_size，IMG_W，IMG_H

TensorFlow——訓練自己的資料（五）模型評估

模型的評估主要有幾個指標：平均準確率、識別的時間、loss下降變化等。Tensorflow提供了一個log視覺化的工具tensroboard。要看到log就必須在訓練時用summary去記錄想

TensorFlow——訓練自己的資料（三）模型訓練

檔案training.py 匯入檔案 import os import numpy as np import tensorflow as tf import input_data

TensorFlow——訓練自己的資料（四）模型測試

獲取一張圖片函式：def get_one_image(train): 輸入引數：train,訓練圖片的路徑返回引數：image，從訓練圖片中隨機抽取一張圖片 n = len(tra

使用Tensorflow來讀取訓練自己的資料（三）

本文詳解training.py是如何編寫的。 import os import numpy as np import tensorflow as tf import input_data import model N_CLASSES = 2 # 二分類問題，只有是還是否，即0，1 IMG_W

使用Tensorflow來讀取訓練自己的資料（二）

接上一篇，繼續分析，model.py，也就是模型的構建。兩個卷積層，兩個池化層，以及後面的全連線層怎麼通過tensorflow定義的。 import tensorflow as tf def inference(images, batch_size, n_classess): # c

使用Tensorflow來讀取訓練自己的資料（一）

本文的程式碼以及思路都是參考別人的，現在只是整理一下思路，做一些解釋，畢竟是小白。首先本文所使用的圖片資料都是https://www.kaggle.com/下載的，使用的是貓和狗的圖片集，https://www.kaggle.com/c/dogs-vs-cats-redux-ker

ubuntu caffe 訓練自己的資料（簡單）

學習的caffe的目的，不是簡單的做幾個練習，而是最終落實到自己的專案或科研中去。因此，本文介紹一下，從自己的原始圖片到lmdb資料，再到訓練和測試的整個流程。一、資料的準備有條件的同學，可以去ImageNet的官網下載ImageNet圖片來訓練。我重新找了

scikit-leran學習筆記（3）---神經網路模型（有監督的）

1.Multi-layer Perceptron 多層感知機 MLP是一個監督學習演算法，圖1是帶一個隱藏層的MLP模型左邊層是輸入層，由神經元集合{xi|x1,x2,…,xm},代表輸入特徵，隱藏層的每個神經元將前一層的的值通過線性加權求

利用tensorflow訓練自己的圖片資料（5）——測試訓練網路

一.說明上一篇部落格中，我們已經將建立好的網路模型訓練好了，並將訓練的網路引數儲存在相應的檔案中；下面我們就開始測試網路，驗證網路的訓練效果；本次測試為隨機的單圖片測試，即隨機的從訓練集或測試集中讀取一張圖片，送入到神經網路中進行識別，列印識別率及識別的影象。二. 程式

完整實現利用tensorflow訓練自己的圖片資料集

經過差不多一個禮拜的時間的學習，終於把完整的一個利用自己爬取的圖片做訓練資料集的卷積神經網路的實現（基於tensorflow）簡單整理一下思路：獲取資料集（上網爬取，或者直接找公開的圖片資料集） reshape圖片成相同大小（公開資料集一般都是相同sha

利用tensorflow訓練自己的圖片資料集——資料準備

昨天實現了一個簡單的CNN網路。用了MNIST資料集，雖然看來對這個資料集用的很多，但是真正這個資料集是怎麼在訓練的時候被呼叫的，以及怎麼把它換成自己的資料集都是一臉懵。作者給的程式碼是python2.x版本的，我用的python3.5，改了一些錯誤。 import

利用tensorflow訓練自己的圖片——2、網路搭建（AlexNet）

得到資料之後，接下來就是網路的搭建，我在這裡將模型單獨定義出來，方便後期的網路修正。 #!/usr/bin/env python2 # -*- coding: utf-8 -*- """ Spyder Editor This is a temporary script f

使用tensorflow訓練自己的資料集（一）——製作資料集

使用tensorflow訓練自己的資料集—製作資料集想記錄一下自己製作訓練集並訓練的過、希望踩過的坑能幫助後面入坑的人。本次使用的訓練集的是kaggle中經典的貓狗大戰資料集（提取碼：ufz5）。因為本人筆記本配置很差還不是N卡所以把train的資料分成了訓練集和測試集並沒有使用

使用tensorflow訓練自己的資料集（四）——計算模型準確率

使用tensorflow訓練自己的資料集—定義反向傳播上一篇使用tensorflow訓練自己的資料集（三）中製作已經介紹了定義反向傳播過程來訓練神經網路，訓練完神經網路後應對神經網路進行準確率的計算。 import time import forward import back

使用tensorflow訓練自己的資料集（一）

使用tensorflow訓練自己的資料集想記錄一下自己製作訓練集並訓練的過、希望踩過的坑能幫助後面入坑的人。本次使用的訓練集的是kaggle中經典的貓狗大戰資料集（提取碼：ufz5）。因為本人筆記本配置很差還不是N卡所以把train的資料分成了訓練集和測試集

使用tensorflow訓練自己的資料集（二）

使用tensorflow訓練自己的資料集—定義神經網路上一篇使用tensorflow訓練自己的資料集（一）中製作已經介紹了製作自己的資料集、接下來就是定義向前傳播過程了也就是定義神經網路。本次使用了兩層卷積兩層最大池化兩層全連線神經網路最後加softmax層的

使用tensorflow訓練自己的資料集（三）——定義反向傳播過程

使用tensorflow訓練自己的資料集—定義反向傳播上一篇使用tensorflow訓練自己的資料集（二）中製作已經介紹了定義神經網路、接下來就是定義反向傳播過程進行訓練神經網路了。反向傳播過程中使用了滑動平均類和學習率指數下降來優化神經網路。 ps.沒有GP

Tensorflow 訓練自己的資料集（二）（TFRecord）

Tensorflow 提供了一種統一的格式來儲存資料，這個格式就是TFRecord,上一篇部落格中所提到的方法當資料的來源更復雜，每個樣例中的資訊更豐富的時候就很難有效的記錄輸入資料中的資訊了，於是Tensorflow提供了TFRecord來統一儲存資料，接下來

深度學習tensorflow實戰筆記（1）全連線神經網路（FCN）訓練自己的資料（從txt檔案中讀取）

寫在前面的話：離上一次寫部落格已經有些日子了，以前的工程都是在caffe平臺下做的，caffe平臺雖然挺好用的，但是caffe主要用於做CNN，對於其它的網路模型用起來不太方便，所以博主轉戰tensorflow，Google對待tensorflow就想當年對待An

利用tensorflow訓練自己的圖片資料（3）——建立網路模型

一. 說明

二. 程式設計實現

側抑制：相近的神經元彼此之間發生抑制作用，即在某個神經元受到刺激而產生興奮時，再側記相近的神經元，則後者所發生的興奮對前產生的抑制作用。也就是說，抑制側是指相鄰的感受器之間能夠相互抑制的現象。

相關推薦