tensorflow 用自己的資料集訓練CNN模型

阿新 • • 發佈：2019-01-01

最近用tensorflow訓練自己的模型的時候發現，tensorflow官網上所給的例子，都是用處理好資料格式的mnist資料或者其他格式的資料，所以在訓練自己的模型的時候的第一步就卡住了。所以上網搜尋了相關的資料之後便得出了相關的解決方案（有好幾種，這裡只說明一種，另外有TFRecord的格式的網上很多教程，將不在這敘述）….

import os
import glob
import time
import numpy as np
import tensorflow as tf
from skimage import io, transform

# os.environ["TF_CPP_MIN_LOG_LEVEL"] = '1'
# 這是預設的顯示等級，顯示所有資訊
# os.environ["TF_CPP_MIN_LOG_LEVEL"] = '2'
# 只顯示 warning 和 Error
os.environ["TF_CPP_MIN_LOG_LEVEL"] = '3'
# 只顯示 Error


# 讀取圖片
def read_img(path, w, h):
    cate = [path + x for x in os.listdir(path) if os.path.isdir(path + x)]
    # print(cate)

    imgs = []
    labels = []

    print('Start read the image ...')

    for index, folder in enumerate(cate):
        # print(index, folder)
        for im in glob.glob(folder + '/*.jpg'):
            # print('Reading The Image: %s' % im)
            img = io.imread(im)
            img = transform.resize(img, (w, h))
            imgs.append(img)
            labels.append(index)

    print('Finished ...')

    return np.asarray(imgs, np.float32), np.asarray(labels, np.float32)


# 打亂順序
def messUpOrder(data, label):
    num_example = data.shape[0]
    arr = np.arange(num_example)
    np.random.shuffle(arr)
    data = data[arr]
    label = label[arr]

    return data, label


# 將所有資料分為訓練集和驗證集
def segmentation(data, label, ratio=0.8):
    num_example = data.shape[0]
    s = np.int(num_example * ratio)
    x_train = data[:s]
    y_train = label[:s]
    x_val = data[s:]
    y_val = label[s:]

    return x_train, y_train, x_val, y_val


# 構建網路
def buildCNN(w, h, c):
    # 佔位符
    x = tf.placeholder(tf.float32, shape=[None, w, h, c], name='x')
    y_ = tf.placeholder(tf.int32, shape=[None, ], name='y_')

    # 第一個卷積層 + 池化層（100——>50)
    conv1 = tf.layers.conv2d(
        inputs=x,
        filters=32,
        kernel_size=[5, 5],
        padding="same",
        activation=tf.nn.relu,
        kernel_initializer=tf.truncated_normal_initializer(stddev=0.01))
    pool1 = tf.layers.max_pooling2d(inputs=conv1, pool_size=[2, 2], strides=2)

    # 第二個卷積層 + 池化層 (50->25)
    conv2 = tf.layers.conv2d(
        inputs=pool1,
        filters=64,
        kernel_size=[5, 5],
        padding="same",
        activation=tf.nn.relu,
        kernel_initializer=tf.truncated_normal_initializer(stddev=0.01))
    pool2 = tf.layers.max_pooling2d(inputs=conv2, pool_size=[2, 2], strides=2)

    # 第三個卷積層 + 池化層 (25->12)
    conv3 = tf.layers.conv2d(
        inputs=pool2,
        filters=128,
        kernel_size=[3, 3],
        padding="same",
        activation=tf.nn.relu,
        kernel_initializer=tf.truncated_normal_initializer(stddev=0.01))
    pool3 = tf.layers.max_pooling2d(inputs=conv3, pool_size=[2, 2], strides=2)

    # 第四個卷積層 + 池化層 (12->6)
    conv4 = tf.layers.conv2d(
        inputs=pool3,
        filters=128,
        kernel_size=[3, 3],
        padding="same",
        activation=tf.nn.relu,
        kernel_initializer=tf.truncated_normal_initializer(stddev=0.01))
    pool4 = tf.layers.max_pooling2d(inputs=conv4, pool_size=[2, 2], strides=2)

    re1 = tf.reshape(pool4, [-1, 6 * 6 * 128])

    # 全連線層
    dense1 = tf.layers.dense(inputs=re1,
                             units=1024,
                             activation=tf.nn.relu,
                             kernel_initializer=tf.truncated_normal_initializer(stddev=0.01),
                             kernel_regularizer=tf.contrib.layers.l2_regularizer(0.003))
    dense2 = tf.layers.dense(inputs=dense1,
                             units=512,
                             activation=tf.nn.relu,
                             kernel_initializer=tf.truncated_normal_initializer(stddev=0.01),
                             kernel_regularizer=tf.contrib.layers.l2_regularizer(0.003))
    logits = tf.layers.dense(inputs=dense2,
                             units=20,  
                             activation=None,
                             kernel_initializer=tf.truncated_normal_initializer(stddev=0.01),
                             kernel_regularizer=tf.contrib.layers.l2_regularizer(0.003))

    return logits, x, y_


# 返回損失函式的值，準確值等引數
def accCNN(logits, y_):
    loss = tf.losses.sparse_softmax_cross_entropy(labels=y_, logits=logits)
    train_op = tf.train.AdamOptimizer(learning_rate=0.001).minimize(loss)
    correct_prediction = tf.equal(tf.cast(tf.argmax(logits, 1), tf.int32), y_)
    acc = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

    return loss, train_op, correct_prediction, acc


# 定義一個函式，按批次取資料
def minibatches(inputs=None, targets=None, batch_size=None, shuffle=False):
    assert len(inputs) == len(targets)
    if shuffle:
        indices = np.arange(len(inputs))
        np.random.shuffle(indices)
    for start_idx in range(0, len(inputs) - batch_size + 1, batch_size):
        if shuffle:
            excerpt = indices[start_idx:start_idx + batch_size]
        else:
            excerpt = slice(start_idx, start_idx + batch_size)
        yield inputs[excerpt], targets[excerpt]


def runable(x_train, y_train, train_op, loss, acc, x, y_, x_val, y_val):
    # 訓練和測試資料，可將n_epoch設定更大一些
    n_epoch = 50
    batch_size = 64
    sess = tf.InteractiveSession()
    sess.run(tf.global_variables_initializer())
    for epoch in range(n_epoch):
        # training
        train_loss, train_acc, n_batch = 0, 0, 0
        for x_train_a, y_train_a in minibatches(x_train, y_train, batch_size, shuffle=True):
            _, err, ac = sess.run([train_op, loss, acc], feed_dict={x: x_train_a, y_: y_train_a})
            train_loss += err
            train_acc += ac
            n_batch += 1
        print("train loss: %f" % (train_loss / n_batch))
        print("train acc: %f" % (train_acc / n_batch))

        # validation
        val_loss, val_acc, n_batch = 0, 0, 0
        for x_val_a, y_val_a in minibatches(x_val, y_val, batch_size, shuffle=False):
            err, ac = sess.run([loss, acc], feed_dict={x: x_val_a, y_: y_val_a})
            val_loss += err
            val_acc += ac
            n_batch += 1
        print("validation loss: %f" % (val_loss / n_batch))
        print("validation acc: %f" % (val_acc / n_batch))
        print('*' * 50)

    sess.close()


if __name__ == '__main__':
    imgpath = '../dataset/classify/'

    w = 100
    h = 100
    c = 3

    ratio = 0.8  # 選取訓練集的比例

    data, label = read_img(path=imgpath, w=w, h=h)

    data, label = messUpOrder(data=data, label=label)

    x_train, y_train, x_val, y_val = segmentation(data=data, label=label, ratio=ratio)

    logits, x, y_ = buildCNN(w=w, h=h, c=c)

    loss, train_op, correct_prediction, acc = accCNN(logits=logits, y_=y_)

    runable(x_train=x_train, y_train=y_train, train_op=train_op, loss=loss,
            acc=acc, x=x, y_=y_, x_val=x_val, y_val=y_val)

tensorflow 用自己的資料集訓練CNN模型

最近用tensorflow訓練自己的模型的時候發現，tensorflow官網上所給的例子，都是用處理好資料格式的mnist資料或者其他格式的資料，所以在訓練自己的模型的時候的第一步就卡住了。所以上網搜尋了相關的資料之後便得出了相關的解決方案（有好幾種，這裡只說明一種，另外

TensorFlow筆記（3）——利用TensorFlow和MNIST資料集訓練一個最簡單的手寫數字識別模型

前言當我們開始學習程式設計的時候，第一件事往往是學習列印"Hello World"。就好比程式設計入門有Hello World，機器學習入門有MNIST。 MNIST是一個入門級的計算機視覺資料集，它包含各種手寫數字圖片：它也包含每一張圖片對應的標籤，告訴我們這個是數字幾。比如，上

TensorFlow筆記（3）——利用TensorFlow和MNIST資料集訓練一個最簡單的手寫數字識別模型...

前言當我們開始學習程式設計的時候，第一件事往往是學習列印"Hello World"。就好比程式設計入門有Hello World，機器學習入門有MNIST。 MNIST是一個入門級的計算機視覺資料集，它包含各種手寫數字圖片：

深度學習（tensorflow） —— 自己資料集讀取opencv

先來看一下我們的目錄： dataset1 和creat_dataset.py 屬於同一目錄 mergeImg1 和mergeImg2 為Dataset1的兩子目錄（兩類為例子）目錄中儲存影象等檔案核心檔案creat_dataset.py 檔案如下#來生成訓練集和測試集的矩陣 im

用自己的資料集訓練tf-ssd模型

資料集製作因為老闆接的豐田的一個專案，工廠那邊要求能識別出雨天打傘的行人、交通錐形桶、躺在地上的人等，PASCAL VOC的資料集類別裡沒這些，是滿足不了他們要求了，所以要去製作資料集訓練網路。我們去現場拍了些視訊，然後用我之前寫的一個指令碼解析，得到原始圖片，拿給實驗室的學

Faster-RCNN+ZF用自己的資料集訓練模型(Python版本and MATLAB版本）

說明：本博文假設你已經做好了自己的資料集，該資料集格式和VOC2007相同。下面是訓練前的一些修改。 Faster-RCNN原始碼下載地址：本文用到的是版本，在Linux下執行。準備工作： 1.配置caffe

詳解tensorflow訓練自己的資料集實現CNN影象分類

利用卷積神經網路訓練影象資料分為以下幾個步驟1.讀取圖片檔案2.產生用於訓練的批次3.定義訓練的模型（包括初始化引數，卷積、池化層等引數、網路）4.訓練1 讀取圖片檔案def get_files(filename): class_train = [] label_trai

Faster-RCNN+ZF用自己的資料集訓練模型(Python版本)

說明：本博文假設你已經做好了自己的資料集，該資料集格式和VOC2007相同。下面是訓練前的一些修改。 Faster-RCNN原始碼下載地址：本文用到的是Python版本，在Linux下執行。準備工作： 1.配置caffe 這個不多說，網上教程很多。

R-FCN+ResNet-50用自己的資料集訓練模型(python版本)

說明：本文假設你已經做好資料集，格式和VOC2007一致，並且Linux系統已經配置好caffe所需環境（部落格裡教程很多），下面是訓練的一些修改。 py-R-FCN原始碼下載地址：也有Matlab版本：本文用到的是python版本。準備工作：（1）配

caffe之利用mnist資料集訓練好的lenet_iter_10000.caffemodel模型測試一張自己的手寫體數字

1.安裝一些基本依賴項： $ sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler $ sudo

《錯誤手記-01》 facenet使用預訓練模型fine-tune重新訓練自己資料集報錯

環境資訊：windows10+python3.5+tensorflow1.6.0 問題描述：在自己的訓練集上跑train_softmax.py. 引數： --logs_base_dir F:/work/runspace/log/ --models_base_

用ImageNet的資料集訓練Faster R-CNN

轉自：http://blog.csdn.net/jiajunlee/article/details/50470897 訓練結果第一次訓練，ZF，30W張圖片，200類，迭代80k40K，mAP: 18.0% 問題彙總總結： ImageNet訓練資料集部分標註缺失

用自己的資料集訓練faster-rcnn時出現的一些問題及總結(五)

關於faster-rcnn的原理訓練流程及其資料集的製備，已經都已完成。那麼問題來了，“自己製備的資料集，比如說自己為了增強資料集，進行圖片翻轉操作，然後記錄座標這樣的資料集，在訓練的過程中出現的問題”一、在呼叫append_flipped_images函式時出現： asse

基於Tensorflow, OpenCV. 使用MNIST資料集訓練卷積神經網路模型，用於手寫數字識別

基於Tensorflow，OpenCV 使用MNIST資料集訓練卷積神經網路模型，用於手寫數字識別一個單層的神經網路，使用MNIST訓練，識別準確率較低兩層的卷積神經網路，使用MNIST訓練（模型使用MNIST測試集準確率高於99%

機器學習Tensorflow基於MNIST資料集識別自己的手寫數字（讀取和測試自己的模型）

更新：以下為原博：廢話不多說，先上效果圖整體來看，效果是非常不錯的，模型的訓練，參照官方程式碼mnist_deep.py，準確率是高達99.2% 那麼，我是怎麼實現的呢？一.讀懂卷積神經網路程式碼（至少得把程式跑通）首先參照Tensorfl

ChainerCV下用自己的資料集訓練Faster RCNN

一、ChainerCV ChainerCV，一個用於計算機視覺的深度學習實用庫。這個庫旨在通過 Chainer 簡易化計算機視覺的訓練和深度學習模型應用的過程。它包含計算機視覺模型的高質量實現，以及開展計算機視覺研究的必備工具集。當前，ChainerCV

windows下使用自己製作的資料集訓練faster-rcnn（tensorflow版）用於目標檢測

步驟一步驟二步驟三用你的Annotations，ImagesSets和JPEGImages替換…\Faster-RCNN-TensorFlow-Python3.5\data\VOCdevkit2007\VOC2007中對應資料夾

TensorFlow實戰：Chapter-9下(DeepLabv3+在自己的資料集訓練)

基本配置資料集處理我的資料集是3分類問題，但因為資料集的保密協議，在後面的demo中我沒有放出原圖片，我會盡量將訓練細節寫出來。為了方便記錄，我又使用了CamVid資料集(從這裡下載)測試了一下。資料集處理分成三大步：標註資料製作

用自己的資料集訓練Mask-RCNN實現過程中的坑

本文僅僅是自己實現過程的筆記記錄，僅僅用來交流的。在網上大量蒐集資料後，實現Mask-RCNN，但是過程中還是出現了很多很多的問題，所以將過程記錄如下，方便日後學習。一、實驗前準備 1. COCO資料集 COCO的全稱是Common Objects in COn

深度學習實踐經驗：用Faster R-CNN訓練Caltech資料集——訓練檢測

前言前面已經介紹瞭如何準備資料集，以及如何修改資料集讀寫介面來操作資料集，接下來我來說明一下怎麼來訓練網路和之後的檢測過程。修改模型檔案 faster rcnn有兩種各種訓練方式: Alternative training(alt-opt)

tensorflow 用自己的資料集訓練CNN模型

相關推薦