基於Tensorflow訓練物體、人像識別的模型

阿新 • • 發佈：2019-01-04

領導突發奇想一個idea，於是踏上了瞭解Tensorflow機器學習框架之路，踩過很多坑，做個記錄。各位看官看的時候有些訓練方式可能已經過時或者不對，見諒。

參考文件

環境配置：

ubuntu 16.0.4
Python 2.7
tensorflow cpu版本 1.4.1

訓練過程：

使用labelImg工具標註圖片，生成相應的註釋檔案.xml，注意圖片和xml不要放在同一個資料夾
下載官方推薦的model

git clone https://github.com/tensorflow/models.git

cd 到models/research目錄下新增路徑

# From tensorflow/models/research 

export PYTHONPATH=$PYTHONPATH:`pwd`:`pwd`/slim

import os
import glob
import pandas as pd
import xml.etree.ElementTree as ET

def xml_to_csv(path):

    xml_list = []

    print("*********",glob.glob(path + '/*.xml'))

    for xml_file in glob.glob(path + '/*.xml'):

        tree = ET.parse(xml_file)

        root = tree.getroot()

        for 
 member in root.findall('object'):

            value = (root.find('filename').text+'.JPG',    //如果生成的xml項後面沒有圖片格式宣告，記得這裡加上

                     int(root.find('size')[0].text),

                     int(root.find('size')[1].text),

                     member[0].text,

                     int(member[4 
][0].text),

                     int(member[4][1].text),

                     int(member[4][2].text),

                     int(member[4][3].text)

                     )

            xml_list.append(value)

    column_name = ['filename', 'width', 'height', 'class', 'xmin', 'ymin', 'xmax', 'ymax']

    xml_df = pd.DataFrame(xml_list, columns=column_name)

    return xml_df

def main():

    image_path = os.path.join(os.getcwd(), 'annotations')

    image_path = r'/mnt/hgfs/UbuntuShare/xml_hat'    //改這裡的xml路徑

    xml_df = xml_to_csv(image_path)

    xml_df.to_csv('hat.csv', index=None)    //生成的csv檔案

    print('Successfully converted xml to csv.')

main()

python generate_tfrecord.py --csv_input=sunglasses_test_labels.csv --output_path=sunglass_test.record

"""
Usage:
  # From tensorflow/models/
  # Create train data:
  python generate_tfrecord.py --csv_input=data/train_labels.csv  --output_path=train.record

  # Create test data:
  python generate_tfrecord.py --csv_input=data/test_labels.csv  --output_path=test.record
"""
from __future__ import division
from __future__ import print_function
from __future__ import absolute_import

import os
import io
import pandas as pd
import tensorflow as tf

from PIL import Image
from object_detection.utils import dataset_util
from collections import namedtuple, OrderedDict

flags = tf.app.flags
flags.DEFINE_string('csv_input', '', 'Path to the CSV input')
flags.DEFINE_string('output_path', '', 'Path to output TFRecord')
FLAGS = flags.FLAGS


# TO-DO replace this with label map
def class_text_to_int(row_label):
    print('********',row_label)
    if row_label == 'hat':    // 使用圖片標註的label
        return 1
    else:
        None


def split(df, group):
    data = namedtuple('data', ['filename', 'object'])
    gb = df.groupby(group)
    return [data(filename, gb.get_group(x)) for filename, x in zip(gb.groups.keys(), gb.groups)]


def create_tf_example(group, path):
    print("-------------")
    with tf.gfile.GFile(os.path.join(path, '{}'.format(group.filename)), 'rb') as fid:
        encoded_jpg = fid.read()
    encoded_jpg_io = io.BytesIO(encoded_jpg)
    image = Image.open(encoded_jpg_io)
    width, height = image.size

    filename = group.filename.encode('utf8')
    image_format = b'jpg'
    xmins = []
    xmaxs = []
    ymins = []
    ymaxs = []
    classes_text = []
    classes = []

    for index, row in group.object.iterrows():
        xmins.append(row['xmin'] / width)
        xmaxs.append(row['xmax'] / width)
        ymins.append(row['ymin'] / height)
        ymaxs.append(row['ymax'] / height)
        classes_text.append(row['class'].encode('utf8'))
        classes.append(class_text_to_int(row['class']))

    tf_example = tf.train.Example(features=tf.train.Features(feature={
        'image/height': dataset_util.int64_feature(height),
        'image/width': dataset_util.int64_feature(width),
        'image/filename': dataset_util.bytes_feature(filename),
        'image/source_id': dataset_util.bytes_feature(filename),
        'image/encoded': dataset_util.bytes_feature(encoded_jpg),
        'image/format': dataset_util.bytes_feature(image_format),
        'image/object/bbox/xmin': dataset_util.float_list_feature(xmins),
        'image/object/bbox/xmax': dataset_util.float_list_feature(xmaxs),
        'image/object/bbox/ymin': dataset_util.float_list_feature(ymins),
        'image/object/bbox/ymax': dataset_util.float_list_feature(ymaxs),
        'image/object/class/text': dataset_util.bytes_list_feature(classes_text),
        'image/object/class/label': dataset_util.int64_list_feature(classes),
    }))
    return tf_example

def main(_):
    print("-------------")
    writer = tf.python_io.TFRecordWriter(FLAGS.output_path)
    path = os.path.join(os.getcwd(), 'images_hat')   //圖片檔案路徑
    examples = pd.read_csv(FLAGS.csv_input)
    grouped = split(examples, 'filename')
    for group in grouped:
        tf_example = create_tf_example(group, path)
        writer.write(tf_example.SerializeToString())

    writer.close()
    output_path = os.path.join(os.getcwd(), FLAGS.output_path)
    print('Successfully created the TFRecords: {}'.format(output_path))

if __name__ == '__main__':
    tf.app.run()

5.生成指定的 train.record。接下來指定標籤名稱，仿照models/ object_detection/data/ pet_label_map.pbtxt，重新建立一個檔案，指定標籤名

item {![這裡寫圖片描述](https://img-blog.csdn.net/20180125165430032?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxMzIxNDU4OA==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
  id: 1
  name: 'dog'
}

6.開啟 object_detection/samples/configs/ssd_mobilenet_v1_pets.config進行編輯修改，將num值改成自己需要訓練識別的object種類個數
將num_classes修改成自己的num_classes

首先上這裡下載預訓練model，推薦第一個，將第一行的路徑指向下載的ssd_mobilenet_v1_coco/model.ckpt，接下來圈紅的改為自己的record、pbtxt路徑
修改這五個路徑

基於Tensorflow訓練物體、人像識別的模型

領導突發奇想一個idea，於是踏上了瞭解Tensorflow機器學習框架之路，踩過很多坑，做個記錄。各位看官看的時候有些訓練方式可能已經過時或者不對，見諒。參考文件環境配置： ubuntu 16.0.4 Python 2.7 tensorflow

Connectionist Temporal Classification(CTC)、音識別模型小型綜述和一個簡易的語音識別模型的tensorflow實現

CTC是一種端到端的語音識別技術，他避免了需要字或者音素級別的標註，只需要句子級別的標註就可以進行訓練，感覺非常巧妙，也很符合神經網路浪潮人們的習慣。特別是LSTM+CTC相較於之前的DNN+HMM，LSTM能夠更好的捕捉輸入中的重要的點（LSTM隨著狀態數目增加引數呈線性增加，而HMM會平

TensorFlow實現人臉識別(4)--------對人臉樣本進行訓練，儲存人臉識別模型

經過前面幾章的介紹，我們以及可以得到處理好的訓練樣本影象，在本節中將對這些影象進行訓練。主要利用到的是keras。一、構建Dataset類 1.1 init 完成初始化工作 def __init__(self,path_name):

基於TensorFlow訓練的人臉識別神經網路

訓練一個神經網路能讓她認得我這段時間正在學習tensorflow的卷積神經網路部分，為了對卷積神經網路能夠有一個更深的瞭解，自己動手實現一個例程是比較好的方式，所以就選了一個這樣比較有點意思的專案。想要她認得我，就需要給她一些我的照片，讓她記住我的人臉特徵，為了讓她區分我和

基於tensorflow的簡單線性回歸模型

AC turn png cti ret type predict supports on() #!/usr/local/bin/python3 ##ljj [1] ##linear regression model import tensorflow as tf i

基於TensorFlow的簡單驗證碼識別

mini shu nal array pool 利用 imp 大小寫標註　　TensorFlow 可以用來實現驗證碼識別的過程，這裏識別的驗證碼是圖形驗證碼，首先用標註好的數據來訓練一個模型，然後再用模型來實現這個驗證碼的識別。生成驗證碼　　首先生成驗證碼，這裏使用

基於CRF的中文命名實體識別模型

條件隨機場（Conditional Random Fields，簡稱 CRF）是給定一組輸入序列條件下另一組輸出序列的條件概率分佈模型，在自然語言處理中得到了廣泛應用。新建corpus_process類 import re import sklearn_crfsuite from

基於TensorFlow的機器學習(2) -- 迴歸模型

兩種典型的迴歸模型是linear regression 和 logistic regression。以下將分別對兩種迴歸模型進行分析以及基於tensorflow的實現。 Linear Regression(線性迴歸) 線性迴歸基本概念之前基於吳恩達的《

Tensorflow訓練自己的Object Detection模型並進行目標檢測

0.準備工作 1.專案目錄概覽圖1 object detection專案目錄 2.準備資料集和相關檔案下載VOC2007資料集，解壓放到dataset目錄下，如圖1。

基於tensorflow + Vgg16進行影象分類識別

1. VGG-16介紹 vgg是在Very Deep Convolutional Networks for Large-Scale Image Recognition期刊上提出的。模型可以達到92.7%的測試準確度,在ImageNet的前5位。它的資料集包括1

深度學習之Python 指令碼訓練keras mnist 數字識別模型

本指令碼是訓練keras 的mnist 數字識別程式，以前發過了，今天把預測實現了，# Larger CNN for the MNIST Dataset # 2.Negative dimension size caused by subtracting 5 from 1

基於tensorflow + Vgg16進行影象分類識別的實驗

影象分類識別目前已經得到了很大的飛躍，特別是15年微軟提出的resnet已經超越人類，能夠對影象中的物體進行更好的識別。為了初步瞭解一下影象分類識別的過程，學習了一下大牛的主頁，發現還是很有意思的。而且從imagenet的角度來說，這個經度還是可以接受的。本實驗主

基於Tensorflow的LSTM-CNN文字分類模型

題記前段時間再看QA方面的文章，讀了一篇paper（《LSTM-based deep learning model for non-factoid answer selection》）中，使用了LSTM-CNN模型來做answer與question的語義抽取。受此啟發

深度學習（十四）基於CNN的性別、年齡識別

CNN應用之性別、年齡識別作者：hjimce 一、相關理論　　本篇博文主要講解2015年一篇paper《Age and Gender Classification using Convolutional Neural Networks

吳裕雄 python 神經網絡——TensorFlow訓練神經網絡：全模型

生成 atm dep con image 學習 ria pri control import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data INPUT_NO

基於Tensorflow, OpenCV. 使用MNIST資料集訓練卷積神經網路模型，用於手寫數字識別

基於Tensorflow，OpenCV 使用MNIST資料集訓練卷積神經網路模型，用於手寫數字識別一個單層的神經網路，使用MNIST訓練，識別準確率較低兩層的卷積神經網路，使用MNIST訓練（模型使用MNIST測試集準確率高於99%

（更新視訊教程）Tensorflow object detection API 搭建屬於自己的物體識別模型（2）——訓練並使用自己的模型

2018.05.10 本人時差黨，有時候回覆不及時。建立了一個QQ群，方便大家互相學習交流。 -----------------------------------------------------------------------------------------

opencv_人臉檢測、模型訓練、人臉識別

nbsp tro python3.6 pychar 入門 tex 幫助 family ext 人臉檢測、模型訓練、人臉識別 2018-08-15 　　今天給大家帶來一套人臉識別一個小案例，主要是幫助小夥伴們解決如何入門OpenCV人臉識別的問題，現在的AI行業比較火熱，

21個專案玩轉深度學習：基於TensorFlow的實踐詳解03—打造自己的影象識別模型

書籍原始碼：https://github.com/hzy46/Deep-Learning-21-Examples CNN的發展已經很多了，ImageNet引發的一系列方法，LeNet，GoogLeNet，VGGNet，ResNet每個方法都有很多版本的衍生，tensorflow中帶有封裝好各方法和網路的函式

Tensorflow如何儲存、讀取model （即利用訓練好的模型測試新資料的準確度）

目標： cnn2d.py cnn2d_test.py 訓練網路，並儲存網路模型讀取網路，用測試集測試準確度直接貼程式碼：（只貼了相關部分，瀏覽完整程式碼請到GitHub） 1. cnn2

基於Tensorflow訓練物體、人像識別的模型

參考文件

環境配置：

訓練過程：

相關推薦