目標檢測的標註數據 .xml 轉為 tfrecord 的格式用於 TensorFlow 訓練

阿新 • • 發佈：2019-01-09

split() leo ofa monit dir txt dining bus not in

將目標檢測的標註數據 .xml 轉為 tfrecord 的格式用於 TensorFlow 訓練。

import xml.etree.ElementTree as ET
import numpy as np
import os
import tensorflow as tf
from PIL import Image

classes = ["aeroplane", "bicycle", "bird", "boat", "bottle", "bus", "car", "cat", "chair", "cow", "diningtable",
           "dog", "horse", "motorbike", "person", "pottedplant", "sheep", "sofa", "train", "tvmonitor"]


def convert(size, box):
    dw = 1./size[0]
    dh = 1./size[1]
    x = (box[0] + box[1])/2.0
    y = (box[2] + box[3])/2.0
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x*dw
    w = w*dw
    y = y*dh
    h = h*dh
    return [x, y, w, h]


def convert_annotation(image_id):
    in_file = open(‘F:/xml/%s.xml‘%(image_id))

    tree = ET.parse(in_file)
    root = tree.getroot()
    size = root.find(‘size‘)
    w = int(size.find(‘width‘).text)
    h = int(size.find(‘height‘).text)
    bboxes = []
    for i, obj in enumerate(root.iter(‘object‘)):
        if i > 29:
            break
        difficult = obj.find(‘difficult‘).text
        cls = obj.find(‘name‘).text
        if cls not in classes or int(difficult) == 1:
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find(‘bndbox‘)
        b = (float(xmlbox.find(‘xmin‘).text), float(xmlbox.find(‘xmax‘).text), float(xmlbox.find(‘ymin‘).text), float(xmlbox.find(‘ymax‘).text))
        bb = convert((w, h), b) + [cls_id]
        bboxes.extend(bb)
    if len(bboxes) < 30*5:
        bboxes = bboxes + [0, 0, 0, 0, 0]*(30-int(len(bboxes)/5))

    return np.array(bboxes, dtype=np.float32).flatten().tolist()

def convert_img(image_id):
    image = Image.open(‘F:/snow leopard/test_im/%s.jpg‘ % (image_id))
    resized_image = image.resize((416, 416), Image.BICUBIC)
    image_data = np.array(resized_image, dtype=‘float32‘)/255
    img_raw = image_data.tobytes()
    return img_raw

filename = os.path.join(‘test‘+‘.tfrecords‘)
writer = tf.python_io.TFRecordWriter(filename)
# image_ids = open(‘F:/snow leopard/test_im/%s.txt‘ % (
#     year, year, image_set)).read().strip().split()

image_ids = os.listdir(‘F:/snow leopard/test_im/‘)
# print(filename)
for image_id in image_ids:
    print (image_id)
    image_id = image_id.split(‘.‘)[0]
    print (image_id)

    xywhc = convert_annotation(image_id)
    img_raw = convert_img(image_id)

    example = tf.train.Example(features=tf.train.Features(feature={
        ‘xywhc‘:
                tf.train.Feature(float_list=tf.train.FloatList(value=xywhc)),
        ‘img‘:
                tf.train.Feature(bytes_list=tf.train.BytesList(value=[img_raw])),
        }))
    writer.write(example.SerializeToString())
writer.close()

Python讀取文件夾下圖片的兩種方法：

import os
imagelist = os.listdir(‘./images/‘)      #讀取images文件夾下所有文件的名字

import glob
imagelist= sorted(glob.glob(‘./images/‘ + ‘frame_*.png‘))      #讀取帶有相同關鍵字的圖片名字，比上一中方法好

參考：

https://blog.csdn.net/CV_YOU/article/details/80778392

https://github.com/raytroop/YOLOv3_tf

目標檢測的標註數據 .xml 轉為 tfrecord 的格式用於 TensorFlow 訓練

split() leo ofa monit dir txt dining bus not in 將目標檢測的標註數據 .xml 轉為 tfrecord 的格式用於 TensorFlow 訓練。 import xml.etree.ElementTree as ET i

學習筆記TF016:CNN實現、數據集、TFRecord、加載圖像、模型、訓練、調試

quest oba lose 神經元 byte 足夠 jpg eight 值轉換 AlexNet(Alex Krizhevsky,ILSVRC2012冠軍)適合做圖像分類。層自左向右、自上向下讀取，關聯層分為一組，高度、寬度減小，深度增加。深度增加減少網絡計算量。訓練模

Dom4j解析語音數據XML文檔（註意ArrayList多次添加對象，會導致覆蓋之前的對象）

value exc 根節點屬性 repl 叠代器信息 ledir gettext 今天做的一個用dom4j解析聲音文本的xml文檔時，我用ArrayList來存儲每一個Item的信息，要註意ArrayList多次添加對象，會導致覆蓋之前的對象；解決方案是在最後將對象添加

機器學習實戰筆記-利用K均值聚類算法對未標註數據分組

無監督學習——K-均值聚類算法對未標註數據分組

機器學習算法可能變化分類結果 sts lis mat 得到無監督學習和監督學習不同的是，在無監督學習中數據並沒有標簽（分類）。無監督學習需要通過算法找到這些數據內在的規律，將他們分類。（如下圖中的數據，並沒有標簽，大概可以看出數據集可以分為三類，

影象標註工具彙總目標檢測標註工具影象分割標註工具

對於監督學習演算法而言，資料決定了任務的上限，而演算法只是在不斷逼近這個上限。世界上最遙遠的距離就是我們用同一個模型，但是卻有不同的任務。但是資料標註是個耗時耗力的工作，下面介紹幾個影象標註工具： Labelme Labelme適用於影象分割任務的資料集製作：它來自下面的專案：https:

目標檢測標註工具labelImg使用方法（Ubuntu）

外網github這裡展示的是原始碼過程，我給大家說以下怎麼下載以及安裝，和使用的問題下載版本親測，下載的版本直接上圖，紅色條區域是我自己在我的ubuntu系統上使用過得緊接著，就是download的工作了，不如直接上圖同樣是紅色方框著的地方，是我們

機器學習：利用K-均值聚類算法對未標註數據分組——筆記

最大的相似度計算最小合並表示所有改變們的描述聚類：　　聚類是一種無監督的學習，它將相似的對象歸到同一個簇中。有點像全自動分類。聚類方法幾乎可以應用於所有對象，簇內的對象越相似，聚類的效果越好。聚類分析試圖將相似對象歸入同一簇，將不相似對象歸到不同簇。相似

目標檢測標註工具labelIm

安裝步驟（預設已經安裝了Python3.6）：pip 安裝PyQt5 進入cmd（Win鍵 + R鍵，輸入cmd，enter鍵入），輸入： >>pip install PyQt5如果下載太慢

windows環境下目標檢測標註工具labelImg安裝

1. LabelImg下載：https://github.com/tzutalin/labelImg。2. 將下載的檔案解壓縮到自己指定的目錄並進入該目錄。3. shift+滑鼠右鍵開啟cmd命令視窗4.用anaconda安裝好python3.6，pyqt5, lxml必備包

IP數據報首部格式

ria 例如 tcp 包括報文校驗應用 size 協議 IP協議提供不可靠、無連接的數據報傳送服務。不可靠：盡力而為地傳輸，不保證IP數據報能成功到達目的地。無連接：每一個數據報之間相互獨立地進行路由選擇，可不按發送順序接收。 IP首部格式例如以下：

django-將數據庫數據轉換成JSON格式（ORM和SQL兩種情況）

user 展示 blog serialize 進行項目開發不管怎麽說語句 spa 最近打算搞一個自動化運維平臺，所以在看Django的知識。在實際項目開發中，遇到一個小問題：前後端發生數據交互主流采用的是JSON。前端傳數據到服務器端比較簡單，稍微麻煩的是服務器端傳

數據轉換為json格式

json 數據轉換格式一.使用Gson轉換為json格式依賴的maven包：<dependency> <groupId>com.google.code.gson</groupId> <artifactId>gson</art

將Lang類型數據轉換為固定格式的字符類型。

mic 字符類 body string eight group lang tab style 數字格式化將Lang類型數據轉換為固定格式的字符類型。 DecimalFormat a=new DecimalFormat("###,##0.00"); String

邏輯回歸--參數解釋＋數據特征不獨熱編碼＋訓練數據分布可視話

訓練隨機交叉坐標 one 叠代優化 Coding plot 輸出 #-*- coding: utf-8 -*- ‘‘‘ 邏輯回歸參數： penalty：懲罰項，str類型，可選參數為l1和l2，默認為l2。用於指定懲罰項中使用的規範。newton-cg、sag和lb

將頁面中表格數據導出excel格式的文件（vue）

表示 webpack ade bpa upd 調用 clas 使用目錄　　近期由於項目需要，需要將頁面中的表格數據導出excel格式的文件，折騰了許久，在網上各種百度，雖然資料不少，但是大都不全，踩了許多坑，總算是皇天不負有心人，最後圓滿解決了。　　1、安裝相關依賴

python 爬蟲數據準換時間格式

print %d time utc 數據 str pre ray color 1 timeStamp = 1381419600 2 dateArray = datetime.datetime.utcfromtimestamp(timeStamp) 3 otherSty

【目標檢測】SSD演算法--損失函式的詳解(tensorflow實現）

SSD的損失函式包含用於分類的log loss 和用於迴歸的smooth L1，並對正負樣本比例進行了控制，可以提高優化速度和訓練結果的穩定性。總的損失函式是分類和迴歸的誤差的帶權加和。α表示兩者的權重，N表示匹配到default box的數量 1 loc的損失函式

TensorFlow多線程輸入數據處理框架（三）——組合訓練數據

code lte 函數 auth cast desc 結構 save pca 參考書《TensorFlow：實戰Google深度學習框架》（第2版）通過TensorFlow提供的tf.train.batch和tf.train.shuffle_batch函數來將單個的樣

【目標檢測實戰】目標檢測實戰之一--手把手教你LMDB格式資料集製作！

文章目錄 1 目標檢測簡介 2 lmdb資料製作 2.1 VOC資料製作 2.2 lmdb檔案生成 lmdb格式的資料是在使用caffe進行目標檢測或分類時，使用的一種資料格式。這裡我主要以目標檢測為例講解lmdb格式資料的製作。 1 目標檢測簡介【1】目標檢測主要有兩個任務：判斷影

目標檢測 的標註數據 .xml 轉為 tfrecord 的格式用於 TensorFlow 訓練

相關推薦

目標檢測的標註數據 .xml 轉為 tfrecord 的格式用於 TensorFlow 訓練