Python 解析labelme標註的xml檔案(bbounding box)

阿新 • • 發佈：2018-12-21

搭配我之前寫的生成tfrecord的文章，可以直接將labelme標註出來的xml檔案解析出來，用於生成bboundingbox的tfrecod檔案
import xmltodict
import json
import xml.dom.minidom as xmldom
from functools import reduce
import operator
import os

def LabelmeXmlGetCoordinate(LabelmeXmlPath):
    AllcoordinateList = []
    for file in [os.path.join(LabelmeXmlPath,item) for item in os.listdir(LabelmeXmlPath)]:
        fileName = os.path.basename(file).split('.')[0]+'.jpg'
        DOMTree = xmldom.parse(file)
        collection = DOMTree.documentElement
        # 獲取尺寸資訊
        imgSize = collection.getElementsByTagName('size')
        width = imgSize[0].getElementsByTagName('width')[0].childNodes[0].data
        height = imgSize[0].getElementsByTagName('height')[0].childNodes[0].data
        depth = imgSize[0].getElementsByTagName('depth')[0].childNodes[0].data
        # 為了後面將box資訊的列表新增進來後方便降成一維，建立二維陣列
        coordinateList = [[fileName,width,height,depth]]
        imgObjects = collection.getElementsByTagName('object')
        #　獲取bboundingbox資訊
        for imgObject in imgObjects:
            label = imgObject.getElementsByTagName('name')[0].childNodes[0].data
            imgBox = imgObject.getElementsByTagName('bndbox')[0]
            xmin = imgBox.getElementsByTagName('xmin')[0].childNodes[0].data
            ymin = imgBox.getElementsByTagName('ymin')[0].childNodes[0].data
            xmax = imgBox.getElementsByTagName('xmax')[0].childNodes[0].data
            ymax = imgBox.getElementsByTagName('ymax')[0].childNodes[0].data
            bboxList = [xmin,ymin,xmax,ymax,label]
            coordinateList.append(bboxList)
        # 將二維資料變成一維陣列 eg:['0acf8.xml', '331', '257', '3', '65', '78', '234', '196', 'a', '258', '122', '300', '171', 'a']
        coordinateList = reduce(operator.add, coordinateList)
        AllcoordinateList.append(coordinateList)
        print(coordinateList)

Python 解析labelme標註的xml檔案(bbounding box)

搭配我之前寫的生成tfrecord的文章，可以直接將labelme標註出來的xml檔案解析出來，用於生成bboundingbox的tfrecod檔案 import xmltodict import json import xml.dom.minidom as xmldom f

python解析並修改xml檔案

使用labelImg標註圖片後需要統一修改圖片label的名稱和圖片名，所以用python批量修改圖片名和xml檔案。首先批量複製並修改圖片名稱： # -*- coding: utf-8 -*- # 將二級目錄下的圖片/標籤檔案重新命名到同一個新資料夾

深入學習Python解析並解密PDF檔案內容的方法

　　前面學習瞭解析PDF文件，並寫入文件的知識，那篇文章的名字為深入學習Python解析並讀取PDF檔案內容的方法。　　但是最近出現了一個新問題，就是上面使用pdfminer這個庫只能解析正常的PDF內容，然而在實際情況中，公司的一些文件可能是加密的，那麼如何處理加密的PDF檔案，就是本文學習的重點。　

利用DOM解析和建立xml檔案

XML解析器是指可以解析XML檔案的程式常見解析器有 1. SAX解析器，用於XML的簡單API 2. DOM解析器，文件物件模型文件物件模型就是利用物件來把文件模型化，這些模型不僅描述了文件的結構，還定義了模型中物件的行為。在DOM中，物件模型要實現：

[XML文件解析]libxml2對XML檔案的建立、解析、查詢、修改

xmlXPathObjectPtr get_nodeset(xmlDocPtr doc, const xmlChar *xpath) { xmlXPathContextPtr context; xmlXPathObjectPtr result; context = xmlXP

如何用Python輸出漂亮的xml檔案

最近要用python處理一個xml檔案。平時習慣了用xml.etree.ElementTree，結果發現此庫存在一些讓人無法忍受的缺點： 1. 無法處理comment和cdata 2. 輸出後的xml檔案沒有換行，沒有縮排，十分難以閱讀於是嘗試這用xml.dom.min

使用PYTHON解析Wireshark的PCAP檔案

PYTHON首先要安裝scapy模組 PY3的安裝scapy-python3，使用PIP安裝就好了,注意,PY3無法使用pyinstaller打包檔案,PY2正常 PY2的安裝scapy，比較麻煩 from scapy.all import * pcaps = rdpca

Java解析rdf和xml檔案以及處理excel

一.Java解析rdf檔案 1.下載jena庫首先，從這裡下載 jena 包 apache-jana-2.7.*.tar.gz（我用的是2.7）。解壓。開啟 Eclipse，新建一個Java Project。右鍵點選專案->properties->Java

深入學習python解析並讀取PDF檔案內容的方法

這篇文章主要學習了python解析並讀取PDF檔案內容的方法，包括對學習庫的應用，python2.7和python3.6中python解析PDF檔案內容庫的更新，包括對pdfminer庫的詳細解釋和應用。主要參考了一些已有的部落格內容，程式碼。　　主要思路是首先利用一個做

Android 解析、修改xml檔案

一、DOM解析XML檔案 public static void main(String[] args) { File file = new File("d:\\WordChronos.xml"); DocumentBuilderFactory dbf =

死磕Spring之IoC篇 - BeanDefinition 的解析階段（XML 檔案）

> 該系列文章是本人在學習 Spring 的過程中總結下來的，裡面涉及到相關原始碼，可能對讀者不太友好，請結合我的原始碼註釋 [Spring 原始碼分析 GitHub 地址](https://github.com/liu844869663/spring-framework) 進行閱讀 > > Spring 版

python 使用ElementTree解析xml檔案

以country.xml為例,內容如下: <?xml version="1.0"?> <data> <country name="Liechtenstein"> <rank updated="yes">2</ran

Python解析xml寫入xlsx檔案

初次接觸Python實現的一個小功能。最初的版本全域性變數滿篇飛，簡直不忍直視，此處程式碼是後來重構過的，感覺還有好多優化的地方，以後有空再搞。 <metric> <complexity>61<

python->解析xml檔案

'''"D:\three_test\gpn_InternetGatewayDevice_v2.xml"<SOAP-ENV:Envelope> <SOAP-ENV:Header> <cwmp:ID SOAP-ENV:mustUnderstand="1">1<

Python解析xml檔案並修改後儲存 demo

前情提要: 需要對底層的引數檔案（xml格式）進行讀取，並將前端下發的資料覆蓋原資料，並儲存。下發引數格式：JSON 程式碼呈現： from xml.dom import minidom targetPath=os.path.join(path,targetfile)

Python解析XML檔案 xml.dom.minidom demo

前情提要: 需要對底層的引數檔案（xml格式）進行讀取，並將前端下發的資料覆蓋原資料，並儲存。 XML樁(01.xml)： <?xml version="1.0" ?> <try> <name>SJH</name> </try

Python解析大XML檔案及讀取XML不全的問題

之前用python的minidom寫過解析xml的指令碼檔案，在前期是比較好用的，因為xml檔案比較小。但是當xml檔案超過了70M的時候，minidom不僅效率低，而且會佔用非常大的記憶體空間，因為他是將整個xml讀入進去並且按照整個xml樹進行建樹（雖然這樣寫程式碼邏輯

python解析xml檔案注意

python2.7 版本無法解析xml gb2312的編碼。所有一般的做法為: dstr = dstr.decode('gb2312').encode('utf-8') dstr = dstr.replace('gb2312','utf-8')

python解析xml檔案——通過etree來解析xml檔案

利用from lxml import etree來解析 ---------------------------這個是有揹包的情況下--------------------------------- <?xmlversion="1.0" ?> <anno

python使用ElementTree解析XML檔案

將XML網頁儲存到本地要載入XML檔案，首先應該將網頁上的資訊提取出來，儲存為本地XML檔案。抓取網頁資訊可以使用python的urllib模組。方法是：先將網頁開啟，並都去上面的內容，然後在本

Python 解析labelme標註的xml檔案(bbounding box)

相關推薦