python 擷取XML中bndbox的座標中的影象,另存為jpg的例項

阿新 • • 發佈：2020-03-10

檔案目錄

Annotations中是XML檔案。

JPEGImages中是對應的JPG檔案

XML檔案

python 擷取XML中bndbox的座標中的影象,另存為jpg的例項

要擷取bndbox座標中的內容。

python程式碼

# -*- coding: utf-8 -*-
# @Time  : 2020/2/8 22:14
# @Author : SanZhi
# @File  : get_xml.py
# @Software: PyCharm
import cv2
import numpy as np

import xml.dom.minidom
import os
import argparse

def main():
  # JPG檔案的地址
  img_path = 'D:/ser/JPEGImages/'
  # XML檔案的地址
  anno_path = 'D:/ser/Annotations/'
  # 存結果的資料夾
  cut_path = 'D:/ser/cut/'
  # 獲取資料夾中的檔案
  imagelist = os.listdir(img_path)

  for image in imagelist:
    image_pre,ext = os.path.splitext(image)
    img_file = img_path + image
    img = cv2.imread(img_file)
    xml_file = anno_path + image_pre + '.xml'
    DOMTree = xml.dom.minidom.parse(xml_file)
    collection = DOMTree.documentElement
    objects = collection.getElementsByTagName("object")

    for object in objects:
      print("start")
      bndbox = object.getElementsByTagName('bndbox')[0]
      xmin = bndbox.getElementsByTagName('xmin')[0]
      xmin_data = xmin.childNodes[0].data
      ymin = bndbox.getElementsByTagName('ymin')[0]
      ymin_data = ymin.childNodes[0].data
      xmax = bndbox.getElementsByTagName('xmax')[0]
      xmax_data = xmax.childNodes[0].data
      ymax = bndbox.getElementsByTagName('ymax')[0]
      ymax_data = ymax.childNodes[0].data
      xmin = int(xmin_data)
      xmax = int(xmax_data)
      ymin = int(ymin_data)
      ymax = int(ymax_data)
      img_cut = img[ymin:ymax,xmin:xmax,:]
      cv2.imwrite(cut_path + 'cut_img_{}.jpg'.format(image_pre),img_cut)


if __name__ == '__main__':
  main()

補充知識：python讀取XML中bndbox和object name的方法

直接貼程式碼了，封裝為了函式，直接呼叫即可。其中有幾個點需要注意。

1、bndbox下面有4個子物件，因此不能直接使用firstChild來找到內容，需要從該物件裡面繼續尋找標籤為xmin等這樣的物件，注意要加[0]才正確，有問題的可以直接除錯，然後看變數的結構，根據變數的結構來呼叫某一物件。

2、將空格' '替換為'_'，方便命名。但是使用str.replace(' ','_')不會直接改變str的內容，返回的字串是改變後的，因此需要變數儲存。

import xml.dom.minidom as xmldom
def get_bndboxfromxml(imageNum,xmlfilebasepath):
  # 讀取xml檔案
  bndbox = [0,0]
  xmlfilepath = xmlfilebasepath + "\%06d" % imageNum+'.xml'
  # print(xmlfilepath)
  domobj = xmldom.parse(xmlfilepath)
  elementobj = domobj.documentElement
  sub_element_obj = elementobj.getElementsByTagName('bndbox')
  if sub_element_obj is not None:
    bndbox[0] = int(sub_element_obj[0].getElementsByTagName('xmin')[0].firstChild.data)
    bndbox[1] = int(sub_element_obj[0].getElementsByTagName('ymin')[0].firstChild.data)
    bndbox[2] = int(sub_element_obj[0].getElementsByTagName('xmax')[0].firstChild.data)
    bndbox[3] = int(sub_element_obj[0].getElementsByTagName('ymax')[0].firstChild.data)
  return bndbox


def get_bndboxnamefromxml(imageNum,xmlfilebasepath):
  bndbox = [0,0]
  xmlfilepath = xmlfilebasepath + "\%06d" % imageNum + '.xml'
  domobj = xmldom.parse(xmlfilepath)
  elementobj = domobj.documentElement
  sub_element_obj = elementobj.getElementsByTagName('name')
  name = sub_element_obj[0].firstChild.data.replace(' ','_')

  return name

以上這篇python 擷取XML中bndbox的座標中的影象,另存為jpg的例項就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

python 擷取XML中bndbox的座標中的影象,另存為jpg的例項

檔案目錄 Annotations中是XML檔案。 JPEGImages中是對應的JPG檔案 XML檔案要擷取bndbox座標中的內容。

Win10電腦中怎麼將螢幕截圖另存為PDF

很多win10系統使用者遇到喜歡的網頁都會想要儲存下來，我們可以截圖或者複製貼上，但是如果網頁內容有點多的話，複製貼上可能比較繁瑣亦或是格式會出現錯誤，所以如果可以把網頁儲存為pdf檔案的話就方便多了，那麼Wi

儲存、另存為視窗中不顯示桌面的解決方法儲存、另存為視窗中不顯示桌面的解決方法

儲存、另存為視窗中不顯示桌面的解決方法電腦上儲存、另存為一些需要的檔案或者圖片時，發現桌面不見了，重新儲存還是找不到桌面，以Windows 10作業系統為例說明解決方法。　　解決方法：1、雙擊-此電腦-組織-

獲取python執行輸出的資料並解析存為dataFrame例項

在學習xg的時候，想畫學習曲線，但無奈沒有沒有這個 evals_result_ AttributeError: \'Booster\' object has no attribute \'evals_result_\'

python中影象通道分離與合併例項

我就廢話不多說了，直接上程式碼吧！ import cv2 img = cv2.imread(\"1.jpg\") b,g,r = cv2.split(img) #分離函式

python擷取視訊中的某一段

# 功能：對視訊檔案進行剪下。# 剪下指定長度的視訊，選擇要裁剪的視訊，選擇開始時間點和停止時間點即可。# 將處理後的視訊儲存為output.avi檔案import cv2# OpenCVimport tkinter.filedialog# Python檔案對話方塊d

Python OpenCV中的numpy與影象型別轉換操作

Python OpenCV儲存影象使用的是Numpy儲存，所以可以將Numpy當做影象型別操作，操作之前還需進行型別轉換，轉換到int8型別

根據xml檔案中目標座標計算目標占比、長寬、面積等

技術標籤：好用的python小程式python 下面程式主要用來統計：計算每一個目標在原圖中的佔比；計算目標的平均長度；計算平均寬度；計算平均面積；計算目標平均佔比；

python擷取陣列的一半_python：28.陣列中出現超過一半的數字

技術標籤：python擷取陣列的一半題目描述陣列中有一個數字出現的次數超過陣列長度的一半，請找出這個數字。例如輸入一個長度為9的陣列{1,2,3,2,2,2,5,4,2}。由於數字2在陣列中出現了5次，超過陣列長度的一

ENVI中無座標資訊的影象檔案組合多波段影象檔案的方法

我們經常需要合成一個多波段影象檔案，如果有座標資訊，可以直接使用Layer Stacking/Build Layer Stack（ENVI5.5及以上版本更名）工具。當被組合的影象檔案沒有座標參考資訊時候，我們可以使用以下兩種方法實現：

Mysql字串擷取及獲取指定字串中的資料

前言：本人遇到一個需求，需要在MySql的欄位中擷取一段字串中的特定字元，類似於正則表示式的擷取，苦於沒有合適的方法，百度之後終於找到一個合適的方法：substring_index(\'www.sqlstudy.com.cn\',\'.\',-2)

Python如何應用cx_Oracle獲取oracle中的clob欄位問題

最近在用Python編寫連線資料庫獲取記錄的指令碼，其中用到了cx_Oracle模組。它的語法主要如下：

Python使用pymysql從MySQL資料庫中讀出資料的方法

python3.x已經不支援mysqldb了,支援的是pymysql 使用pandas讀取MySQL資料時，使用sqlalchemy，出現No module named ‘MySQLdb\'錯誤。

Python實現將MySQL資料庫表中的資料匯出生成csv格式檔案的方法

本文例項講述了Python實現將MySQL資料庫表中的資料匯出生成csv格式檔案的方法。分享給大家供大家參考，具體如下：

Python Pickle 實現在同一個檔案中序列化多個物件

也是看別人程式碼才知道可以開啟一個檔案就可以把多個物件序列化到這個檔案中。

Pytorch中Tensor與各種影象格式的相互轉化詳解

前言在pytorch中經常會遇到影象格式的轉化，例如將PIL庫讀取出來的圖片轉化為Tensor，亦或者將Tensor轉化為numpy格式的圖片。而且使用不同影象處理庫讀取出來的圖片格式也不相同，因此，如何在pytorch中正確轉化各

python cv2在驗證碼識別中應用例項解析

這篇文章主要介紹了python cv2在驗證碼識別中應用例項解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python每5分鐘從kafka中提取資料的例子

我就廢話不多說了，直接上程式碼吧！ import sys sys.path.append(\"..\") from datetime import datetime

python實現在多維陣列中挑選符合條件的全部元素

問題產生：今天在編寫神經網路的Cluster作業時，需要根據根據資料標籤用不同的顏色畫出資料的分佈情況，由此學習到了這種高效的方法。

基於python解線性矩陣方程(numpy中的matrix類)

這學期有一門運籌學，講的兩大塊兒：線性優化和非線性優化問題。在非線性優化問題這裡涉及到拉格朗日乘子法，經常要算一些非常變態的線性方程，於是我就想用python求解線性方程。查閱資料的過程中找到了一個極其簡單

python 擷取XML中bndbox的座標中的影象,另存為jpg的例項

相關推薦