批量修改xml檔案節點資訊

今天來說說xml那些事兒.如何批量修改指定資料夾下的xml檔案的指定屬性.分三步走,首先,我們先看看如何讀寫單個

的xml檔案;第二步,來看看如何遍歷指定資料夾下的所有檔案,獲取到所有檔案的檔名;第三步,我們來看看一二之間

該如何銜接.好,lets do it

step1:對單個xml檔案進行讀寫

給定一個xml檔案:


  
   
    
     
    
    
     
      <?xml version="1.0" encoding="utf-8"?>
     
    
   
    
     
    
    
     
      <catalog 
>
     
    
   
    
     
    
    
            
      <maxid>4
      </maxid>
     
    
   
    
     
    
    
            
      <login username="pytest" passwd='123456'>
     
    
   
    
     
    
    
     
                  　　
      <caption>Python
      </caption 
>
     
    
   
    
     
    
    
                  
      <item id="4">
     
    
   
    
     
    
    
                         
      <caption>測試
      </caption>
     
    
   
    
     
    
    
                 
      </item>
     
    
   
    
     
    
    
         
      </login 
>
     
    
   
    
     
    
    
         
      <item id="2">
     
    
   
    
     
    
    
                 
      <caption>Zope
      </caption>
     
    
   
    
     
    
    
         
      </item>
     
    
   
    
     
    
    
     
      </catalog>

來看看程式碼,怎麼讀取裡面的屬性(大家先照著註釋理解一遍,有空我再來詳細說明)


  
   
    
     
    
    
     
      #coding=utf-8
     
    
   
    
     
    
    
     
      import xml.dom.minidom
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      #開啟xml文件
     
    
   
    
     
    
    
     
      dom=xml.dom.minidom.parse(
      'test.xml')
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      #得到文件元素物件
     
    
   
    
     
    
    
     
      root=dom.documentElement
     
    
   
    
     
    
    
     
      print root.nodeName
     
    
   
    
     
    
    
     
      print root.nodeValue
     
    
   
    
     
    
    
     
      print root.nodeType
     
    
   
    
     
    
    
     
      print root.ELEMENT_NODE
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      #1.獲取maxid 這一node名字(沒有屬性值),如何獲取裡面的文字?
     
    
   
    
     
    
    
     
      bb=root.getElementsByTagName(
      'maxid')
     
    
   
    
     
    
    
     
      b=bb[
      0]
     
    
   
    
     
    
    
     
      print b.nodeName
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      #2.獲取login 這一node名字及相關屬性值
     
    
   
    
     
    
    
     
      login=root.getElementsByTagName(
      'login')
     
    
   
    
     
    
    
     
      login=login[
      0]  
      #獲取login的相關屬性值
     
    
   
    
     
    
    
     
      un=login.getAttribute(
      "username")
     
    
   
    
     
    
    
     
      print un
     
    
   
    
     
    
    
     
      pd=login.getAttribute(
      "passwd")
     
    
   
    
     
    
    
     
      print pd
     
    
   
    
     
    
    
     
      #修改先關屬性值
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      #3.獲取節點名為item的相關屬性值
     
    
   
    
     
    
    
     
      item=root.getElementsByTagName(
      'item') 
      #獲取了所有名字為item的node
     
    
   
    
     
    
    
     
      item=item[
      0]  
      #拿到第一個item,獲取相關屬性值
     
    
   
    
     
    
    
     
      i=item.getAttribute(
      "id")
      #獲取id的值
     
    
   
    
     
    
    
     
      print i
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      #4.獲取標籤對之間的資料,並修改為新的值
     
    
   
    
     
    
    
     
      caption=root.getElementsByTagName(
      'caption')
     
    
   
    
     
    
    
     
      c0=caption[
      0]
     
    
   
    
     
    
    
     
      print c0.firstChild.data  
      #firstChild屬性返回被選節點的第一個子節點,.data表示獲取該節點資料
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      c1=caption[
      1]
     
    
   
    
     
    
    
     
      print c1.firstChild.data
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      c2=caption[
      2]  
      #caption節點有三個!!!
     
    
   
    
     
    
    
     
      print c2.firstChild.data
     
    
   
    
     
    
    
     
      #修改標籤對之間的資料,直接對節點資料賦值
     
    
   
    
     
    
    
     
      c2.firstChild.data=
      'dhhdlh'
     
    
   
    
     
    
    
     
      print c2.firstChild.data

好了,看完了demo,我們現在來實戰操練一番,使用通用的VOC2007標註資料集,xml檔案長這個樣子:


  
   
    
     
    
    
     
      <annotation verified="no">
     
    
   
    
     
    
    
       
      <folder>row_img
      </folder>
     
    
   
    
     
    
    
       
      <filename>000002
      </filename>
     
    
   
    
     
    
    
       
      <path>/home/nvidia/labelImg-master/img_change/row_img/000002.jpg
      </path>
     
    
   
    
     
    
    
       
      <source>
     
    
   
    
     
    
    
         
      <database>Unknown
      </database>
     
    
   
    
     
    
    
       
      </source>
     
    
   
    
     
    
    
       
      <size>
     
    
   
    
     
    
    
         
      <width>1200
      </width>
     
    
   
    
     
    
    
         
      <height>800
      </height>
     
    
   
    
     
    
    
         
      <depth>3
      </depth>
     
    
   
    
     
    
    
       
      </size>
     
    
   
    
     
    
    
       
      <segmented>0
      </segmented>
     
    
   
    
     
    
    
       
      <object>
     
    
   
    
     
    
    
         
      <name>qwe
      </name>
     
    
   
    
     
    
    
         
      <pose>Unspecified
      </pose>
     
    
   
    
     
    
    
         
      <truncated>0
      </truncated>
     
    
   
    
     
    
    
         
      <difficult>0
      </difficult>
     
    
   
    
     
    
    
         
      <bndbox>
     
    
   
    
     
    
    
           
      <xmin>513
      </xmin>
     
    
   
    
     
    
    
           
      <ymin>265
      </ymin>
     
    
   
    
     
    
    
           
      <xmax>921
      </xmax>
     
    
   
    
     
    
    
           
      <ymax>663
      </ymax>
     
    
   
    
     
    
    
         
      </bndbox>
     
    
   
    
     
    
    
       
      </object>
     
    
   
    
     
    
    
       
      <object>
     
    
   
    
     
    
    
         
      <name>wieoiwpe
      </name>
     
    
   
    
     
    
    
         
      <pose>Unspecified
      </pose>
     
    
   
    
     
    
    
         
      <truncated>0
      </truncated>
     
    
   
    
     
    
    
         
      <difficult>0
      </difficult>
     
    
   
    
     
    
    
         
      <bndbox>
     
    
   
    
     
    
    
           
      <xmin>513
      </xmin>
     
    
   
    
     
    
    
           
      <ymin>265
      </ymin>
     
    
   
    
     
    
    
           
      <xmax>921
      </xmax>
     
    
   
    
     
    
    
           
      <ymax>663
      </ymax>
     
    
   
    
     
    
    
         
      </bndbox>
     
    
   
    
     
    
    
       
      </object>
     
    
   
    
     
    
    
     
      </annotation>

那麼,我們該如何修改呢?請看:


  
   
    
     
    
    
     
      #coding=utf-8
     
    
   
    
     
    
    
     
      import xml.dom.minidom
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      ###批量讀取xml檔案
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      ###讀取單個xml檔案
     
    
   
    
     
    
    
     
      dom=xml.dom.minidom.parse(
      '000002.xml')
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      root=dom.documentElement
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      #獲取標籤對name/pose之間的值
     
    
   
    
     
    
    
     
      name=root.getElementsByTagName(
      'name')
     
    
   
    
     
    
    
     
      pose=root.getElementsByTagName(
      'pose')
     
    
   
    
     
    
    
     
      #原始資訊
     
    
   
    
     
    
    
     
      print 
      '原始資訊'
     
    
   
    
     
    
    
     
      n0=name[
      0]
     
    
   
    
     
    
    
     
      print n0.firstChild.data
     
    
   
    
     
    
    
     
      n1=name[
      1]
     
    
   
    
     
    
    
     
      print n1.firstChild.data
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      p0=pose[
      0]
     
    
   
    
     
    
    
     
      print p0.firstChild.data
     
    
   
    
     
    
    
     
      p1=pose[
      1]
     
    
   
    
     
    
    
     
      print p1.firstChild.data
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      #修改標籤對之間的值
     
    
   
    
     
    
    
     
      n0.firstChild.data=
      'circle'
     
    
   
    
     
    
    
     
      n1.firstChild.data=
      'circle'
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      p0.firstChild.data=
      'ok'
     
    
   
    
     
    
    
     
      p1.firstChild.data=
      'ok'
     
    
   
    
     
    
    
     
      #列印輸出
     
    
   
    
     
    
    
     
      print 
      '修改後的 name'
     
    
   
    
     
    
    
     
      print n0.firstChild.data
     
    
   
    
     
    
    
     
      print n1.firstChild.data
     
    
   
    
     
    
    
     
      print 
      '修改後的 pose'
     
    
   
    
     
    
    
     
      print p0.firstChild.data
     
    
   
    
     
    
    
     
      print p1.firstChild.data

好了,現在我們學會了如何對單個檔案進行修改,那麼多個檔案呢?

step2:遍歷指定路徑下的檔案:


  
   
    
     
    
    
     
      #coding=utf-8
     
    
   
    
     
    
    
     
      import os
     
    
   
    
     
    
    
     
      import os.path
     
    
   
    
     
    
    
     
      import xml.dom.minidom
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      path=
      "/home/nvidia/xmlReader/xml/"
     
    
   
    
     
    
    
     
      files=os.listdir(path)  
      #得到資料夾下所有檔名稱
     
    
   
    
     
    
    
     
      s=[]
     
    
   
    
     
    
    
     
      for xmlFile 
      in files: 
      #遍歷資料夾
     
    
   
    
     
    
    
         
      if 
      not os.path.isdir(xmlFile): 
      #判斷是否是資料夾,不是資料夾才打開
     
    
   
    
     
    
    
             
      print xmlFile

(path下我放的是幾個xml檔案),列印xmlFile我們發現是這樣的:

看到沒,看到這個的話就說明我們已經成功一半了!!!接下來我們把之前寫的讀取單個xml檔案的程式碼放進去


  
   
    
     
    
    
     
      #coding=utf-8
     
    
   
    
     
    
    
     
      import os
     
    
   
    
     
    
    
     
      import os.path
     
    
   
    
     
    
    
     
      import xml.dom.minidom
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      path=
      "/home/nvidia/xmlReader/xml/"
     
    
   
    
     
    
    
     
      files=os.listdir(path)  
      #得到資料夾下所有檔名稱
     
    
   
    
     
    
    
     
      s=[]
     
    
   
    
     
    
    
     
      for xmlFile 
      in files: 
      #遍歷資料夾
     
    
   
    
     
    
    
         
      if 
      not os.path.isdir(xmlFile): 
      #判斷是否是資料夾,不是資料夾才打開
     
    
   
    
     
    
    
             
      print xmlFile
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     	
      #TODO
     
    
   
    
     
    
    
     	
      #xml檔案讀取操作
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     	
      #將獲取的xml檔名送入到dom解析
     
    
   
    
     
    
    
     
      	dom=xml.dom.minidom.parse(xmlFile)
     
    
   
    
     
    
    
     
              root=dom.documentElement
     
    
   
    
     
    
    
             
      #獲取標籤對name/pose之間的值
     
    
   
    
     
    
    
     
              name=root.getElementsByTagName(
      'name')
     
    
   
    
     
    
    
     
              pose=root.getElementsByTagName(
      'pose')
     
    
   
    
     
    
    
             
      #原始資訊
     
    
   
    
     
    
    
             
      print 
      '原始資訊'
     
    
   
    
     
    
    
     
              n0=name[
      0]
     
    
   
    
     
    
    
     	
      print n0.firstChild.data
     
    
   
    
     
    
    
     
      	n1=name[
      1]
     
    
   
    
     
    
    
     	
      print n1.firstChild.data
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      	p0=pose[
      0]
     
    
   
    
     
    
    
     	
      print p0.firstChild.data
     
    
   
    
     
    
    
     
      	p1=pose[
      1]
     
    
   
    
     
    
    
     	
      print p1.firstChild.data

直接執行,報錯!!我...

不要急,我們一點點來解決,,遇到問題是很正常的嘛!!!首先我們看看遇到什麼錯?

列印除了000001.xml但是在實際讀取的時候出錯了!!還說找不到在這個檔案?why??仔細想想發現,這裡可能要傳入的是

每個xml檔案的具體路徑,有了這個想法之後我們再來看看:

這個時候就設涉及到Python路徑拼接的知識了:


  
   
    
     
    
    
     
      path=
      "/home/nvidia/xmlReader/xml/"
     
    
   
    
     
    
    
     
      xmlFile也是幾個字串
     
    
   
    
     
    
    
     
      os.path.join(path,xmlFile)
     
    
   
    
     
    
    
     
      #os.path.join("/home/test","test.xml")

那麼,我們就拼接好了.然後就執行看看:

啊哈?!居然對了!!哈哈哈,大功告成!接下來就是先將影象分好類,然後就可以批量修改檔案了

好了,讓我們開看看最終的程式碼:


  
   
    
     
    
    
     
      #coding=utf-8
     
    
   
    
     
    
    
     
      import os
     
    
   
    
     
    
    
     
      import os.path
     
    
   
    
     
    
    
     
      import xml.dom.minidom
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      path=
      "/home/nvidia/xmlReader/xml/"
     
    
   
    
     
    
    
     
      files=os.listdir(path)  
      #得到資料夾下所有檔名稱
     
    
   
    
     
    
    
     
      s=[]
     
    
   
    
     
    
    
     
      for xmlFile 
      in files: 
      #遍歷資料夾
     
    
   
    
     
    
    
         
      if 
      not os.path.isdir(xmlFile): 
      #判斷是否是資料夾,不是資料夾才打開
     
    
   
    
     
    
    
             
      print xmlFile
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     	
      #TODO
     
    
   
    
     
    
    
     	
      #xml檔案讀取操作
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     	
      #將獲取的xml檔名送入到dom解析
     
    
   
    
     
    
    
     
      	dom=xml.dom.minidom.parse(os.path.join(path,xmlFile))  
      ###最核心的部分,路徑拼接,輸入的是具體路徑
     
    
   
    
     
    
    
     
              root=dom.documentElement
     
    
   
    
     
    
    
             
      #獲取標籤對name/pose之間的值
     
    
   
    
     
    
    
     
              name=root.getElementsByTagName(
      'name')
     
    
   
    
     
    
    
     
              pose=root.getElementsByTagName(
      'pose')
     
    
   
    
     
    
    
             
      #原始資訊
     
    
   
    
     
    
    
             
      print 
      '原始資訊'
     
    
   
    
     
    
    
     
              n0=name[
      0]
     
    
   
    
     
    
    
     	
      print n0.firstChild.data
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      	p0=pose[
      0]
     
    
   
    
     
    
    
     	
      print p0.firstChild.data
     
    
   
    
     
    
    
     	
     
    
   
    
     
    
    
     	
      #修改
     
    
   
    
     
    
    
     
      	n0.firstChild.data=
      'circle'
     
    
   
    
     
    
    
     
      	p0.firstChild.data=
      'ok'
     
    
   
    
     
    
    
     	
      #列印輸出
     
    
   
    
     
    
    
     	
      print 
      '修改後的 name'
     
    
   
    
     
    
    
     	
      print n0.firstChild.data
     
    
   
    
     
    
    
      
 
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    批量修改xml檔案節點資訊
       
  
  
  
   
   
  
 
 今天來說說xml那些事兒.如何批量修改指定資料夾下的xml檔案的指定屬性.分三步走,首先,我們先看看如何讀寫單個 
 的xml檔案;第二步,來看看如何遍歷指定資料夾下的所有檔案,獲取到所有檔案的檔名;第三步,我們來看看一二之間 
 該如何銜接.好,lets d 

  
 

    

    
    C# 用Linq的方式實現對Xml檔案的基本操作（建立xml檔案、增刪改查xml檔案節點資訊）
      
   
    1 
   private
   
   static
   
   void
    GetXmlNodeInforOld(
   string
    xmlPath)
    2 
    {
    3 
   
   try
   
    4 
    {
    5 
     

  
 

    

    
    【學習筆記】使用python批量讀取並修改xml檔案（3）
       
 
 在大老闆的安排下最近在某公司實習，實習期間要求實現一個影象識別模組的封裝。無奈基礎太薄弱，只能將任務細分，單獨學習來實現。以此為背景…… 
 
 經過公司師姐的指點，突然毛瑟頓開，編寫了V3.0的程式碼，可以實現的功能：使用者輸入欲改變的圖片尺寸後計算新的xml中bnb box的值、將圖片尺寸改變後 

  
 

    

    
    【學習筆記】使用python批量讀取並修改xml檔案（2）
       
 
 在大老闆的安排下最近在某公司實習，實習期間要求實現一個影象識別模組的封裝。無奈基礎太薄弱，只能將任務細分，單獨學習來實現。以此為背景…… 
 
 這一篇記錄一些在實際使用中踩到的坑。在實際使用中，我在A資料夾下對圖片進行了標註，隨後將圖片移動到B資料夾下。那麼相應的，標註後的xml檔案中，<p 

  
 

    

    
    【學習筆記】使用python批量讀取並修改xml檔案
       
 
 在大老闆的安排下最近在某公司實習，實習期間要求實現一個影象識別模組的封裝。無奈基礎太薄弱，只能將任務細分，單獨學習來實現。以此為背景…… 
 
 本篇目標：通過python批量訪問並修改xml檔案。 
 目前，存在的問題是，標註好一批圖片後，若改變圖片尺寸，則原始的xml檔案中的bnbbox資料作廢 

  
 

    

    
    【學習筆記】使用python批量讀取並修改xml檔案（4）
       
 
 在大老闆的安排下最近在某公司實習，實習期間要求實現一個影象識別模組的封裝。無奈基礎太薄弱，只能將任務細分，單獨學習來實現。以此為背景…… 
 
 程式碼更新V4.0版本，通過openCV實現xml中bounding box在原始影象和尺寸調整後的圖片中的視覺化（part three部分）。方便對比尺 

  
 

    

    
    C#程式中：如何修改xml檔案中的節點（資料）(
      
                
要想在web等程式中實現動態的資料內容給新（如網頁中的Flash），不會更新xml檔案中的節點（資料）是遠遠不夠的，今天在這裡說一個簡單的xml檔案的更新，方法比較基礎，很適合初學者看的，保證一看就懂！

------------------程式環境下xml檔案中的節點、元 

  
 

    

    
    修改XML的節點內容
      節點   tostring   span   for   events   button   ldoc   -s   str   
這種形式可以修改任何一個節點：　　XmlDocument doc = new XmlDocument();
　　doc.Load("Event.xml");
　　XmlEl 

  
 

    

    
    批量修改文字檔案的編碼格式
       
 1.使用EditPlus開啟要修改編碼格式的檔案所屬目錄 
  
 2.按shift，選中左下角列表中需要轉換編碼格式的文字，右擊選擇“開啟”，開啟的效果如下： 
  
 3.依次選擇選單欄中的“文件”->“文字編碼”->“批量更改文字編碼”，按shift選擇要更改編碼格式的文字，然後單擊“ 

  
 

    

    
    批量修改配置檔案內IP
      cat batch_modify_file.sh #!/bin/bash#by lrj 20181110 
#收集IP後的檔案 file2=$PWD/file2.txttouch $file2 
#檢查檔案屬性Checking_file(){read -p "Please input file name:"  

  
 

    

    
    XML的寫入_dom4j新增、刪除、修改Xml檔案內容
       
  
  
 XML的寫入_dom4j新增、刪除、修改Xml檔案內容 【工程截圖】  【person.xml】準備一個xml檔案 
 <?xml version="1.0" encoding="UTF-8"?>
<students>
    <student id="8888 

  
 

    

    
    applycationContext.xml檔案配置資訊
      <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans"       xmlns:xsi="http://www.w3.org/2001/XMLSchema 

  
 

    

    
    boost::filesystem獲取目錄下的所有.xml檔名，並批量更改.xml檔案中的內容。
      
                第一步，遍歷資料夾並獲取所有.xml檔名，並存入files列表。


#include <boost/filesystem.hpp>
namespace fs = boost::filesystem;

int get_filenames(const std::s 

  
 

    

    
    python 之 如何通過指令碼讀取xml檔案節點
      
                #!/usr/bin/env python
# -*- coding: utf-8 -*-
#coding=utf-8

#寫指令碼的時候習慣把自己常用的模組都import進來了
import sys
import sre_compile
import re
import p 

  
 

    

    
    【小技巧】之 python批量修改指定檔案型別的檔名
       
 
 在工作學習當中，常常遇到要批量修改我檔名情況，要是一個一個的去重新命名，不是程式猿所為，今天分享一個批量修改檔名的方法，供大家參考： 
 例如下圖，在我的某一個資料夾下，又n個亂七八糟的“.txt”檔案，將這些檔案批量修改名稱。 
  
 直接上程式碼： 
 import os
files = os 

  
 

    

    
    Android修改XML檔案
      
                
最近在專案中需要使用XML記錄資料，網上這方面的文章較少，記錄一下
使用DOM方式

/**
	 * 追加內容到XML文件
	 * @param instructions
	 * @throws ParserConfigurationException
	 * @throw 

  
 

    

    
    Java&Xml教程（三）使用DOM方式修改XML檔案內容
      
							
							
							DOM解析方式也可用於修改XML資料，我們可以使用它完成新增元素、刪除元素、修改元素值、修改元素屬性等操作。 
我們的XML檔案，內容如下： 
employee.xml



<?xml version="1.0" encoding="UTF-8" sta 

  
 

    

    
    利用java 寫XML 修改XML檔案
      
                
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStreamWriter;
import java.io.Write 

  
 

    

    
    tinyxml刪除，新增，修改xml檔案
      
								
								            
						
                
TinyXML是一個簡單的、小的、最小的、C
 + + XML解析器,可以很容易地整合到其他專案。它讀取XML和XML文件建立c++物件代表。可以操縱的物件,再次改變,並儲存為XML。

下面說下使用 

  
 

    

    
    c# 建立、讀取、新增、修改xml檔案
      
                
新增名稱空間usingSystem.Xml;
C#讀取已有XML檔案並儲存：
    XmlDocumentxmlDoc = new XmlDocument();
   xmlDoc.Load("D:\\xmlname.xml");
    XmlNodexnRoot =