6-3 如何解析簡單的XML文檔

阿新 • • 發佈：2018-04-28

lis elf eth ide clas get 遞歸 print 直接

技術分享圖片

元素節點、元素樹

>>> from xml.etree.ElementTree import parse

>>> help(parse)
Help on function parse in module xml.etree.ElementTree:

parse(source, parser=None)

help(parse)

>>> f  = open(r‘C:\視頻\python高效實踐技巧筆記\6數據編碼與處理相關話題\linker_log.xml‘)
>>> 
>>> et = parse(f)    # 
et  ElementTree的對象

>>> help(et.getroot)
Help on method getroot in module xml.etree.ElementTree:

getroot(self) method of xml.etree.ElementTree.ElementTree instance

help(et.getroot)

>>> root = et.getroot() #獲取根節點 是一個元素對象

>>> root
<Element ‘DOCUMENT‘ at 0x2e87f90>

#此節點的屬性

>>> root.tag               #查看標簽
‘DOCUMENT‘

>>> root.attrib               #查看屬性，是一個字典，本例中有值，無值時為空
{‘gen_time‘: ‘Fri Dec 01 16:04:26 2017 ‘}

>>> root.text                #查看節點文本，是一個回車無自符串
‘\n‘
>>> root.text.strip()        #將節點文本對 空白字符串過濾
‘‘

>>> root.text.strip()

　‘‘

技術分享圖片

#root自身是一個可叠代對象，直接進行叠代遍歷子元素

>>> for child in root:
    print(child.get(‘id‘))  #child表示子元素 get()方法是獲取某一屬性。

輸出結果

01ABBC90

01BF8610

01BF8AF0

01BFC5F0

01BFE3E8

01BFE850

01BFEAC8

01BFF128

01BFF2B0

01BFF4B8

01BFF730

01BFF960

01BFFB68

#通過find()、findall()、iterfind()只能找當前元素的直接子元素如本例中”root”只能找”MSG”而不能找”TEXT”

>>> root.find(‘MSG‘)       #find（）找到第一個碰到的元素
<Element ‘MSG‘ at 0x2e87fd0>
>>> root.find(‘MSG‘)
<Element ‘MSG‘ at 0x2e87fd0>
>>> root.findall(‘MSG‘)    #find()找到所有的元素
[<Element ‘MSG‘ at 0x2e87fd0>, <Element ‘MSG‘ at 0x2e9f0d0>, <Element ‘MSG‘ at 0x2e9f170>, <Element ‘MSG‘ at 0x2e9f210>, <Element ‘MSG‘ at 0x2e9f2b0>, <Element ‘MSG‘ at 0x2e9f350>, <Element ‘MSG‘ at 0x2e9f3f0>, <Element ‘MSG‘ at 0x2e9f490>, <Element ‘MSG‘ at 0x2e9f530>, <Element ‘MSG‘ at 0x2e9f5d0>, 

>>> root.find(‘TEXT‘)      #“TEXT”是”MSG”的子元素，所以root直接find()找不到
>>> 
>>> msg = root.find(‘MSG‘)
>>> msg.find(‘TEXT‘)
<Element ‘TEXT‘ at 0x2e9f090>


#iterfind()  生成可叠代對表
>>> iterMsg = root.iterfind(‘MSG‘)
>>> for i in xrange(5):
    x = iterMsg.next()
    print x.get(‘id‘)

輸出

01BF8610

01BF8AF0

01BFC5F0

01BFE3E8

01BFE850

>>> iterMsg = root.iterfind(‘MSG‘)
>>> i = 0
>>> for x in iterMsg:
    print(x.get(‘id‘))
    i+=1
    if(i ==5):
        break

輸出結果：

01ABBC90

01BF8610

01BF8AF0

01BFC5F0

01BFE3E8

#iter()可以叠代出所有元素的節點

>>> root.iter()
<generator object iter at 0x02ED3CD8>

技術分享圖片

#遞歸查找某一元素

>>> list(root.iter(‘TEXT‘))

技術分享圖片

三、查找高級用法

1、“*”查找所有的節點

>>> root.findall(‘MSG/*‘)   #查找MSG下的所有子節點，註意只能找其子節點而不能找其孫子節點

技術分享圖片

2、“.//”無論哪個層次下都能找到節點

>>> root.find(‘.//TEXT‘)        #能找到
<Element ‘TEXT‘ at 0x2e9f090>
>>> root.find(‘TEXT‘)        #不能找到
>>>

3、“..”找到父層次的節點

>>> root.find(‘.//TEXT/..‘)
<Element ‘MSG‘ at 0x2e87fd0>

4、“@”包含某一屬性

>>> root.find(‘MSG[@name]‘)          #沒有包含name屬性的
>>> root.find(‘MSG[@Type]‘)          #沒有包含Type屬性的
>>> root.find(‘MSG[@type]‘)          #存在包含type屬性的，並返回
<Element ‘MSG‘ at 0x2e87fd0>

5、屬性等於特定值

>>> root.find(‘MSG[@id="01BFE3E8"]‘)   #註意參數裏的=號後面的字符串需要帶引號
<Element ‘MSG‘ at 0x2e9f2b0>

6、指定序號

>>> root.find("MSG[2]")      #找第二個
<Element ‘MSG‘ at 0x2e9f0d0>

>>> root.find("MSG[last()]")  #找最後一個
<Element ‘MSG‘ at 0x2ecdef0>

>>> root.find("MSG[last()-1]")  #找倒數第二個
<Element ‘MSG‘ at 0x2ecde30>

6-3 如何解析簡單的XML文檔

lis elf eth ide clas get 遞歸 print 直接元素節點、元素樹 >>> from xml.etree.ElementTree import parse >>> help(parse) Help o

Java高級特性第15節解析XML文檔(3) - JDOM和DOM4J技術

可能 tin 導入項目集合框架通過 new 自動縮進 factory 問題一、JDOM解析　　特征：　　1、僅使用具體類，而不使用接口。　　2、API大量使用了Collections類。　　Jdom由6個包構成： Element類表示XML文檔的

dom4j解析和生成XML文檔

document xml dom4j 解析XML的兩種方法package cnslp.dom4j.com; import java.io.File; import java.util.Iterator; import org.dom4j.Attribute; import org.dom4j.D

【學習筆記】關於DOM4J：使用DOM4J解析XML文檔

文本 class 中產獲取 ber exce int() logs hone 一、概述 DOM4J是一個易用的、開源的庫，用於XML、XPath和XSLT中。采用了Java集合框架並完全支持DOM、SAX、和JAXP。 DOM4J最大的特色是使用大量的接口，主要接口都在o

Dom4j解析語音數據XML文檔（註意ArrayList多次添加對象，會導致覆蓋之前的對象）

value exc 根節點屬性 repl 叠代器信息 ledir gettext 今天做的一個用dom4j解析聲音文本的xml文檔時，我用ArrayList來存儲每一個Item的信息，要註意ArrayList多次添加對象，會導致覆蓋之前的對象；解決方案是在最後將對象添加

php使用SimpleXML解析xml文檔將其轉化為數組

常熟 oot foreach 三國 json lex mxml roo type XML 的設計宗旨是傳輸數據，而非顯示數據。因為需要讀取其中數據。我們通常對數組的操作非常熟悉我們可將xml解析完當成數組處理。 <?xml version="1.0" encoding

Java學習總結（21）——XML文檔解析：DOM解析，SAX解析

Oz 學習總結 AR javax exce 天氣 efault ray XP 一．XML簡介1.可擴展性標記語言（eXtensible Markup Language）2.XML用於描述數據3.應用場合：（1）持久化存儲數據（2）數據交換（3）數據配置4.XML語法（1）文

解析XML文檔大致流程以及相關方法

數據 attribute 使用中間 ttext 獲取 doc name 每一個 ---恢復內容開始--- 使用dom解析XML文檔的大致流程(要導入dom4j)1:創建SAXReader2:使用SAXReader讀取xml文檔,並生成對應的Document對象,該對象保

Java高級特性第13節解析XML文檔(1) - DOM和XPath技術

計算 form xpath ldoc previous practice 長度然而復雜一、使用DOM解析XML文檔　　DOM的全稱是Document Object Model，也即文檔對象模型。在應用程序中，基於DOM的XML分析器將一個XML文檔轉換成一個對象

Java高級特性第14節解析XML文檔(2) - SAX 技術

rim ride brush books 適合函數實現 jdk 特性自定義類一、SAX解析XML文檔　　SAX的全稱是Simple APIs for XML，也即XML簡單應用程序接口。與DOM不同，SAX提供的訪問模式是一種順序模式，這是一種快速讀寫XML數據的

使用Dom4j對XML文檔創建與解析

body 設置文檔 lazy write cat equal parse 進行創建XML文件： public class Dom4jCreateXml { public void testCreatXml() { //創建文檔對象

XML文檔的創建

項目新建 logs end append save innertext doc ext 右鍵項目，添加，新建項，XML文件 XML文件的第一行有一個標題，標題描述了這個XML文件的版本和編碼 XML文件必須有根節點且只能有一個根節點，如<Books></

xml schema 建立xml文檔

ext loser -m cnblogs ice 模擬 ati pin spa web-app_2_5.xsd <?xml version="1.0" encoding="UTF-8"?> <!-- 傳智播客Schema教學實例文檔。

遞歸XML文檔

php col cti 導入 des length etc res root 1 <?php 2 //遞歸XML文檔 3 function getChilds($node){ 4 echo "<ul>"; 5 if($node-

MinDoc v0.6 發布，輕量級文檔在線管理系統

目標項目部門功能 china 刪除升級 eas 詳細介紹更新日誌新增標簽功能，可以根據標簽組織項目新增用戶刪除功能，刪除後的用戶項目以及其他數據會自動轉移到超級管理員賬戶上新增項目描述支持Markdown語法優

C#基礎視頻教程6.3 如何簡單讀寫數據庫

一點犯錯 .html ack ble 數字擴展你知道定義在繼續往下做之前，我們需要把之前的代碼盡可能的精簡（會對後面很有好處，而且讀者也應該仔細比對這一部分的代碼和上一部分哪裏真正得到了優化，從而提高編程水平）。首先數據庫的操作類有哪些是可以做的更加普遍，變量

發布WebApi項目時包含XML文檔文件

out element you color style XML directory each rect Open your publishprofile (*.pubxml) and include this code into "Project" element:

XML文檔讀取-DOM

rst i++ 刪除接口 comment extc oid tag org DOM(Document Object Model)，“文檔對象模型”早期是為了解決不用瀏覽器間數據兼容問題提出的解決方案，現在已經是W3C組織推薦的處理可擴展標誌語言的標準編程接口。 W3C

Linux(RHEL)5.4/5.5/5.8/6.0/6.3 ISO鏡像文件-下載地址

rhel iso 版本有RedHat Enterprise Linux(RHEL)5.4/5.5/5.8/6.0/6.3 ISO鏡像文件下載地址：RHEL 5.4 ISO下載http://rhel.ieesee.net/uingei/rhel-server-5.4-i386-dvd.isohttp:/

響應式編程庫Reactor 3 Reference Guide參考文檔中文版（v3.2.0）

響應式編程Project Reactor 是 Spring WebFlux 的禦用響應式編程庫，與 Spring 是兄弟項目。關於如何基於Spring的組件進行響應式應用的開發，歡迎閱讀系列文章《響應式Spring的道法術器》。官方參考文檔地址：http://projectreactor.io/doc

6-3 如何解析簡單的XML文檔

三、查找高級用法

1、“*”查找所有的節點

2、“.//”無論哪個層次下都能找到節點

3、“..”找到父層次的節點

4、“@”包含某一屬性

5、屬性等於特定值

6、指定序號

相關推薦