Python XML解析

阿新 • • 發佈：2019-01-23

python對XML的解析

常見的XML程式設計介面有DOM和SAX，這兩種介面處理XML檔案的方式不同，當然使用場合也不同。

python有三種方法解析XML，SAX，DOM，以及ElementTree:

1.SAX (simple API for XML )

python使用SAX解析xml

SAX是一種基於事件驅動的API。

利用SAX解析XML文件牽涉到兩個部分:解析器和事件處理器。

解析器負責讀取XML文件,並向事件處理器傳送事件,如元素開始跟元素結束事件;

而事件處理器則負責對事件作出相應,對傳遞的XML資料進行處理。

1、對大型檔案進行處理；
2、只需要檔案的部分內容，或者只需從檔案中得到特定資訊。

3、想建立自己的物件模型的時候。

在python中使用sax方式處理xml要先引入xml.sax中的parse函式，還有xml.sax.handler中的ContentHandler。

ContentHandler類方法介紹

characters(content)方法

呼叫時機：

從行開始，遇到標籤之前，存在字元，content的值為這些字串。

從一個標籤，遇到下一個標籤之前，存在字元，content的值為這些字串。

從一個標籤，遇到行結束符之前，存在字元，content的值為這些字串。

標籤可以是開始標籤，也可以是結束標籤。

startDocument()方法

文件啟動的時候呼叫。

endDocument()方法

解析器到達文件結尾時呼叫。

startElement(name, attrs)方法

遇到XML開始標籤時呼叫，name是標籤的名字，attrs是標籤的屬性值字典。

endElement(name)方法

遇到XML結束標籤時呼叫。

Student.xml

<?xml version="1.0" encoding="utf-8" ?>
<Students shelf="金庸程式工程師">
    <Student id="01">
        <name>張三</name>
        <age>29</age>
        <sex>男</sex>
    </Student>
    <Student id="02">
        <name>李四</name>
        <age>20</age>
        <sex>女</sex>
    </Student>
    <Student id="03">
        <name>神鵰</name>
        <age>299</age>
        <sex>公</sex>
    </Student>
</Students>

#sax解析
from xml.sax import ContentHandler
from xml.sax import parse

class Student:
    def __init__(self,name=None,age=None,sex=None):
        self.name=name
        self.age=age
        self.sex=sex
    def __str__(self):
        return self.name+','+str(self.age)+self.sex

students=[]
class saxdemo(ContentHandler):
    def startDocument(self):
        print("startDocument...")
        pass
    def endDocument(self):
        print("endDocument...")
        pass
    def startElement(self, name, attrs):
        print('startElement...')
        if name=='Student':
            self.student=Student()
    def endElement(self, name):
        print('endElement...')
        if name=='name':
            self.student.name=self.tag
        if name=='age':
            self.student.age=self.tag
        if name=='sex':
            self.student.sex=self.tag
        if name=='Student':
            students.append(self.student)
        pass
    def characters(self, content):
        print('characters... content:%s'%(content))
        self.tag=content
        pass

parse('Student.xml',saxdemo())

for stu in students:
    print(stu)

2.DOM(Document Object Model)

將XML資料在記憶體中解析成一個樹，通過對樹的操作來操作XML。

books.xml內容如下.

<?xml version="1.0" encoding="utf-8" ?>
<books shelf="金庸程式工程師">
    <book id="01">
        <bookname>python入門</bookname>
        <author>李強</author>
        <price>25</price>
    </book>
    <book id="02">
        <bookname>java基礎</bookname>
        <author>王洋</author>
        <price>30</price>
    </book>
    <book id="03">
        <bookname>神鵰俠侶</bookname>
        <author>金庸</author>
        <price>125</price>
    </book>
</books>

#dom解析
from xml.dom.minidom import parse
import xml.dom.minidom

#使用minidom解析器開啟xml檔案
DOMTree=xml.dom.minidom.parse('book.xml')
books=DOMTree.documentElement
if books.hasAttribute("shelf"):
    print("根節點 :%s"%(books.getAttribute("shelf")))
    #獲取所有書籍節點
    bookEs=books.getElementsByTagName("book")
    #遍歷每本書籍,列印詳細資訊
    for book in bookEs:
        if book.hasAttribute("id"):
            print('book節點 id值為%s'%(book.getAttribute("id")))
        bookname=book.getElementsByTagName("bookname")[0]
        print('book bookname:%s'%(bookname.childNodes[0].data))
        author = book.getElementsByTagName("author")[0]
        print('book author:%s' % (author.childNodes[0].data))
        price = book.getElementsByTagName("price")[0]
        print('book price:%s' % (price.childNodes[0].data))

3.ElementTree

對比其他 Python 處理 XML 的方案，xml.etree.ElementTree 模組（下文我們以 ET 來表示）相對來說比較簡單，介面也較友好

ElementTree提供的方法

find(match) # 查詢第一個匹配的子元素， match可以時tag或是xpaht路徑
findall(match) # 返回所有匹配的子元素列表
findtext(match, default=None) #
iter(tag=None) # 以當前元素為根節點建立樹迭代器,如果tag不為None,則以tag進行過濾
iterfind(match)
parse(match) #從指定的 XML 檔案構造一個ElementTree物件

#etree解析
import xml.etree.ElementTree as et
root=et.parse('Student.xml')
stus=root.findall("Student")
p=[]
for stu in stus:
    student=Student()
    student.name=stu.find("name").text
    student.age=stu.find("age").text
    student.sex=stu.find("sex").text
    p.append(student)
for i in p:
    print(i)

Python XML解析

python對XML的解析常見的XML程式設計介面有DOM和SAX，這兩種介面處理XML檔案的方式不同，當然使用場合也不同。python有三種方法解析XML，SAX，DOM，以及ElementTree:1.SAX (simple API for XML )python使用SA

Python xml解析記錄

Python的xml解析方式自帶的有3種，xml.dom.*、xml.sax.*以及xml.etree.ElementTree，相對來說，xml.etree.ElementTree最快捷方便。因為自己只使用了xml.etree.ElementTree，所以下面就簡單記錄下

使用由 Python 編寫的 lxml 實現高性能 XML 解析

預編譯例子 parsing 信息 each using 創建 multi 元素 lxml 簡介 Python 從來不出現 XML 庫短缺的情況。從 2.0 版本開始，它就附帶了 xml.dom.minidom 和相關的 pulldom 以及 Simple API for

Python-Json字符串和XML解析

all 創建目標有效語言系列化 res 組成 tag Python-json字符串和xml解析 JSON:JavaScript Object Notation(JavaScript 對象表示法) JSON是存儲和交換文本信息的語法，類似XML JSON比

Python高階程式設計（五）XML解析

Python XML解析什麼是XML？ XML 指可擴充套件標記語言（eXtensible Markup Language）。你可以通過本站學習XML教程 XML 被設計用來傳輸和儲存資料。 XML是一套定義語義標記的規則，這些標記將文件分成許多部件並對這些部件加以標識。

python->解析xml檔案

'''"D:\three_test\gpn_InternetGatewayDevice_v2.xml"<SOAP-ENV:Envelope> <SOAP-ENV:Header> <cwmp:ID SOAP-ENV:mustUnderstand="1">1<

用python處理時間、utf8文字、正則匹配、序列化、目錄路徑搜尋、xml解析

python 處理時間 1 import time 2 import re 3 now = time.strftime("%Y-%m-%d %H:%M:%S", time.gmtime()) 4 timeobj = re.match(r'(.*)-(.*)-(.*) (.*):(.*):(.*)',

Python中xml解析

XML指可擴充套件標記語言（extensibleMarkup Language），被設計用來傳輸和儲存資料python有3種方法解析XML：SAX,DOM以及ElemenTree1、SAX（simple API for XML）python標準庫包含SAX解析器，SAX用事件

python之解析最簡單的xml

1、person.xm檔案如下 2、用xml.etree.ElementTree解析person.xml的實現 3、效果如下 4、總結 python裡面的list =

python XML文件解析：用ElementTree解析XML

eas 通過使用場景 exc try 開始利用快的直接 Python標準庫中，提供了ET的兩種實現。一個是純Python實現的xml.etree.ElementTree，另一個是速度更快的C語言實現xml.etree.cElementTree。請記住始終使用C語言實

筆記：XML-解析文檔-流機制解析器（SAX、StAX）

輸入 tex 字符數表示 getname 重要樹形 puts ron DOM 解析器完整的讀入XML文檔，然後將其轉換成一個樹型的數據結構，對於大多數應用，DOM 都運行很好，但是，如果文檔很大，並且處理算法又非常簡單，可以在運行時解析節點，而不必看到完整的樹形

XML 解析---dom解析和sax解析

靜態 open 轉換器 tno 抽象 imp 高速 default 內容眼下XML解析的方法主要用兩種： 1、dom解析：（Document Object Model。即文檔對象模型）是W3C組織推薦的解析XML的一種方式。使用dom解析XML文檔，該解析器會先

cocos2d-x 中XML解析與數據存儲

lba false 網上 unsigned failed popu new ccm cfile 一不小心就玩了一周的遊戲了。哎。玩的時候時間過得總是這麽快。。。於是今天決定看一下之前不怎麽非常熟悉的XML;（之前做遊戲時數據的儲存用到過XML，但這塊是還有一個同事在做

筆記：XML-解析文檔-DOM

nodevalue oot ktr 字體 itl rdo for 及其 on() 要處理XML文檔，就要先解析（parse）他，解析器時這樣一個程序，讀入一個文件，確認整個文件具有正確的格式，然後將其分解成各種元素，使得程序員能夠訪問這些元素，Java庫提供了兩種XML解析

Python--xml模塊

鍵值操作 qq在線狀態包含 asmx 進行 emp 元素 insert XML是實現不同語言或程序之間進行數據交換的協議,XML文件格式如下讀xml文件 <data> <country name="Liechtenstein">

XML解析

handler row odin remove sys 工具避免語法 sets Dom4j工具使用步驟： 1）導入dom4j的核心包。 dom4j-1.6.1.jar（點擊下載） 2）編寫Dom4j讀取xm

xml解析之----DOM解析

dom模型 web margin java dom ext des ins api DOM模型(documentobject model) ?DOM解析器在解析XML文檔時，會把文檔中的全部元素。依照其出現的層次關系。解析成一個個Node對象(節點)。 ?在

【java規則引擎】drools6.5.0版本中kmodule.xml解析

excel表格兩個狀態 excel表自定義 roo 暫時指定一次 kmodule.xml文件存放在src/main/resources/META-INF/文件夾下。 1 <?xml version="1.0" encoding="UTF-8"?>

Python 列表解析

pri logs python log python 列表 pytho append bsp clas 定義：快速形成列表的方式例：舊的生成方式：l=[] for i in range(10): if i >=5: l.append(‘e

Python XML

tor 交互寫敏感反序列化以及 log ext 文檔 target 2017-07-24 22:58:16 xml 和 json 都是數據交互的格式。想象一下，python中的字典數據要傳給java使用，但是眾所周知的是java中只有hashmap數據結構，並沒有字

Python XML解析

python對XML的解析

1.SAX (simple API for XML )

python使用SAX解析xml

ContentHandler類方法介紹

2.DOM(Document Object Model)

3.ElementTree

相關推薦