Java中XML的四種解析方式

阿新 • • 發佈：2018-12-24

XML是一種通用的資料交換格式,它的平臺無關性、語言無關性、系統無關性、給資料整合與互動帶來了極大的方便。XML在不同的語言環境中解析方式都是一樣的,只不過實現的語法不同而已。

　　XML的解析方式分為四種：1、DOM解析；2、SAX解析；3、JDOM解析；4、DOM4J解析。其中前兩種屬於基礎方法，是官方提供的平臺無關的解析方式；後兩種屬於擴充套件方法，它們是在基礎的方法上擴展出來的，只適用於java平臺。

　　針對以下XML檔案，會對四種方式進行詳細描述：

<?xml version="1.0" encoding="UTF-8"?>
<bookstore 
>
    <book id="1">
        <name>冰與火之歌</name>
        <author>喬治馬丁</author>
        <year>2014</year>
        <price>89</price>
    </book>
    <book id="2">
        <name>安徒生童話</name>
        <year>2004</year>
        <price 
>77</price>
        <language>English</language>
    </book>    
</bookstore>

1. DOM解析

DOM的全稱是Document Object Model，也即文件物件模型。在應用程式中，基於DOM的XML分析器將一個XML文件轉換成一個物件模型的集合（通常稱DOM樹），應用程式正是通過對這個物件模型的操作，來實現對XML文件資料的操作。通過DOM介面，應用程式可以在任何時候訪問XML文件中的任何一部分資料，因此，這種利用DOM介面的機制也被稱作隨機訪問機制。

　　DOM介面提供了一種通過分層物件模型來訪問XML文件資訊的方式，這些分層物件模型依據XML的文件結構形成了一棵節點樹。無論XML文件中所描述的是什麼型別的資訊，即便是製表資料、專案列表或一個文件，利用DOM所生成的模型都是節點樹的形式。也就是說，DOM強制使用樹模型來訪問XML文件中的資訊。由於XML本質上就是一種分層結構，所以這種描述方法是相當有效的。

　　DOM樹所提供的隨機訪問方式給應用程式的開發帶來了很大的靈活性，它可以任意地控制整個XML文件中的內容。然而，由於DOM分析器把整個XML文件轉化成DOM樹放在了記憶體中，因此，當文件比較大或者結構比較複雜時，對記憶體的需求就比較高。而且，對於結構複雜的樹的遍歷也是一項耗時的操作。所以，DOM分析器對機器效能的要求比較高，實現效率不十分理想。不過，由於DOM分析器所採用的樹結構的思想與XML文件的結構相吻合，同時鑑於隨機訪問所帶來的方便，因此，DOM分析器還是有很廣泛的使用價值的。

　　　　優點：

　　　　　　1、形成了樹結構，有助於更好的理解、掌握，且程式碼容易編寫。

　　　　　　2、解析過程中，樹結構儲存在記憶體中，方便修改。

　　　　缺點：

　　　　　　1、由於檔案是一次性讀取，所以對記憶體的耗費比較大。

　　　　　　2、如果XML檔案比較大，容易影響解析效能且可能會造成記憶體溢位。

　　以下是解析程式碼：

public class DOMTest {
    public static void main(String[] args) {
        //建立一個DocumentBuilderFactory的物件
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
        //建立一個DocumentBuilder的物件
        try {
            //建立DocumentBuilder物件
            DocumentBuilder db = dbf.newDocumentBuilder();
            //通過DocumentBuilder物件的parser方法載入books.xml檔案到當前專案下
            Document document = db.parse("books.xml");
            //獲取所有book節點的集合
            NodeList bookList = document.getElementsByTagName("book");
            //通過nodelist的getLength()方法可以獲取bookList的長度
            System.out.println("一共有" + bookList.getLength() + "本書");
            //遍歷每一個book節點
            for (int i = 0; i < bookList.getLength(); i++) {
                System.out.println("=================下面開始遍歷第" + (i + 1) + "本書的內容=================");
                //通過 item(i)方法 獲取一個book節點，nodelist的索引值從0開始
                Node book = bookList.item(i);
                //獲取book節點的所有屬性集合
                NamedNodeMap attrs = book.getAttributes();
                System.out.println("第 " + (i + 1) + "本書共有" + attrs.getLength() + "個屬性");
                //遍歷book的屬性
                for (int j = 0; j < attrs.getLength(); j++) {
                    //通過item(index)方法獲取book節點的某一個屬性
                    Node attr = attrs.item(j);
                    //獲取屬性名
                    System.out.print("屬性名：" + attr.getNodeName());
                    //獲取屬性值
                    System.out.println("--屬性值" + attr.getNodeValue());
                }
                //解析book節點的子節點
                NodeList childNodes = book.getChildNodes();
                //遍歷childNodes獲取每個節點的節點名和節點值
                System.out.println("第" + (i+1) + "本書共有" + 
                childNodes.getLength() + "個子節點");
                for (int k = 0; k < childNodes.getLength(); k++) {
                    //區分出text型別的node以及element型別的node
                    if (childNodes.item(k).getNodeType() == Node.ELEMENT_NODE) {
                        //獲取了element型別節點的節點名
                        System.out.print("第" + (k + 1) + "個節點的節點名：" 
                        + childNodes.item(k).getNodeName());
                        //獲取了element型別節點的節點值
                        System.out.println("--節點值是：" + childNodes.item(k).getFirstChild().getNodeValue());
                        //System.out.println("--節點值是：" + childNodes.item(k).getTextContent());
                    }
                }
                System.out.println("======================結束遍歷第" + (i + 1) + "本書的內容=================");
            }
        } catch (ParserConfigurationException e) {
            e.printStackTrace();
        } catch (SAXException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }        
    }
}

2. SAX解析

　　SAX的全稱是Simple APIs for XML，也即XML簡單應用程式介面。與DOM不同，SAX提供的訪問模式是一種順序模式，這是一種快速讀寫XML資料的方式。當使用SAX分析器對XML文件進行分析時，會觸發一系列事件，並激活相應的事件處理函式，應用程式通過這些事件處理函式實現對XML文件的訪問，因而SAX介面也被稱作事件驅動介面。

　　　　優點：

　　　　　　1、採用事件驅動模式，對記憶體耗費比較小。

　　　　　　2、適用於只處理XML檔案中的資料時。

　　　　缺點：

　　　　　　1、編碼比較麻煩。

　　　　　　2、很難同時訪問XML檔案中的多處不同資料。

　　以下是解析程式碼：
　　public class SAXTest {
/**
* @param args
*/
public static void main(String[] args) {
//錕斤拷取一錕斤拷SAXParserFactory錕斤拷實錕斤拷
SAXParserFactory factory = SAXParserFactory.newInstance();
//通錕斤拷factory錕斤拷取SAXParser實錕斤拷
try {
SAXParser parser = factory.newSAXParser();
//錕斤拷錕斤拷SAXParserHandler錕斤拷錕斤拷
SAXParserHandler handler = new SAXParserHandler();
parser.parse(“books.xml”, handler);
System.out.println(“~！~！~！共有” + handler.getBookList().size()
+ “本書”);
for (Book book : handler.getBookList()) {
System.out.println(book.getId());
System.out.println(book.getName());
System.out.println(book.getAuthor());
System.out.println(book.getYear());
System.out.println(book.getPrice());
System.out.println(book.getLanguage());
System.out.println(“—-finish—-“);
}
} catch (ParserConfigurationException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (SAXException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}

public class SAXParserHandler extends DefaultHandler {
String value = null;
Book book = null;
private ArrayList bookList = new ArrayList();
public ArrayList getBookList() {
return bookList;
}

int bookIndex = 0;
/**
 * 用來標識解析開始
 */
@Override
public void startDocument() throws SAXException {
    // TODO Auto-generated method stub
    super.startDocument();
    System.out.println("SAX解析開始");
}

/**
 * 用來標識解析結束
 */
@Override
public void endDocument() throws SAXException {
    // TODO Auto-generated method stub
    super.endDocument();
    System.out.println("SAX解析結束");
}

/**
 * 解析xml元素
 */
@Override
public void startElement(String uri, String localName, String qName,
        Attributes attributes) throws SAXException {
    //呼叫DefaultHandler類的startElement方法
    super.startElement(uri, localName, qName, attributes);
    if (qName.equals("book")) {
        bookIndex++;
        //建立一個book物件
        book = new Book();
        //開始解析book元素的屬性
        System.out.println("======================開始遍歷某一本書的內容=================");
        //不知道book元素下屬性的名稱以及個數，如何獲取屬性名以及屬性值
        int num = attributes.getLength();
        for(int i = 0; i < num; i++){
            System.out.print("book元素的第" + (i + 1) +  "個屬性名是："
                    + attributes.getQName(i));
            System.out.println("---屬性值是：" + attributes.getValue(i));
            if (attributes.getQName(i).equals("id")) {
                book.setId(attributes.getValue(i));
            }
        }
    }
    else if (!qName.equals("name") && !qName.equals("bookstore")) {
        System.out.print("節點名是：" + qName + "---");
    }
}

@Override
public void endElement(String uri, String localName, String qName)
        throws SAXException {
    //呼叫DefaultHandler類的endElement方法
    super.endElement(uri, localName, qName);
    //判斷是否針對一本書已經遍歷結束
    if (qName.equals("book")) {
        bookList.add(book);
        book = null;
        System.out.println("======================結束遍歷某一本書的內容=================");
    }
    else if (qName.equals("name")) {
        book.setName(value);
    }
    else if (qName.equals("author")) {
        book.setAuthor(value);
    }
    else if (qName.equals("year")) {
        book.setYear(value);
    }
    else if (qName.equals("price")) {
        book.setPrice(value);
    }
    else if (qName.equals("language")) {
        book.setLanguage(value);
    }
}

@Override
public void characters(char[] ch, int start, int length)
        throws SAXException {
    // TODO Auto-generated method stub
    super.characters(ch, start, length);
    value = new String(ch, start, length);
    if (!value.trim().equals("")) {
        System.out.println("節點值是：" + value);
    }
}

}

3. JDOM解析

　　　　特徵：

　　　　　　1、僅使用具體類，而不使用介面。

　　　　　　2、API大量使用了Collections類。

　　以下是解析程式碼：
　　

public class JDOMTest {
    private static ArrayList<Book> booksList = new ArrayList<Book>();
    /**
     * @param args
     */
    public static void main(String[] args) {
        // 進行對books.xml檔案的JDOM解析
        // 準備工作
        // 1.建立一個SAXBuilder的物件
        SAXBuilder saxBuilder = new SAXBuilder();
        InputStream in;
        try {
            // 2.建立一個輸入流，將xml檔案載入到輸入流中
            in = new FileInputStream("src/res/books.xml");
            InputStreamReader isr = new InputStreamReader(in, "UTF-8");
            // 3.通過saxBuilder的build方法，將輸入流載入到saxBuilder中
            Document document = saxBuilder.build(isr);
            // 4.通過document物件獲取xml檔案的根節點
            Element rootElement = document.getRootElement();
            // 5.獲取根節點下的子節點的List集合
            List<Element> bookList = rootElement.getChildren();
            // 繼續進行解析
            for (Element book : bookList) {
                Book bookEntity = new Book();
                System.out.println("======開始解析第" + (bookList.indexOf(book) + 1)
                        + "書======");
                // 解析book的屬性集合
                List<Attribute> attrList = book.getAttributes();
                // //知道節點下屬性名稱時，獲取節點值
                // book.getAttributeValue("id");
                // 遍歷attrList(針對不清楚book節點下屬性的名字及數量)
                for (Attribute attr : attrList) {
                    // 獲取屬性名
                    String attrName = attr.getName();
                    // 獲取屬性值
                    String attrValue = attr.getValue();
                    System.out.println("屬性名：" + attrName + "----屬性值："
                            + attrValue);
                    if (attrName.equals("id")) {
                        bookEntity.setId(attrValue);
                    }
                }
                // 對book節點的子節點的節點名以及節點值的遍歷
                List<Element> bookChilds = book.getChildren();
                for (Element child : bookChilds) {
                    System.out.println("節點名：" + child.getName() + "----節點值："
                            + child.getValue());
                    if (child.getName().equals("name")) {
                        bookEntity.setName(child.getValue());
                    }
                    else if (child.getName().equals("author")) {
                        bookEntity.setAuthor(child.getValue());
                    }
                    else if (child.getName().equals("year")) {
                        bookEntity.setYear(child.getValue());
                    }
                    else if (child.getName().equals("price")) {
                        bookEntity.setPrice(child.getValue());
                    }
                    else if (child.getName().equals("language")) {
                        bookEntity.setLanguage(child.getValue());
                    }
                }
                System.out.println("======結束解析第" + (bookList.indexOf(book) + 1)
                        + "書======");
                booksList.add(bookEntity);
                bookEntity = null;
                System.out.println(booksList.size());
                System.out.println(booksList.get(0).getId());
                System.out.println(booksList.get(0).getName());

            }
        } catch (FileNotFoundException e) {
            e.printStackTrace();
        } catch (JDOMException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

4. DOM4J解析

　　　特徵：

　　　　　　1、JDOM的一種智慧分支，它合併了許多超出基本XML文件表示的功能。

　　　　　　2、它使用介面和抽象基本類方法。

　　　　　　3、具有效能優異、靈活性好、功能強大和極端易用的特點。

　　　　　　4、是一個開放原始碼的檔案

　　以下是解析程式碼：
　　

public class DOM4JTest {
    private static ArrayList<Book> bookList = new ArrayList<Book>();
    /**
     * @param args
     */
    public static void main(String[] args) {
        // 解析books.xml檔案
        // 建立SAXReader的物件reader
        SAXReader reader = new SAXReader();
        try {
            // 通過reader物件的read方法載入books.xml檔案,獲取docuemnt物件。
            Document document = reader.read(new File("src/res/books.xml"));
            // 通過document物件獲取根節點bookstore
            Element bookStore = document.getRootElement();
            // 通過element物件的elementIterator方法獲取迭代器
            Iterator it = bookStore.elementIterator();
            // 遍歷迭代器，獲取根節點中的資訊（書籍）
            while (it.hasNext()) {
                System.out.println("=====開始遍歷某一本書=====");
                Element book = (Element) it.next();
                // 獲取book的屬性名以及 屬性值
                List<Attribute> bookAttrs = book.attributes();
                for (Attribute attr : bookAttrs) {
                    System.out.println("屬性名：" + attr.getName() + "--屬性值："
                            + attr.getValue());
                }
                Iterator itt = book.elementIterator();
                while (itt.hasNext()) {
                    Element bookChild = (Element) itt.next();
                    System.out.println("節點名：" + bookChild.getName() + "--節點值：" + bookChild.getStringValue());
                }
                System.out.println("=====結束遍歷某一本書=====");
            }
        } catch (DocumentException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
    }
}

總結

DOM4J效能最好，連Sun的JAXM也在用DOM4J。目前許多開源專案中大量採用DOM4J，例如大名鼎鼎的Hibernate也用DOM4J來讀取XML配置檔案。如果不考慮可移植性，那就採用DOM4J。

JDOM和DOM在效能測試時表現不佳，在測試10M文件時記憶體溢位。在小文件情況下還值得考慮使用DOM和JDOM。雖然JDOM的開發者已經說明他們期望在正式發行版前專注效能問題，但是從效能觀點來看，它確實沒有值得推薦之處。另外，DOM仍是一個非常好的選擇。DOM實現廣泛應用於多種程式語言。它還是許多其它與XML相關的標準的基礎，因為它正式獲得W3C推薦（與基於非標準的Java模型相對），所以在某些型別的專案中可能也需要它（如在JavaScript中使用DOM）。

SAX表現較好，這要依賴於它特定的解析方式－事件驅動。一個SAX檢測即將到來的XML流，但並沒有載入到記憶體（當然當XML流被讀入時，會有部分文件暫時隱藏在記憶體中）。

Java中XML的四種解析方式

1. DOM解析

2. SAX解析

3. JDOM解析

4. DOM4J解析

總結

Java中的四種引用方式的區別

XML四種解析方式優缺點對比

XML解析——Java中XML的四種解析方式（轉載 by 龍清揚）

Java中XML的四種解析方式

XML解析——Java中XML的四種解析方式

Java中對xml檔案的四種解析方式

java對於xml檔案的四種解析方式

XML的四種解析方式

xml的常見四種解析方式

四種解析方式解析速度分析

Java中的四種引用

Java中的七種排序方式代碼示例

xml兩種解析方式（封裝了獲得文件和回寫）

java陣列的四種拷貝方式

java程式設計入門2 java中的四種訪問許可權控制

Java 中的四種引用使用場景分析

Java中的四種引用型別（強、軟、弱、虛）

(Four references in java)java中的四種引用

淺析Java中的四種執行緒池

Java中的四種引用以及ReferenceQueue和WeakHashMap的使用示例

Java中XML的四種解析方式

1. DOM解析

2. SAX解析

3. JDOM解析

4. DOM4J解析

總結

相關推薦