1. 程式人生 > >Dom4j解析XML基本操作

Dom4j解析XML基本操作

.org oot 進行 元素 ray ext2 single util ati

Dom4j 是一個易用的、開源的庫,用於 XML , XPath 和 XSLT 。它應用於 Java 平臺,采用了 Java 集合框架並完全支持 DOM , SAX 和 JAXP 。 要使用dom4j讀寫XML文檔,需要先下載dom4j包 dom4j官方網站在 http://www.dom4j.org/ 下載dom4j-1.6.1.zip 解開後有兩個包,僅操作XML文檔的話把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的話還需要加入包jaxen-1.1-beta-7.jar 類開頭引入: import org.dom4j.io.SAXReader;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.Node;
import java.util.Iterator;
import java.util.List;
import java.io.*; 以下是相關操作: 一.Document對象相關
1.讀取XML文件,獲得document對象.
SAXReader reader = new SAXReader();
Document document = reader.read(new File("input.xml")); 2.解析XML形式的文本,得到document對象.
String text = "<members></members>";
Document document = DocumentHelper.parseText(text);
3.主動創建document對象.
Document document = DocumentHelper.createDocument();
Element root = document.addElement("members");// 創建根節點
二.節點相關
1.獲取文檔的根節點.
Element rootElm = document.getRootElement(); 2.取得某節點的單個子節點.
Element memberElm=root.element("member");// "member"是節點名 3.取得節點的文字
String text=memberElm.getText();
也可以用:
String text=root.elementText("name");這個是取得根節點下的name字節點的文字. 4.取得某節點下名為"member"的所有字節點並進行遍歷.
List nodes = rootElm.elements("member"); for (Iterator it = nodes.iterator(); it.hasNext();) {
Element elm = (Element) it.next();
// do something
} 5.對某節點下的所有子節點進行遍歷.
for(Iterator it=root.elementIterator();it.hasNext();){
Element element = (Element) it.next();
// do something
} 6.在某節點下添加子節點.
Element ageElm = newMemberElm.addElement("age"); 7.設置節點文字.
ageElm.setText("29"); 8.刪除某節點.
parentElm.remove(childElm);// childElm是待刪除的節點,parentElm是其父節點 獲取一個Element之後可以進行的相關操作:
attributue(String name) :獲取元素String值。 elementIterator() :返回元素的所有子元素的Iterator叠代器。 elements() :返回元素包含所有子元素List。 getParent() :獲取父元素Element。 getPath() :獲取自己的xpath。 detach() :移除自己。 getName() :獲取節點的名稱。 selectNodes(String xpathExpression) :通過XPATH獲取節點。 selectSingleNode(String xpathExpression) :通過XPATH獲取一個節點。 getDocument() :作為一個Document返回。 /**
* 遞歸解析全部子節點
*
* @param elem
* @return
*/
private List<FieldMetaVo> getChildNodes(Element elem, FieldMetaVo fieldMetaVo) {
List<FieldMetaVo> FieldMetas = Lists.newArrayList();
log.debug("當前節點名稱 {}", elem.getName());// 當前節點名稱
log.debug("當前節點的內容{}", elem.getTextTrim());// 當前節點名稱
List<Attribute> listAttr = elem.attributes();// 當前節點的所有屬性的list
for (Attribute attr : listAttr) {// 遍歷當前節點的所有屬性
String name = attr.getName();// 屬性名稱
String value = attr.getValue();// 屬性的值
log.debug("屬性名稱 {}", name);// 當前節點名稱
log.debug("屬性值 {}", value);// 當前節點名稱
FieldMetas.add(fieldMetaVo);
}

// 遞歸遍歷當前節點所有的子節點
List<Element> listElement = elem.elements();// 所有一級子節點的list
for (Element e : listElement) {// 遍歷所有一級子節點
getChildNodes(e, fieldMetaVo);// 遞歸
}

return FieldMetas;
}
三.屬性相關
1.取得某節點下的某屬性
Element root=document.getRootElement();
Attribute attribute=root.attribute("size");// 屬性名name
2.取得屬性的文字
String text=attribute.getText();
也可以用:
String text2=root.element("name").attributue("firstname");這個是取得根節點下name字節點的屬性firstname的值. 3.遍歷某節點的所有屬性
Element root=document.getRootElement();
for(Iterator it=root.attributeIterator();it.hasNext();){
Attribute attribute = (Attribute) it.next();
String text=attribute.getText();
System.out.println(text);
}
4.設置某節點的屬性和文字.
newMemberElm.addAttribute("name", "sitinspring");
5.設置屬性的文字
Attribute attribute=root.attribute("name");
attribute.setText("sitinspring");
6.刪除某屬性
Attribute attribute=root.attribute("size");// 屬性名name
root.remove(attribute);
四.將文檔寫入XML文件
1.文檔中全為英文,不設置編碼,直接寫入的形式.
XMLWriter writer = new XMLWriter(new FileWriter("output.xml"));
writer.write(document);
writer.close();
2.文檔中含有中文,設置編碼格式寫入的形式.
OutputFormat format = OutputFormat.createPrettyPrint();
format.setEncoding("GBK"); // 指定XML編碼
XMLWriter writer = new XMLWriter(new FileWriter("output.xml"),format);

writer.write(document);
writer.close();
五.字符串與XML的轉換
1.將字符串轉化為XML
String text = "<members> <member>sitinspring</member> </members>";
Document document = DocumentHelper.parseText(text);
2.將文檔或節點的XML轉化為字符串.
SAXReader reader = new SAXReader();
Document document = reader.read(new File("input.xml"));
Element root=document.getRootElement();
String docXmlText=document.asXML();
String rootXmlText=root.asXML();
Element memberElm=root.element("member");
String memberXmlText=memberElm.asXML();
六.使用XPath快速找到節點
讀取的XML文檔示例
<?xml version="1.0" encoding="UTF-8"?>
<projectDescription>
<name>MemberManagement</name>
<comment></comment>
<projects>
<project>PRJ1</project>
<project>PRJ2</project>
<project>PRJ3</project>
<project>PRJ4</project>
</projects>
<buildSpec>
<buildCommand>
<name>org.eclipse.jdt.core.javabuilder</name>
<arguments>
</arguments>
</buildCommand>
</buildSpec>
<natures>
<nature>org.eclipse.jdt.core.javanature</nature>
</natures>
</projectDescription> 使用XPath快速找到節點project.
public static void main(String[] args){
SAXReader reader = new SAXReader();

try{
Document doc = reader.read(new File("sample.xml"));
List projects=doc.selectNodes("/projectDescription/projects/project");
Iterator it=projects.iterator();
while(it.hasNext()){
Element elm=(Element)it.next();
System.out.println(elm.getText());
}

}
catch(Exception ex){
ex.printStackTrace();
}
}

Dom4j解析XML基本操作